Contents

DW와 Data Lake에 대하여

   Jun 15, 2024     0 min read

DW와 Data Lake에 대하여 알아본 글입니다.

안녕하세요!

오늘은 DW와 Data Lake에 대해 알아보겠습니다.

물리적으로나 논리적으로 통합된 데이터를 저장하고 관리하는 데이터베이스의 활용은 기업의 의사결정 및 비즈니스 인텔리전스에 매우 중요한 역할을 합니다.

여기서 데이터 웨어하우스(DW)와 데이터 레이크(Data Lake)에 대해 알아보겠습니다.

데이터 레이크 (Data Lake)

데이터 레이크는 기업 내외부의 모든 종류의 데이터를 저장하는 중앙 저장소로, 정형, 반정형, 비정형 데이터를 모두 수용할 수 있습니다.

데이터의 원천 형태를 그대로 보존하여 저장하며, 스키마 없이 데이터를 적재하고, 필요 시에 스키마를 적용하여 분석하거나 활용할 수 있습니다.

주로 대규모의 다양한 데이터를 저장하고, 빅데이터 분석, 머신러닝, IoT 데이터 수집, 데이터 과학 등에 활용됩니다.

데이터의 다양성, 유연성, 확장성을 중시하며, 비정형 데이터나 실시간 데이터 분석 등에 적합한 특징을 가지고 있습니다.

마치며

이상으로 DW와 DL에 대해 간략히 살펴보았습니다.

데이터 웨어하우스는 정형 데이터를 중심으로 안정적이고 일관된 분석을 지원하는 데 활용되며, 데이터 레이크는 다양한 종류의 데이터를 수용하여 유연한 분석과 활용을 지원하는 데 활용됩니다.

두 가지 데이터 저장소는 기업의 데이터 관리와 활용을 위해 상호 보완적으로 사용되고 있습니다.

감사합니다!