데이터레이크(Data Lake)

[기술용어] 데이터레이크(Data Lake)

1668

[방송기술저널] 데이터레이크(Data Lake)는 데이터가 분석이나 마이닝에 필요할 때까지 모든 유형의 데이터를 보관할 수 있는 대규모 스토리지 저장소다. 대용량 데이터를 억지로 통합해 단일 형식으로 만드는 것이 아니라 원래 그대로의 형식으로 저장했다가 나중에 분석할 수 있는 것이 특징이다. 기존 데이터베이스는 데이터 간 연관 관계를 찾기 위해 같은 형식으로 변환해야 하나 데이터레이크는 데이터를 수집한 뒤 필요할 때마다 조합해 분석할 수 있어 형식 변환에 드는 많은 시간과 비용을 절약할 수 있다.

지난해 말 포레스터리서치 보고서에 따르면 세계 주요 기업 70%는 2018년에 빅데이터 재설계와 AI 기반 시스템을 구현할 전망이며, 33%는 데이터레이크가 기업 생존에 중요한 역할을 할 것이라 예측했다. 빅데이터의 중요도가 증가하는 만큼 데이터를 활용 도구로써 데이터레이크의 가치 역시 더 크게 인정받을 것으로 보인다.