본문 바로가기
IT 컴퓨터상식

빅데이터 구조화 정도에 따른 분류

by 변화마스터 2020. 8. 16.
반응형

빅데이터는 구조화 정도에 따라 다음과 같이 분류할 수 있습니다.

구조화 데이터

관계형 데이터베이스에서 형식이 정규화되어 있고 데이터 스키마가 지원됩니다.

구조화된 데이터는 데이터간에 연계성을 바탕으로 다양한 데이터 조합을 만들어서 데이터정렬과 분석을 쉽고 빠르게 할 수 있다는 것이 장점입니다.

반구조화 데이터

다소 정형화된 파일이 데이터 속성인 메타데이터를 가지며 자체적으로 데이터에 관한 서술이 가능한 형태나 데이터베이스 형태는 아니지만 XML 형태로 서술되고 구조화되어 있는 데이터입니다.

준구조화 데이터

일관성이 없는 데이터의 형식을 갖는 것으로 일반적으로 웹사이트에서 사용자에 의해 발생하는 클릭스트림 데이터가 이에 해당합니다.

클릭 스트림 데이터는 웹사이트에서 발생하는 사용자의 다양한 경험데이터입니다.

비구조화 데이터

일반 텍스트 기반의 데이터로 분석이 가능한 데이터입니다.

텍스트화되지 않은 데이터로는 이미지 파일과 동영상과 같은 멀티미디어 데이터가 있습니다.

앞으로 기술이 더 발전함에 따라 기존에는 준구조화, 비구조화, 반구조화였던 데이터들이 점차 구조화되어 더 많은 가공과 정렬이 가능해질 것으로 생각됩니다.

반응형