본문 바로가기
IT 컴퓨터상식

빅데이터 종류 및 분류

by 변화마스터 2020. 8. 27.
반응형

인터넷의 데이터 종류에는 정말 다양한 데이터가 있는데 빅데이터에서 분류하는 데이터는 전자상거래에서 발생하는  소비자의 구매 데이터, 구글, 네이버 등의 검색 포털  사이트에서 발생하는 검색 데이터, 소셜 네트워크에서 발생하는 다양한 소셜 데이터 등이 있습니다.

이 밖에도 개인과 그룹이 가지는 관심성 데이터, 그 밖에 위치데이터와 콘텐츠 데이터, 와일드 카드 데이터 등으로 크게 분류할 수 있습니다.

구매데이터

이 데이터는 본질적으로 무엇을 산 사람에 대한 정보입니다.

구매하지 않았더라도 구매 단계에서 벌어지는 다양한 소비자 구매행동도 로그로 남기 때문에 장바구니와 같은 쇼핑카트, 클릭, 이동 등의 다양한 정보가 포함되고 있습니다.

검색데이터

검색 질의의 키워드를 기반으로 한 쿼리 데이터와 검색하고자하는 의도의 원본 데이터베이스입니다.

검색 과정에서 원하는 여러 데이터를 찾고 확인하는 행위 등이 이에 해당합니다.

소셜데이터

소셜 기반의 관계 형성 그래프 뿐만 아니라, 개개인의 신원데이터입니다.

또한 사람들이 관계 안에서 상호작용하는 방식과 모든 행동을 의미하며 최근에는 이런 데이터가 액티비티 피드 형태로 저장되고 공유되고 있습니다.

관심데이터

이것은 일반적으로 사용자와 그룹이 특정 데이터나 콘텐츠에 보이는 관심의 표시라고 할 수 있습니다.

관심 데이터는 콘텐츠와 관련된 사람들이 어떻다고  선언하는 관심을 표현하는 것이고 이를 통해 다른 사람과 공유하는 정보와 기회를 제공합니다.

위치데이터

사람과 특정 장소에 관한 위치 데이터뿐만 아니라 얼마나 자주 그 위치에 방문했는지에 관한 데이터와 기타 연관 데이터입니다.

위치 기반의 상호 연계와 다양한 서비스들이 제공될 수 있는 기반 데이터입니다.

POI정보는 관심데이터와 위치데이터의 두 가지 속성을 모두 가집니다.

콘텐츠 데이터

콘텐츠데이터는 일반적인 텍스트에서 최근에선 동영상 이미지 등과 같은 멀티미디어, 전자책, 게임 등과 같이 계속해서 진화하고 있습니다.

콘텐츠 사업자가 제공하는 콘텐츠와 관련된 다양한 데이터가 이에 해당합니다.

와일드 카드데이터

데이터로 분류되지 않는 데이터로서 큰 영향을 미치는 데이터를 의미합니다.

예를 들어 마이크로소프트는 응용프로그램이나 OS와 소비자가 상호작용하는 방식을 알고 있는데 운영 체계 업데이트나 어떤 문제가 발생할 때 전송하여 로그를 분석하고 데이터를 통해 문제를 해결합니다.

글로벌 언어서비스를 하는 구글이 웹을 통해 데이터를 집계하고 분석하여 더 정확한 번역 서비스를 하기 위해 노력하는 것과 같습니다.

반응형