본문 바로가기
지식

빅데이터 뜻 및 특징(volume, velocity, variety)

by 변화마스터 2021. 1. 31.
반응형

최근 빅데이터라는 이야기는 이제 상식으로 인식될만큼 흔한 내용이 된 것 같습니다.

하지만 빅데이터가 무엇이냐고 물어보면 대충은 설명할 수 있어도 정확한 기준을 들어서 설명하기는 힘들 것 같습니다.

일단 일반적으로 빅데이터뜻은 일반 컴퓨터로는 취급하기 어려울 정도로 많은 데이터를 말합니다.

하지만 최근은 일반컴퓨터라고 하더라도 성능이 매우 좋아져서 여기서 일반 컴퓨터라고 하는 것은 일반적으로 사용하는 엑셀과 같은 프로그램으로 분석하기가 어려운 데이터라고 표현하는 것이 더 맞을 것 같습니다.

물론 엑셀도 요새는 다룰 수 있는 용량이 많이 늘어나기는 했지만 몇백만건이 넘는 데이터를 다루기에는 분명 한계가 있습니다.

이럴 경우 빅데이터는 빅데이터를 관리하는 다른 프로그램을 사용하고 SQL로 불리는 명령어를 통해 제어하게 되는데 요새는 빅데이터를 다룰 수 있는지를 확인하기 위해서 SQL등을 다룰 수 있는지를 물어보는 것 같습니다.

따라서 빅데이터에 대한 분석을 위해서 SQL을 배우는  사람이 많아진 것 같습니다.

 

 

빅데이터의 특징은 3v라고도 하여 volume, velocity, variety의 특징을 얘기합니다.

volume은 데이터의 양을 의미하고 velocity는 데이터처리 속도, 그리고 variety는 데이터의 다양성을 의미합니다.

예전에는 정형화될 수 있는 데이터만 데이터로의 의미가 있어졌지만 최근은 다양한 사진과 동영상 역시 데이터화할 수 있는 기술이 발전함에 따라서 그 구분이 없어지고 있습니다.

즉 지금까지는 사람이 수집, 작성하는 데이터가 중심이었지만 센서와 카메라 등의 기기가 정보를 수집함으로써 압도적으로 많은 데이터를 취급할 수 있게 되었습니다.

 

이렇게 수집한 데이터를 인공지능을 통한 딥러닝 시스템으로 정보화하려는 시도가 매우 활발하게 일어나고 있고 최근 방영한 스타트업이라는 드라마에서도 이러한 내용이 담겨져 있었습니다.

데이터처리 속도는 이렇게 다양하게 변하고 또한 사진과 동영상은 이를 데이터화하기 위해서 엄청난 연산이 필요한데 이를 위한 데이터처리 속도가 빅데이터 발전에 매우 중요한 요소임을 의미합니다.

예전에는 너무 많은 데이터는 처리할 수 없어서 사장되었지만 이제 발달된 연산처리 속도로 인해 빅데이터로 변환되고 있습니다.

다양성은 데이터베이스에 저장되어 있는 데이터는 정형화되어 있어 다루기 쉽지만 빅데이터로 취급하는 것은 문자뿐 아니라 음성이나 영상 등 다양하다는 빅데이터의 특징을 나타냅니다.

반응형