빅데이터란 대규모, 빠른 생성 속도, 다양한 형태라는 특징을 가진, 기존의 정보 관리 기술로는 저장/관리/분석하기 어려울 정도의 큰 규모의 정형 또는 비정형 데이터를 의미한다. 또한 그러한 데이터를 저장/관리/분석하는 기술도 빅데이터라는 개념에 포괄된다. 빅데이터 현상은 기업들의 고객 데이터 수집 활동 및 멀티미디어 콘텐츠의 폭발적 증가와 스마트폰 보급, SNS 활성화 및 사물 통신망의 저변 확대로 빠르게 확산되고 있다. -데이터 시각화- 데이터 시각화란 추상적인 정보를 인간이 효과적으로 인지, 이해할 수 있도록 시각화하는 것이다. 이해하기 어려운 복잡하고 추상적인 데이터도 적절한 시각화를 통하면 쉽게 이해할 수 있으며, 그로부터 새로운 영감과 통찰을 발견할 수 있다. 또한 데이터 시각화를 통해 데이터 분석 결과 및 정보를 타인과 쉽게 공유할 수 있다. 클러스터 vs 클라우드? 빅데이터를 분석하는 데에는 많은 컴퓨팅 자원과 시간이 소요되기 때문에, 하나의 단일 서버에서 처리하기보다는 클러스터상에서 분산하여 처리하는 것이 일반적이다. 클러스터 환경을 구축하는 방식에는 하둡과 같은 분산처리 프레임워크 방식이 있다. 하둡은 구글의 맵리듀스와 구글 파일 시스템으로 구성된 분산 처리 프레임워크이다.