빅 데이터를 형태별로 분류를 해보면 정형 데이터(Structured Data), 반정형 데이터(Semi-structured Data), 비정형 데이터(Unstructured Data) 3가지로 구분할 수 있다. 정형 데이터는 고정형 필드에 저장된 데이터다. 예를 들어 관계형 데어터베이스, 스프레드시트 등이 해당된다. 반정형 데이터는 고정된 필드에 저장되어 있지는 않지만, 메타데이터나 스키마 등을 포함하는 데이터이다. 예를 들어 XML, HTML 텍스트, JSON 등이다. 비정형 데이터는 고정된 필드에 저장되어 있지 않은 데이터이다. 예를 들면, 텍스트 분석이 가능한 텍스트 문서, 이미지, 동영상, 음성데이터, GPS 위치 정보 등이 해당된다.