정형 데이터(Structured Data) 고정된 필드에 데이터을 말한다. 예를들면 데이터베이스, 스프레드시트 한정된 정보들 속에서 정보와 상품분석 인기품목에 대한 정보를 분석한다. 반정형 데이터(Semi-structured Data) 고정된 필드에 저장된 데이터는 아니며 XML,HTML, 텍스트, 메타데이터, 스키마등이 포함된 데이터이다. 비정형 데이터(Unstructured Data) 고정된 필드에 저장되어 있지 않은 데이터를 의미하며 페이스북 트위터, 유튜브, 이미지, 워드 , PDF 등이 있으며, 여러사이트에서 생성되는 실시간 정보들을 통해서 더 많은 정보들을 수집하고 분석한다. 예를 들어 날씨, 유동인구, 판매정보등을 수집할 수 있다. 형태가 정해지지 않은 정보속에서 분석 방향에 따라 다양한 정보를 수집할 수 있는 것이다.