*빅데이터의 분류 1.정형 데이터 고정된 필드에 저장된 데이터를 말하며 관계형 데이터베이스와 스프레드시트 등을 예로 들 수 있다. 정형 데이터의 경우는 데이터베이스를 설계한 기술자의 의해 수집되는 정보의 형태가 정해지게 된다. 한정된 정보들 속에서 고객의 정보와 상품 분석, 인기 품목에 대한 정보를 분석할 수 있다. 2. 반정형 데이터 고정된 필드에 저장된 데이터는 아니지만 XML, HTML 텍스트등 메타데이터 및 스키마를 포함하는 데이터이다. 태그나 기타 마커가 포함되어 있어서 시맨틱 요소를 구분하고 데이터 내의 레코드와 필드 계층을 강제한다. 반정형 데이터에서 동일 클래스에 속해있는 엔티티는 함께 그룹되어 있더라도 각기 다른 특성을 지닐 수 있으며, 특성의 순서가 중요하지 않다. 반정형 데이터는 인터넷이 등장한 뒤로 증가 추세이며, 여기서 전문 및 데이터베이스는 더 이상 유일한 데이터의 형태가 아니며 개별 애플리케이션들은 정보 교환을 위한 매개체가 필요하다. 객체 지향 데이터베이스에서 반정형 데이터를 종종 볼 수 있다. 3. 비정형 데이터 고정돈 필드에 저장되어 있지 않은 데이터를 의미하며 페이스북과 트위터, 유튜브 영상, 이미지 파일, 음원파일, 워드문서, PDF 문서등을 예로 들 수 있다. 비정형 데이터의 경우는 페이스북, 트위터, 네이버, 다음 등에서 생성되는 실시간 정보들을 통해서 더 많은 정보들을 수집하고 분석할 수 있다. 예를 들면 특정 지역의 날씨 정보, 유동 인구의 수, 이들의 판매 정보 등을 수집할 수 있다. 형태가 정해지지 않는 정보속에서 분석방향에 따라 다양한 정보를 수집할 수 있는 것이다.