문항1. 데이터 분석과 빅데이터 분석의 차이점에 4가지에 대해서 설명하시오. (48점) 1. 사후처리의 역할에 대한 중요성이 상대적으로 증가하게 됨. 2. 유의미한 시간에 대규모 전수 데이터의 정제/분석함으로써 패턴과 같은 정보를 제공받는다. 표본조사보다 전후조사의 중요성이 커짐. 3. 데이터의 양이 증가함에 따라 사소한 몇몇 오류는 분석 결과에 큰 영향을 미치지 않게 됨. 또한 분석할 수 있는 데이터가 많을 수록 결과의 정확성이 증가하게 됨 4. 인과관계보다도 상관관계의 파악이 상대적으로 더 중요해짐. 빠르고 저렴한 비용으로 상관관계 파악이 가능해짐. 문항2. 데이터 전처리 기술 3가지가 무엇인지 명칭을 작성하고, 그 개념에 대해 설명하시오.(필요시, 사용되는 세부적인 기술을 설명하시오.) (52점) 1. 데이터 필터링 : 오류 발견, 보정, 삭제 및 중복성 확인 등의 과정을 통해 데이터 품질을 향상 시키는 기술 2. 데이터 변환 : 데이터 유형 변환 등 데이터 분석이 용이한 형태로 변환하는 기술 3. 데이터 정제 : - 이상치를 식별 또는 제거하고, 잡음 섞인 데이터를 교정하여 데이터의 불일치성을 교정하는 기술 - 일반적으로 데이터는 불완전하고, 잡음이 섞여있고, 일관성이 없기 때문에 데이터 정제가 필요