문항1. 데이터 분석과 빅데이터 분석의 차이점에 4가지에 대해서 설명하시오. (48점) * 데이터 분석은 데이터를 검사, 정리, 변형 및 모델링하는 프로세스입니다. 빅 데이터는 많은 양의 복잡한 데이터로 기존의 데이터 처리 응용 프로그램 소프트웨어를 사용하여 처리하기가 어렵습니다. * 데이터 분석의 사용은 결론을 내리고 결정을 내리고 중요한 비즈니스 통찰력을 얻는 것입니다. 빅 데이터의 사용은 시스템 병목 현상, 대규모 데이터 처리 시스템 및 확장 성이 뛰어난 분산 시스템을 식별하는 것입니다. * 데이터 분석은 데이터 분석가가 처리합니다. 빅 데이터는 빅 데이터 전문가가 처리합니다. * 데이터 분석의 애널리스트는 프로그래밍, 통계 및 수학에 대한 지식이 있어야합니다. 빅 데이터 분석의 애널리스트는 프로그래밍, NoSQL 데이터베이스, Hadoop과 같은 분산 시스템 및 프레임 워크에 대한 지식이 필요합니다. 문항2. 데이터 전처리 기술 3가지가 무엇인지 명칭을 작성하고, 그 개념에 대해 설명하시오.(필요시, 사용되는 세부적인 기술을 설명하시오.) (52점) * 데이터 변환 : 다양한 형식으로 수집된 데이터를 분석에 용이하도록 일관성 있는 형식으로 변환합니다. 데이터 추세에 벗어나는 갓을 변화하고(Smoothing), 데이터를 요약하고(Aggregation), 특정 구간 분포값으로 스케일을 변화하고(Generalization), 통계적 기법으로 정규화하고(Normalization), 여러 데이터 분포를 대표할 수 있는 새로운 속성/특징을 생성하는(Attribute/feature construction) 기술을 활용합니다. * 데이터 필터링 : 데이터 중목성, 오류 제거들을 위한 데이터 필터링 기준을 최적화하여 활용합니다. 이를 통해 분석시간을 단추갛고 저장 공간의 효율적 활용이 가능합니다. * 데이터 정제 : 수집된 데이터의 불일치성을 교정하기 위해 결측치(Missing Value) 처리, 이상치/잡음(Noise) 처리 기술을 활용하여, 해당 데이터를 무시하거나, 통계값/추정치 데이터를 채우거나, 전문가의 수작업을 통해 적절한 값으로 수정합니다.