문항1 가장 먼저 분석 대상에 차이가 있습니다. 단순히 정형과 비정형을 구분하는 문제가 아닙니다. 현재의 데이터 분석 대상은 규격에 맞춰 정리된 데이터만이 아닙니다. 이는 곧바로 대상 간의 상관관계나 연관성의 차이로 이어집니다. 통계 분석에서는 대상이나 표본자료 간의 관계가 성립되거나 유사한 대상을 기준으로 하지만, 데이터 분석은 전혀 어울릴 것 같지 않는 대상 간에도 관계를 도출하고 연관성을 찾을 수 있습니다. 다음으로 복잡성의 차이를 들 수 있습니다. 통계 분석은 정교한 분석 기법을 실행해 그 가치의 정확성을 높이는 데 치중하지만, 빅데이터 분석은 정확성은 물론 다양한 기법을 결합해 전혀 예상치 못한 결과를 도출하는 것에도 큰 의미를 부여합니다. 또 하나의 차이는 융합적convergence 성격입니다. 빅데이터 분석은 단순히 통계적 분석 기법만을 요구하지 않습니다. 다양한 분야의 지식과 컴퓨팅 기술, 여기에 적절한 알고리즘 능력과 인문학적 이해 같은 다양한 학문과 기술을 요구하죠. 마지막으로 데이터 분석은 판단 후 의사결정이 이루어지면 곧바로 실행에 옮겨진다는 점입니다. 대표적인 게 인공지능입니다. 이전의 통계 분석을 중심으로 한 데이터 분석은 분석 결과를 해석하고 도출된 가치를 판단해 의사결정을 수행하는 반면, 빅데이터 시대의 데이터 분석은 분석 자체가 곧 의사결정이 되고 실행됩니다. 문항2 1. 데이터유형변환 - 데이터유형을변환하거나데이터분석에용이한형태로변환 2. 데이터여과(Filtering) - 오류발견, 보정, 삭제및중복성확인등데이터품질향상 3. 데이터정제(Cleansing) - 결측치변환, 이상치제거, 노이즈데이터교정, 비정형데이터를수집할때반드시수행