문항 1. 답변. 데이터 분석과 빅데이터 분석의 차이점은 첫번째, 데이터의 확장입니다. 데이터 분석은 조직 내부의 데이터 분석을 중심으로 이루어졌다면, 빅데이터 분석은 웹 상, SNS상의 외부 데이터까지 활용합니다. 두번째, 데이터의 다양화입니다. 데이터 분석은 정형 데이터 분석 중심으로 이루어졌지만, 빅데이터 분석은 사진, 동영상, 텍스트 모두 포함하여 비정형 데이터까지 활용한다는 점에서 차이가 있습니다. 세번째, 데이터의 대규모화입니다. 데이터 분석에 비해서 빅데이터 분석은 분석 대상 데이터의 규모에 큰 차이가 있습니다. 4 통계적 목적뿐 아니라 분석목적까지 가능 문항 2. 데이터 정제 - 결측값 처리 - 이상값 처리 - 분석변수처리 데이터 정제는 결측값을 채우거나 이상값을 제거하는 과정을 통해 데이터의 신뢰도를 높이는 작업 변환 파싱 보강 데이터 결측값 처리 입력이 누락된 값을 식별하고 처리 단순 대치법 이상값 처리 데이터 이상값은 관측된 데이터의 범위에서 많이 벗어난 아주 작은 값이나 아주 큰값을 의미 통계 기법 이용