1. 데이터 분석과 빅데이터 분석의 차이점에 4가지에 대해 설명하시오 1) 데이터 수집 단계 : 여러가지 데이터를 인식하여 필요한 데이터를 수집하는 단계 2) 데이터 저장과 처리 : 대용량의 정형, 비정형 데이터를 데이터 분석 및 활용을 위해 저장, 처리하는 단계 3) 데이터 분석과 시각화 : - 통계분석을 이용하여 다양한 형태의 데이터로부터 관계, 패턴 등 알려지지 않은 정보와 지식을 찾아내는 과정 - 데이터 분석 결과를 쉽게 알아볼수 있도록 분포 시각화, 그래픽 등 시각적인 수단으로 정보를 전달하는 과정 4) 보안관리 2. 데이터 전처리 기술 3가지가 무엇인지 명칭을 작성하고, 그 개념에 대해 설명하시오 (1) 데이터 필터링 필터링이란 데이타가 잘못된 것을 발견 후 보정, 삭제, 중복성 검사 등을 하는 것을 말함 실제 작업시에는 기존에 정의된 기준에 의거, 무엇이 잘못 되었는지에 대한 내용을 기록하여야 한다 (2) 데이터 변환 일반적인지 않은 상황에 따른 변수를 정해진 규칙에 따라 변환하는 것을 말함 데이터 변환 기술은 하기와 같다 - 평활화 : 데이터로부터 잡음제거를 위해 데이터 추세에 벗어나는 값들을 변환 - 집계 : 다양한 차원의 방법으로 데이터를 요약 - 정규화 : 데이터를 정해진 구간 내에 들아가도록 하는 것을 말함 - 일반화 : 특정 구간에 분포하는 값으로 스케일을 변화시키는 기법 => 안정화 - 속성 생성 : 데이터 통합을 위해 새로운 규칙, 속성이나 특징을 만드는 기법 => 변경 처리 (3) 데이터 정제 데이터 정제란 수집된 데이터의 불일치성을 교정하기 위한 것을 말함 데이터 정제 기술에는 결측치의 처리와 잡음 처리 2가지가 있음