문항 1. 데이터 분석과 빅데이터 분석의 차이점에 4가지에 대해서 설명하시오. 답변 1. 사전처리와 사후처리 정보관리시스템을 이용해 데이터분석을 수행하기 위해서 데이터에 대해서 사전처리가 필요했습니다. 여기서 사전처리란 필요한 정보만 추려내고 필요 없는 정보는 제거해서 데이터를 축소하는 것을 말합니다. 오늘날에는 빅데이터처리기술이 등장함에 따라 사전처리보다 사후처리가 더욱 중요해졌습니다. 데이터를 저장하여 모아놓고 데이터에서 직접 의미를 찾아내기 위해서 무엇을 해야할까요? 데이터 유형에 따라 저장방법을 결정하는 저장관리, 신뢰성있는 데이터를 확보하는 품질관리, 데이터의 유출방지와 안전한 사용을 보장하는 보안관리등의 역할의 수행이 중요해진 것입니다. 2. 표본조사와 전수조사 통계분석과 같은 전통적인 데이터분석법도 표본데이터에서 의미를 찾는것에 초점을 두고 발전해 왔습니다. 왜냐하면 수집, 처리비용, 분석능력등의 부담이 존재했기 때문입니다. 하지만 이제 조사대상이 되는 자료전체를 빠짐없이 조사하는, 전수조사 가능해졌습니다. 전수조사의 장점은 표본조사가 주지못하는 패턴과 같은 정보를 제공한다는 점입니다. 3. 양과 질 세번째는 질과 양입니다. 데이터의 질보다 양이 더 강조되는 시대입니다. 빅데이터란말에도 나타나듯 이 데이터의 양이 크지않다면 빅데이터가 아닐것 입니다. 실시간으로 분석할 수 있는 데이터의 양이 증가하면 사소한 몇몇 오류는 분석결과에 큰 영향을 미치지않습니다. 분석할 수 있는 데이터가 많으면 많을수록 결과의 정확성은 증가하게 됩니다. 4. 인과관계와 상관관계 기존의 데이터분석은 이론적인 틀과 정해진 목적에 따라서만 진행 되었습니다. 하지만 비즈니스의 상황에서 중요한것은 인과관계보다도 상관관계 파악입니다. 빅데이터 분석을 통해 다양한 상관관계를 빠르게 저렴하게 도출할 수 있게 되었다고 말할 수 있습니다.  문항2. 데이터 전처리 기술 3가지가 무엇인지 명칭을 작성하고, 그 개념에 대해 설명하시오. 답변 1. 데이터 저장관리 : 데이터의 저장방법을 결정하고, 저장관리 시스템을 활용하여 데이터를 보관하는 활동 2. 데이터 품질관리 : 신뢰성 있는 데이터를 확보하고 유지하는 데 필요한 모든 활동을 말함. 3. 데이터 보안관리 : 데이터 유출 방지 및 안전한 사용을 보장하는 것.