1. 데이터 마이닝(Data Mining)의 개념은 대용량 데이터의 패턴(pattern)이나 규칙(rules)을 발견하는 방법입니다 2. 데이터 마이닝의 기법은 아래 5가지 기법이 있습니다.(AS3C) Association (연관성 탐색) 여러 트랜잭션간의 연관성의 발견 Sequence (연속성 규칙) 트랜잭션의 순서에 따른 이력을 시계열적 분석하여 이후의 발생가능성 예측 Classification (분류 규칙) 수집된 데이터의 패턴 및 속성으로 결합하여 트리형태의 모델로 변형, 의사결정 및 예측 Clustering (데이터 군집화) 특징 및 속성의 유사성으로 데이터 그룹화 Characterization (특성 발견) 데이터의 특성에 따른 모델을 만들어 반복적인 학습 및 검증을 통한 특성발견 3. 데이터 마이닝은 일반적으로 아래와 같은 프로세스로 진행이 됩니다. Data Mining 절차 설명 기법/비고 1. Data 선택 원시(raw)데이터에서 목표데이터 선정 데이터 선정(테이블,컬럼) 2. Data 정제/보완 형식, 자릿수, 불필요값 필터링 등의 기법으로 정제/보완 ETT(ETL), Data Cleansing, Data Profiling 3. Data 변환 데이터 마이닝의 모형(model) 적용을 위한 변형 변환 프로그램 4. Data Mining 적용 데이터 정해진 가설에 따른 모델 적용 모델적용, 확률/통계 기법, 시뮬레이션 5. 평가 가설에 대한 검증, 오차보정 오차, 지표화, 보정