데이터 전처리: Difference between revisions
From IT위키
(새 문서: 분류:데이터 분석 ;Data Preprocessing ;데이터를 실제 업무에 활용하기에 앞서서 정제하는 행위 == 유형 == * 데이터 정제 ** 이상치 처리 ** ...) |
No edit summary |
||
Line 4: | Line 4: | ||
== 유형 == | == 유형 == | ||
* 데이터 | * '''데이터 품질 향상''' | ||
** 이상치 처리 | ** 이상치 처리 | ||
** [[결측치]] 처리 | ** [[결측치]] 처리 | ||
** 노이즈 제거 | ** 노이즈 제거 | ||
* 개인정보 보호 | * '''데이터 통일''' | ||
** 메타 데이터 조정: 칼럼명 통일 | |||
** 데이터 형태 조정: Data Type, Datetime Type, [[원핫 인코딩]] | |||
** 연계 정보 조정: 불필요 칼럼 삭제, 칼럼 추가 등 | |||
* '''개인정보 보호''' | |||
** 노이즈 추가: [[차분 프라이버시]] | ** 노이즈 추가: [[차분 프라이버시]] | ||
** 식별자 제거: [[개인정보 비식별화]] | ** 식별자 제거: [[개인정보 비식별화]] | ||
** 암호화: [[동형암호]] | ** 암호화: [[동형암호]] | ||
** | ** 민감속성 제거 |