Anonymous
Not logged in
Talk
Contributions
Create account
Log in
IT위키
Search
데이터 전처리
From IT위키
Namespaces
Page
Discussion
More
More
Page actions
Read
Edit
Edit source
History
Revision as of 19:39, 17 April 2020 by
이수민
(
talk
|
contribs
)
(
diff
)
← Older revision
|
Latest revision
(
diff
) |
Newer revision →
(
diff
)
분류:데이터/통계학
Data Preprocessing
데이터를 실제 업무에 활용하기에 앞서서 정제하는 행위
데이터 전처리 부담
데이터 분석가는 업무 시간 중 80%정도를 데이터 수집 및 전처리 과정에 사용
[1]
유형
데이터 품질 향상
이상치 처리
결측치
처리
노이즈 제거
오타 처리
개행문자 등 특수문자 처리
데이터 통일
메타 데이터 조정: 칼럼명 통일
데이터 형태 조정: Data Type, Datetime Type,
원핫 인코딩
연계 정보 조정: 불필요 칼럼 삭제, 칼럼 추가 등
개인정보 보호
노이즈 추가:
차분 프라이버시
식별자 제거:
개인정보 비식별화
암호화:
동형암호
민감속성 제거
참고 문헌
↑
Forbes에서 인용한 CrowdFlower의 설문 결과
Navigation
Navigation
Main page
Recent changes
Random page
Help about MediaWiki
Wiki tools
Wiki tools
Special pages
Cite this page
Page tools
Page tools
User page tools
More
What links here
Related changes
Printable version
Permanent link
Page information
Page logs