텍스트 마이닝: Difference between revisions
From IT위키
m (문자열 찾아 바꾸기 - "분류:데이터/통계학" 문자열을 "분류:데이터 과학" 문자열로) |
|||
(2 intermediate revisions by 2 users not shown) | |||
Line 1: | Line 1: | ||
[[분류:데이터 | [[분류:데이터 과학]] | ||
;Text Mining | ;Text Mining | ||
;비정형 텍스트에서 패턴, 관계 등을 분석하여 의미있는 정보를 도출해내는 [[데이터 마이닝]] 기법 | ;비정형 텍스트에서 패턴, 관계 등을 분석하여 의미있는 정보를 도출해내는 [[데이터 마이닝]] 기법 | ||
Line 34: | Line 34: | ||
(Summarization) | (Summarization) | ||
|| | || | ||
문서의 중요 내용을 추출하여 짧은 글로 요약 | * 문서의 중요 내용을 추출하여 짧은 글로 요약 | ||
|} | |} | ||
Latest revision as of 23:45, 6 May 2020
- Text Mining
- 비정형 텍스트에서 패턴, 관계 등을 분석하여 의미있는 정보를 도출해내는 데이터 마이닝 기법
- 데이터 마이닝과의 차이
구분 | 설명 |
---|---|
데이터 마이닝 | 정량화, 구조화된 데이터에서 원하는 정보를 추출하기 위해 통계적, 기계학습적 알고리즘을 적용 |
텍스트 마이닝 | 대량의 비정형 텍스트에 요약, 분류, 군집화 등을 적용하여 새로운 정보 도출 |
주요 기법[edit | edit source]
- 텍스트 마이닝 기반 기술
기법 | 내용 |
---|---|
정보 추출
(Information Extraction) |
|
문서 분류
(Classification) |
|
문서요약
(Summarization) |
|
- 텍스트 마이닝 응용 기술
응용 기술 | 내용 |
---|---|
Web Mining | 웹사이트에 텍스트 마이닝 기법을 적용하여 사용자들의 사용성 증대 |
Concept Linkage | 여러 문서들에서 공유되고 있는 의미를 발견 |
Question Answering | 사람이 자연어로 질문을 던지면, 문서에서 답을 찾아 제공 |
Topic Tracking | 사용자 프로필 기반으로 관심있어 할 문서를 추출하여 제공 |