워드 임베딩: Difference between revisions

Revision as of 16:47, 8 March 2020

문장 분석 시 단어를 표현함에 있어서 유사도를 부여하는 벡터 표현법

장점
- 단어간의 유사도 측정에 용이
- 단어간의 관계 파악에 유리
- 벡터 연산을 통한 추론이 가능
단점
- 단어의 Subword 정보 인식 불가
  - ex) 서울지하철, 대구지하철의 유사도 유추 불가
- OOV(Out of Vocabulary)에 적용 불가
  - 새로운 단어가 들어오면 새로 학습시켜야 함, 기존 모델 재활용 불가

@@ Line 1: / Line 1: @@
-[[분류:인공지능]][[분류:데이터 분석]]
+[[분류:인공지능]][[분류:데이터/통계학]]
 ;Word Embedding
 문장 분석 시 단어를 표현함에 있어서 유사도를 부여하는 벡터 표현법