머신러닝: Difference between revisions

From IT위키
No edit summary
 
(7 intermediate revisions by 4 users not shown)
Line 1: Line 1:
[[분류:인공지능]]
;Machine learning
;Machine learning
 
;[[인공지능]] 연구분야 중 하나로, 인간의 뇌가 자연스럽게 수행하는 학습 능력을 컴퓨터로 구현하는 기술
== 개요 ==
[[인공지능]] 연구분야 중 하나로, 인간의 뇌가 자연스럽게 수행하는 학습 능력을 컴퓨터로 구현하는 기술


== 머신러닝과 딥러닝 ==
== 머신러닝과 딥러닝 ==
Line 16: Line 15:
*** [[주성분 분석|주성분 분석(PCA, Principal Component Analysis)]]
*** [[주성분 분석|주성분 분석(PCA, Principal Component Analysis)]]
*** [[독립성분 분석|독립성분 분석(ICA)]]
*** [[독립성분 분석|독립성분 분석(ICA)]]
*** [[자기 조직화 지도|자기 조직화 지도(SOM, Self-Organizing Map)]]
* 지도 학습
* 지도 학습
** 분류
** 분류
** 회귀
*** [[SVM]]
*** [[kNN]]
** 예측
*** [[선형 회귀]]
*** [[로지스틱 회귀분석]]
* 강화 학습
* 강화 학습
** 히든 마코브 모델
** [[Q 러닝]]
** [[은닉 마코프 모델]]


== 머신러닝 활용 ==
== 머신러닝 활용 ==
Line 39: Line 44:
** ex) 얼굴(큰 차원) 이미지에서 코, 눈(작은 차원) 등의 이미지에서 숫자를 추출
** ex) 얼굴(큰 차원) 이미지에서 코, 눈(작은 차원) 등의 이미지에서 숫자를 추출


[[분류:인공지능]]
== 구현 절차 ==
# 데이터 전처리: 벡터화, [[레이블링]], [[결측치]] 처리
# 수치 분석: [[원핫 인코딩]], Feature(Factor) 선정
# 모델 선택: 적합 모델 선정 또는 전이학습
# [[하이퍼 파라미터]] 튜닝: 모델의 계층, 유닛, [[활성화 함수]], 학습비율 등
# 모델 테스트 및 분석: 학습된 모델의 성능의 측정, 분석 및 성능 개선
# 모델 제공 및 관리: 실제 응용 분야에 적용하고 지속적으로 관리

Latest revision as of 21:57, 29 November 2020

분류:인공지능

Machine learning
인공지능 연구분야 중 하나로, 인간의 뇌가 자연스럽게 수행하는 학습 능력을 컴퓨터로 구현하는 기술

머신러닝과 딥러닝[edit | edit source]

  • 인공 지능 : 자연 언어 처리, 전문가 시스템 분야, 영상 분석, 이론 증명(수학적 증명)
  • 머신 러닝 : 선형 회귀, 로지스틱 회귀, 소프트 맥스, 신경망(neural net)
  • 딥 러닝 : 신경망을 3 개 이상 중첩, CNN(이미지 인식 기능), RNN(자연어 처리, 챗봇)

분류[edit | edit source]

머신러닝 활용[edit | edit source]

  • 클래스 분류(Classification)
    • 특정 데이터에 레이블(정답)을 붙여 분류
    • ex) 스팸 메일 분류, 필기 인식 등
  • 클러스터링(Clustering)
    • 값의 유사성을 기반으로 데이터를 여러 그룹으로 나눔
    • ex) 고객의 여러 가지 정보를 이용하여 그룹핑한 다음 최우수/우수/일반 고객 등으로 분류
  • 추천(Recommendation)
    • 특정 데이터를 기반으로 다른 데이터를 추천하는 것
    • ex) 사용자의 구매기록을 기반으로 다른 상품 추천
  • 회귀(Regression)
    • 과거의 데이터로 미래의 데이터를 예측하는 것
    • ex) 주변 부동산 시세 정보를 이용하여 내년의 집값을 예측
  • 차원 축소
    • 데이터의 특성을 유지하면서 데이터의 양을 줄이는 것
    • ex) 얼굴(큰 차원) 이미지에서 코, 눈(작은 차원) 등의 이미지에서 숫자를 추출

구현 절차[edit | edit source]

  1. 데이터 전처리: 벡터화, 레이블링, 결측치 처리
  2. 수치 분석: 원핫 인코딩, Feature(Factor) 선정
  3. 모델 선택: 적합 모델 선정 또는 전이학습
  4. 하이퍼 파라미터 튜닝: 모델의 계층, 유닛, 활성화 함수, 학습비율 등
  5. 모델 테스트 및 분석: 학습된 모델의 성능의 측정, 분석 및 성능 개선
  6. 모델 제공 및 관리: 실제 응용 분야에 적용하고 지속적으로 관리