Q 러닝: Difference between revisions

From IT위키
(새 문서: 분류:인공지능 ;Q Learning; Q-learning ;특정 상태에서 행동에 대한 미래값(Q)을 계산하여, 최적 정책을 찾는 마르코프 결정 프로세스 기반...)
 
(Q-러닝 문서로 넘겨주기)
 
(One intermediate revision by the same user not shown)
Line 1: Line 1:
[[분류:인공지능]]
#넘겨주기 [[Q-러닝]]
;Q Learning; Q-learning
;특정 상태에서 행동에 대한 미래값(Q)을 계산하여, 최적 정책을 찾는 [[마르코프 결정 프로세스]] 기반 [[강화 학습]] 기법

Latest revision as of 10:18, 28 January 2020

  1. 넘겨주기 Q-러닝