마르코프 결정 프로세스

From IT위키

Revision as of 21:53, 28 October 2019 by Aimaster (talk | contribs)

(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)

분류:인공지능

MDP; Markov Decision Process

특징

Stochastic: 다음 결과는 확률적으로 결정됨
Partially Observable: 전체 결정 과정을 조망할 수 없음

구성

구성	설명
S	상태의 유한 집합
A	행동의 유한 집합
R	보상 기대값, R(s, a)
r	차감 요인, 0~1
T	전이확률, T(s', a, s)

같이 보기

Retrieved from "https://itwiki.kr/index.php?title=마르코프_결정_프로세스&oldid=4441"