Anonymous
Not logged in
Talk
Contributions
Create account
Log in
IT위키
Search
마르코프 결정 프로세스
From IT위키
Namespaces
Page
Discussion
More
More
Page actions
Read
Edit
Edit source
History
Revision as of 21:53, 28 October 2019 by
Aimaster
(
talk
|
contribs
)
(
diff
)
← Older revision
|
Latest revision
(
diff
) |
Newer revision →
(
diff
)
분류:인공지능
MDP; Markov Decision Process
특징
Stochastic: 다음 결과는 확률적으로 결정됨
Partially Observable: 전체 결정 과정을 조망할 수 없음
구성
구성
설명
S
상태의 유한 집합
A
행동의 유한 집합
R
보상 기대값, R(s, a)
r
차감 요인, 0~1
T
전이확률, T(s', a, s)
같이 보기
머신러닝
강화 학습
은닉 마르코프 모델
Navigation
Navigation
Main page
Recent changes
분류별 보기
일반 IT용어
프로젝트 관리
디지털 서비스
블록체인
인공지능
소프트웨어 공학
운영체제
컴퓨터 구조
자료 구조
데이터 과학
데이터베이스
네트워크
프로토콜
보안
컴플라이언스
개인정보보호
표준
경영학
기업 IT
조직/단체
Advertisements
Wiki tools
Wiki tools
Special pages
Cite this page
Page tools
Page tools
User page tools
More
What links here
Related changes
Printable version
Permanent link
Page information
Page logs