강화학습 도식도
CODEDRAGON ㆍDevelopment/AI
반응형
강화학습 도식도
· 칭찬을 받은 행위(보상)는 더욱 많이 하고, 벌을 받을만한 행위는 줄이는 것과 마찬가지로 적응성을 통해 학습을 강화해갑니다. 학습의 결과가 즉각적으로 나타나는 경우에 효과적이라고 할 수 있습니다.
· Agent(행위자)의 Action(행위)은 World(Environment; 환경)에 영향을 줍니다. 특정 액션은 환경의 상태(State)를 변화시키고이에 따라 에이전트는 보상(Reward)을 받게 됩니다.
'Development > AI' 카테고리의 다른 글
머신러닝 vs 통계학 (0) | 2020.01.30 |
---|---|
데이터 분석용 파이썬 패키지 (0) | 2020.01.30 |
값이 누락된 데이터 처리 (0) | 2020.01.30 |
데이터 교정 (0) | 2020.01.29 |
다중 공선성(multicollinarity) (0) | 2020.01.29 |