강화학습 도식도

강화학습 도식도

CODEDRAGON ㆍDevelopment/AI

강화학습 도식도

· 칭찬을 받은 행위(보상)는 더욱 많이 하고, 벌을 받을만한 행위는 줄이는 것과 마찬가지로 적응성을 통해 학습을 강화해갑니다. 학습의 결과가 즉각적으로 나타나는 경우에 효과적이라고 할 수 있습니다.

· Agent(행위자)의 Action(행위)은 World(Environment; 환경)에 영향을 줍니다. 특정 액션은 환경의 상태(State)를 변화시키고이에 따라 에이전트는 보상(Reward)을 받게 됩니다.

CodeDragon