강화학습 도식도

CODEDRAGON Development/Big Data, R, ...

반응형


 

 

 

강화학습 도식도

·         칭찬을 받은 행위(보상) 더욱 많이 하고, 벌을 받을만한 행위는 줄이는 것과 마찬가지로 적응성을 통해 학습을 강화해갑니다. 학습의 결과가 즉각적으로 나타나는 경우에 효과적이라고 있습니다.

·         Agent(행위자) Action(행위) World(Environment; 환경) 영향을 줍니다. 특정 액션은 환경의 상태(State) 변화시키고이에 따라 에이전트는 보상(Reward) 받게 됩니다.

 


'Development > Big Data, R, ...' 카테고리의 다른 글

머신러닝 vs 통계학  (0) 2020.01.30
데이터 분석용 파이썬 패키지  (0) 2020.01.30
값이 누락된 데이터 처리  (0) 2020.01.30
데이터 교정  (0) 2020.01.29
다중 공선성(multicollinarity)  (0) 2020.01.29