강화 학습(RL; Reinforcement Learning)

CODEDRAGON Development/Big Data, R, ...

반응형

 

 

 

강화 학습(RL; Reinforcement Learning)

·         현재의 상황(상태; State) 보고 어떤 행동(Action) 하면 어떤 보상(Reward) 받을지 예측하여 좋은(Positive) 보상 받는 쪽으로 행동하는 학습 방법입니다.

·         자신과 환경과의 상호 관계에 따라 자신의 행동을 개선해 나가는 학습법, 어떤 환경에서 보상을 최대로 하는 행동 선택하는 방법입니다.

·         강화라는 말을 사용한 이유는 상과 벌이라는 보상을 통해 '현재의 행위의 방향'으로 혹은 '반대방향'으로 행위를 강화하는 학습 방법으로, 상을 최대한 많이 받을 있는 방향으로 학습하는 방법입니다.

·         입력에 대한 출력과 점수를 통해 학습합니다. 학습에 의해 답이 정해지는 것이 아니라 모르는 환경에서 보상 (Reward) 최대 되도록 행동합니다.

·         학습용 데이터 집합에 해당하는 정보를 스스로 얻을 있는 기능을 갖추고 있습니다.

 

 

http://bit.ly/2PKIDmT