강화 학습(RL; Reinforcement Learning)
CODEDRAGON ㆍDevelopment/Big Data, R, ...
반응형
강화 학습(RL; Reinforcement Learning)
· 현재의 상황(상태; State)을 보고 어떤 행동(Action)을 하면 어떤 보상(Reward)을 받을지 예측하여 좋은(Positive) 보상을 받는 쪽으로 행동하는 학습 방법입니다.
· 자신과 환경과의 상호 관계에 따라 자신의 행동을 개선해 나가는 학습법, 어떤 환경에서 보상을 최대로 하는 행동을 선택하는 방법입니다.
· 강화라는 말을 사용한 이유는 상과 벌이라는 보상을 통해 '현재의 행위의 그 방향'으로 혹은 '반대방향'으로 그 행위를 강화하는 학습 방법으로, 상을 최대한 많이 받을 수 있는 방향으로 학습하는 방법입니다.
· 입력에 대한 출력과 점수를 통해 학습합니다. 학습에 의해 답이 정해지는 것이 아니라 모르는 환경에서 보상 값(Reward)이 최대가 되도록 행동합니다.
· 학습용 데이터 집합에 해당하는 정보를 스스로 얻을 수 있는 기능을 갖추고 있습니다.
'Development > Big Data, R, ...' 카테고리의 다른 글
유의수준(significance level; α), 귀무가설(H0)과 대립가설(H1)의 채택 (0) | 2020.02.07 |
---|---|
summary() 함수의 결과 해석 - 데이터 (0) | 2020.02.07 |
재현율(Recall) & 정밀도(Precision) 예시 (0) | 2020.02.06 |
집합(set) (0) | 2020.02.04 |
탐색적 데이터 분석(Exploratory data analysis) (0) | 2020.02.04 |