시작하기 강화학습이란 Agent가 Environment에서 목적를 이루기 위해 Action을 수행하여, Environment로부터의 Feedback을 이용하여 최적의 Policy를 만들어 가는 방법입니다. 그런데 강화학습을 시작할 때, 용어가 많아서 공부할때마다 햇갈려서 정리해 놓겠습니다. 용어들 Agent : 행동과 학습을 하는 주체 Environment (환경) : Agent가 존재하는 세계 Action(행동) : Agent가 Environment 안에서 일으키는 움직임 State(상태) : Agent의 상태로써 Action을 하고 나면 상태가 변경됨 Policy(정책) : 특정 State에서 어떤 Action을 선택할지에 대한 전략 Reward(보상) : Action을 수행했을때 Environmen..