머신러닝 - 강화학습 알아봐요

머신러닝 - 강화학습 알아봐요

카테고리 없음 2020. 2. 12. 12:16

>

최근까지 지도학습, 비지도학습, 준지도학습에 대해 알아보았는데요, 강화학습(Reinforcement Learning)은 이와 아주 다른 종류의 알고리즘이라고 할 수 있습니다.

강화 학습은 헹동심 정학에서 영감을 받아 만들어졌고 1종의 산 볼죠무 제도로 이해하면 쉽게 되겠습니다.

>

-에이전트(agent):학습하는 시스템, 상태를 관찰하고 행동을 선택, 목표지향-환경(environment):에이전트를 제외한 과인마지-상태(state):형세정보-행동(action):현재 상태에서 에이전트가 하는 것-보수(reward):행동의 좋음과 나쁨을 알리는 부정적 보상을 벌점(penalty)이라고 하기도 한다. -정책(policy):최상의전략,학습을거치면끊어집니다.배변화

강화학습은이강의와같은방식으로진행됩니다.

1. 에이전트는 환경 속에서 자신의 상태를 관찰 2. 정책대로 행동을 선택 3. 선택한 행동을 환경에서 실행 4. 환경을 모두 sound상태와 보상을 받 sound5. 보상을 최대화하는 방향으로 정책을 수정(학습 단계)6. 최적의 정책을 찾을 때까지 위의 과정을 반복

강화학습은주로게타AI나로보틱스분야에서많이활용되어왔습니다.하지만 알파고가 강화학습 분야에 딥러닝을 결합하여 큰 성과를 거두면서 현재는 보행로봇에서 자율주행자동차에 이르기까지 다양한 종류의 작업에 강화학습이 이용되고 있습니다.

아래 페이지에 강화학습 적용사례에 대해 잘 정리하였으니 참고하시기 바랍니다.

댓글

ABOUT ME

더보기 더보기

티스토리툴바