본문 바로가기

강화학습11

벨만 방정식 - Bellman Equation and Optimality MRP, MDP 에서 각 value function 을 활용하여 어떻게 optimality 에 접근 할 수 있을까? 이전 글 : Markov 모델 [Artificial Intelligence/Reinforcement Learning] - 2. Reinforcement Learning Models 2. Reinforcement Learning Models 강화학습에서 이야기 하는 마르코프 모델 (MP, MRP, MDP)에 대해 알아보자 이전 글 : 강화학습 이란? [Artificial Intelligence/Reinforcement Learning] - 1. Introduction of Reinforcement Learning Markov (마.. skidrow6122.tistory.com Bellman .. 2022. 5. 13.
마르코프 모델 - Reinforcement Learning Models 강화학습에서 이야기 하는 마르코프 모델 (MP, MRP, MDP)에 대해 알아보자 이전 글 : 강화학습 이란? [Artificial Intelligence/Reinforcement Learning] - 1. Introduction of Reinforcement Learning 1. Introduction of Reinforcement Learning 강화학습이 뭘까? 어떻게 동작하는 것이고, 어떤 개념들의 집합으로 이루어 져있을까? 머신러닝의 기법 중 하나로서의 강화학습 강화학습에 대해 이야기 하려면 머신러닝에 대해 먼저 정의 되 skidrow6122.tistory.com Markov (마르코프) Property 란 무엇일까? 강화학습의 문제를 푸는 알고리즘이 아닌 문제를 정의 하는 포맷이 되는 기본 개.. 2022. 5. 10.
강화학습 개요 - Introduction of Reinforcement Learning 강화학습이란 뭘까? 어떻게 동작하는 것이고, 어떤 개념들로 이루어 져있을까? 머신러닝의 기법 중 하나로서의 강화학습 강화학습에 대해 이야기 하려면 머신러닝에 대해 먼저 정의 되어야 한다. 강화학습은 머신러닝 기법 중 하나의 알고리즘이기 때문이다. 흔히들 이야기하는 기계학습은 다음과 같이 정의 된다. 경험을 통해 자동으로 개선하는 컴퓨터 알고리즘의 연구이며, 인공지능의 한 분야로 간주된다. 컴퓨터가 학습할 수 있도록 하는 알고리즘과 기술을 개발하는 분야이다. 즉, 인공지능이라는 대주제 하위로 머신러닝이라는 기법이 있고, 그 머신러닝을 구성하는 한가지 주요 메카니즘 중하나가 강화학습인 것이다. 위 정의에서 ‘경험' 이라고 하는 것은 데이터를 의미할 수 도 있고, 실제 행동을 의미 할 수 도 있는데, 이 ‘경.. 2022. 5. 8.