- 2019년 초에 개설된 Stanford CS234 강의를 따라가며 개념을 정리합니다.
- 주어진 assignment를 함께 해결해보려고 합니다.
- 기초부터 보다 심화된 개념까지 폭넓게 공부하실 수 있습니다.
딴딴한 강화학습(CS234)
AI, CS234, RL
시작일
매주 2019년 10월 7일
진행일시
매주
모집현황

data-product-id="11498" data-recruit-progress="0" data-activity-progress="0"

진행장소
캠퍼스
학습대상
- 강화학습을 처음 접하는 분
- 강화학습이 무지무지 궁금하신 분
- 강화학습의 개념이 매번 헷갈린다 생각하시는 분 강화학습의 개념을 딴딴히 다지고 싶으신 분
과목난이도

쉬움 (1단계) ~ 어려움(5단계)

학습목표
- 강화학습의 기본개념과 원리에 대해서 공부합니다. (쪼금 깊이)
- 강화학습의 기본이 되는 몇몇 model-free 알고리즘의 원리를 공부합니다.
- 우리의 강화학습 지식을 강화합니다. optimal하게. ^^
운영방식
- 사전학습으로 CS234 강의를 먼저 시청하고 수업에 참가합니다.
- 참가자는 정해진 주차의 강의를 요약 정리하여 발표합니다.
- 발표후 발제와 토론이 이루어지고, 강의에서 주어진 assignment에 대해 토론합니다.
(11주 안에 진행하지 못하는 주요 강의는 2주 정도 추가해서 진행할 예정입니다. 참고해주세요)
선수지식
- 아주아주아주 기초적인 강화학습 지식
- 아주아주아주 기초적인 선형대수(수업에 살짝살짝 나옵니다.)
- 토론과 질문에 대해 열린 마음(좀 모르면 어때요? ㅎㅎ)
학습 및 참고자료
주교재
CS234 website : https://web.stanford.edu/class/cs234/schedule.html

참고자료
Sutton & Barto : Introduction to Reinforcement Learning
기타 자료 : David Silver's lecture, 팡요랩, 강아지책 등등
커리큘럼
/
주차 모임내용 학습자료
1 주차 오리엔테이션 & 1강 - 강화학습 개념 소개 1강 강의영상( https://youtu.be/FgzM3zpZ55o), 기타 참고자료는 CS234 webpage에서(이하 생략)
2 주차 2강 How to act given know how the world works. : MDP, Policy Iteration, Value Iteration etc 2강 강의영상(https://youtu.be/E3f2Camj0Is)
3 주차 3강 Learning to evaluate a policy when don't know how the world works : Model free policy evaluation 3강 강의영상(https://youtu.be/dRIhrn8cc9w)
4 주차 4강 Model-free learning to make good decision : Q-learning, SARSA 4강 강의영상(https://youtu.be/j080VBVGkfQ)
5 주차 5강 : RL with value function approximation 5강 강의영상(https://youtu.be/j080VBVGkfQ)
6 주차 RL with function approximation : DQN and beyond 6강 강의영상(https://youtu.be/gOV8-bC1_KU)
7 주차 8강 Policy Gradient(1) https://youtu.be/8LEuyYXGQjU
8 주차 9강 Policy Gradient(2) 9강 강의영상(https://youtu.be/E-_ecpD5PkE)
9 주차 10강 Policy Gradiet(3) 10강 강의영상 (https://youtu.be/o_i5F1zGPLs)
10 주차 11강 Fast RL : Exploration and Exploitation(1) 11강 강의영상 (https://youtu.be/RN8qpSs8ozY)
11 주차 12강 Fast RL : Exploration and Exploitation(2) 12강 강의영상 (https://youtu.be/jJ7JbQBTChM)
퍼실소개
전효정

전효정

강화학습을 공부하고 있습니다. 이런 저런 강의와 책을 봤음에도 참 헷갈리는 것이 많은 분야가 강화학습이 아닌가 싶습니다. 이번 기회에 함께 토론하며 기본 개념을 확실히 잡아보고 싶어서 이 강좌를 제안했습니다.
함께 공부해 보고 싶습니다. 함께 하시죠. ^^

강화학습을 공부하고 있습니다. 이런 저런 강의와 책을 봤음에도 참 헷갈리는 것이 많은 분야가 강화학습이 아닌가 싶습니다. 이번 기회에 함께 토론하며 기본 개념을 확실히 잡아보고 싶어서 이 강좌를 제안했습니다.
함께 공부해 보고 싶습니다. 함께 하시죠. ^^



풀잎스쿨 신청 및 결제를 위해서 로그인을 해주세요