딴딴한 강화학습(CS234)
AI, CS234, RL
시작일
매주 2019년 10월 7일
진행일시
매주
모집현황
data-product-id="11498" data-recruit-progress="0" data-activity-progress="0"
진행장소
캠퍼스
학습대상
- 강화학습을 처음 접하는 분
- 강화학습이 무지무지 궁금하신 분
- 강화학습의 개념이 매번 헷갈린다 생각하시는 분 강화학습의 개념을 딴딴히 다지고 싶으신 분
- 강화학습이 무지무지 궁금하신 분
- 강화학습의 개념이 매번 헷갈린다 생각하시는 분 강화학습의 개념을 딴딴히 다지고 싶으신 분
과목난이도
쉬움 (1단계) ~ 어려움(5단계)
학습목표
- 강화학습의 기본개념과 원리에 대해서 공부합니다. (쪼금 깊이)
- 강화학습의 기본이 되는 몇몇 model-free 알고리즘의 원리를 공부합니다.
- 우리의 강화학습 지식을 강화합니다. optimal하게. ^^
- 강화학습의 기본이 되는 몇몇 model-free 알고리즘의 원리를 공부합니다.
- 우리의 강화학습 지식을 강화합니다. optimal하게. ^^
운영방식
- 사전학습으로 CS234 강의를 먼저 시청하고 수업에 참가합니다.
- 참가자는 정해진 주차의 강의를 요약 정리하여 발표합니다.
- 발표후 발제와 토론이 이루어지고, 강의에서 주어진 assignment에 대해 토론합니다.
(11주 안에 진행하지 못하는 주요 강의는 2주 정도 추가해서 진행할 예정입니다. 참고해주세요)
- 참가자는 정해진 주차의 강의를 요약 정리하여 발표합니다.
- 발표후 발제와 토론이 이루어지고, 강의에서 주어진 assignment에 대해 토론합니다.
(11주 안에 진행하지 못하는 주요 강의는 2주 정도 추가해서 진행할 예정입니다. 참고해주세요)
선수지식
- 아주아주아주 기초적인 강화학습 지식
- 아주아주아주 기초적인 선형대수(수업에 살짝살짝 나옵니다.)
- 토론과 질문에 대해 열린 마음(좀 모르면 어때요? ㅎㅎ)
- 아주아주아주 기초적인 선형대수(수업에 살짝살짝 나옵니다.)
- 토론과 질문에 대해 열린 마음(좀 모르면 어때요? ㅎㅎ)
학습 및 참고자료
주교재
CS234 website : https://web.stanford.edu/class/cs234/schedule.html
참고자료
Sutton & Barto : Introduction to Reinforcement Learning
기타 자료 : David Silver's lecture, 팡요랩, 강아지책 등등
CS234 website : https://web.stanford.edu/class/cs234/schedule.html
참고자료
Sutton & Barto : Introduction to Reinforcement Learning
기타 자료 : David Silver's lecture, 팡요랩, 강아지책 등등
커리큘럼
/
주차 | 모임내용 | 학습자료 |
---|---|---|
1 주차 | 오리엔테이션 & 1강 - 강화학습 개념 소개 | 1강 강의영상( https://youtu.be/FgzM3zpZ55o), 기타 참고자료는 CS234 webpage에서(이하 생략) |
2 주차 | 2강 How to act given know how the world works. : MDP, Policy Iteration, Value Iteration etc | 2강 강의영상(https://youtu.be/E3f2Camj0Is) |
3 주차 | 3강 Learning to evaluate a policy when don't know how the world works : Model free policy evaluation | 3강 강의영상(https://youtu.be/dRIhrn8cc9w) |
4 주차 | 4강 Model-free learning to make good decision : Q-learning, SARSA | 4강 강의영상(https://youtu.be/j080VBVGkfQ) |
5 주차 | 5강 : RL with value function approximation | 5강 강의영상(https://youtu.be/j080VBVGkfQ) |
6 주차 | RL with function approximation : DQN and beyond | 6강 강의영상(https://youtu.be/gOV8-bC1_KU) |
7 주차 | 8강 Policy Gradient(1) | https://youtu.be/8LEuyYXGQjU |
8 주차 | 9강 Policy Gradient(2) | 9강 강의영상(https://youtu.be/E-_ecpD5PkE) |
9 주차 | 10강 Policy Gradiet(3) | 10강 강의영상 (https://youtu.be/o_i5F1zGPLs) |
10 주차 | 11강 Fast RL : Exploration and Exploitation(1) | 11강 강의영상 (https://youtu.be/RN8qpSs8ozY) |
11 주차 | 12강 Fast RL : Exploration and Exploitation(2) | 12강 강의영상 (https://youtu.be/jJ7JbQBTChM) |
퍼실소개
전효정
강화학습을 공부하고 있습니다. 이런 저런 강의와 책을 봤음에도 참 헷갈리는 것이 많은 분야가 강화학습이 아닌가 싶습니다.
이번 기회에 함께 토론하며 기본 개념을 확실히 잡아보고 싶어서 이 강좌를 제안했습니다.
함께 공부해 보고 싶습니다. 함께 하시죠. ^^
강화학습을 공부하고 있습니다. 이런 저런 강의와 책을 봤음에도 참 헷갈리는 것이 많은 분야가 강화학습이 아닌가 싶습니다.
이번 기회에 함께 토론하며 기본 개념을 확실히 잡아보고 싶어서 이 강좌를 제안했습니다.
함께 공부해 보고 싶습니다. 함께 하시죠. ^^
풀잎스쿨 신청 및 결제를 위해서 로그인을 해주세요
- 2019년 초에 개설된 Stanford CS234 강의를 따라가며 개념을 정리합니다.
- 주어진 assignment를 함께 해결해보려고 합니다.
- 기초부터 보다 심화된 개념까지 폭넓게 공부하실 수 있습니다.