강화학습 최고의 명강의인 UC 버클리대 세르게이 레빈 교수의CS 294-112: 딥 강화학습(Deep Reinforcement Learning) 강의를 한 주에 한 강의 씩 따라가며 강화학습 이론의 큰 줄기와 최신 연구 동향을 파악할 수 과정입니다. 
본 과정은 총 23강으로 이루어져 있으며 풀잎8기에서 12강까지 진행이 되었고 9기에서 13강부터 남은 강의가 진행이 될 예정입니다.
딥 강화학습 (Deep Reinforcement Learning)
AI, DeepRL, RL
시작일
매주 20200713
진행일시
매주
모집현황

data-product-id="11503"

진행장소
캠퍼스
학습대상
- 강화학습에 대한 지식을 중고급 수준으로 업그레이드 하고 싶으신 분
- 딥러닝과 강화학습이 만나면 얼마나 강력해지는지 궁금하신 분
- 강의 설명이 부족한 부분은 논문을 참조해서 이해하려는 노력과 열정이 있는 분 - 다소 빠른 영어 강의를 따라가는데 큰 어려움이 없으신 분
과목난이도

쉬움 (1단계) ~ 어려움(5단계)

학습목표
강화학습의 Policy Search, Exploration, Suboptimility, Inverse RL, Transfer Learning, Meta Learning, Safety 등과 같은 Advanced Topic을 이해한다.
운영방식
- 첫 시간에 각 주 별 강의 발표자를 선정합니다.
- 희망자 우선 순위로 희망일에 따라 선정할 예정이며 가급적 모든 사람이 발표에 참여합니다.
- 발표 예정일에 다른 일정이 생길 경우 미리 퍼실이와 상의해서 일정을 조정할 수 있습니다.
- 매주 풀잎 시간에는 발표자가 강의 슬라이드를 설명하고 질문이 나오면 그 주제에 대해 심화된 토론 시간을 갖도록 진행을 합니다. - 풀잎 시간은 새로운 내용을 배우는 시간이 아니라 토론 시간으로서 의미를 갖도록 각자 사전학습을 반드시 해와야 합니다.
선수지식
- 딥러닝 주요 모델 (DNN, CNN, LSTM)과 생성 모델 (VAE, GAN)의 이해
- 통계적 추론 (Gaussian Process, Graphical Model, Baysian Nueral Network, Uncertainty)
- 제어, 정보 이론 및 최적화 기초
커리큘럼
/
주차 모임내용 학습자료
1 주차 Lecture 13: Learning Policies by Imitating Other Policies http://rail.eecs.berkeley.edu/deeprlcourse-fa18/static/slides/lec-13.pdf
2 주차 Lecture 14: Probability and Variational Inference Primer http://rail.eecs.berkeley.edu/deeprlcourse-fa18/static/slides/lec-14.pdf
3 주차 Lecture 15: Connection between Inference and Control http://rail.eecs.berkeley.edu/deeprlcourse-fa18/static/slides/lec-15.pdf
4 주차 Lecture 16: Inverse Reinforcement Learning http://rail.eecs.berkeley.edu/deeprlcourse-fa18/static/slides/lec-16.pdf
5 주차 Lecture 17: Exploration: Part 1 http://rail.eecs.berkeley.edu/deeprlcourse-fa18/static/slides/lec-17.pdf
6 주차 Lecture 18: Exploration: Part 2 http://rail.eecs.berkeley.edu/deeprlcourse-fa18/static/slides/lec-18.pdf
7 주차 Lecture 19: Transfer Learning and Multi-Task Learning http://rail.eecs.berkeley.edu/deeprlcourse-fa18/static/slides/lec-19.pdf
8 주차 Lecture 20: Meta-Learning http://rail.eecs.berkeley.edu/deeprlcourse-fa18/static/slides/lec-20.pdf
9 주차 Lecture 21: Parallelism and RL System Design http://rail.eecs.berkeley.edu/deeprlcourse-fa18/static/slides/lec-21.pdf
10 주차 Lecture 22: Advanced Imitation Learning and Open Problems http://rail.eecs.berkeley.edu/deeprlcourse-fa18/static/slides/lec-22.pdf
11 주차 Lecture 24: Guest Lecture: Gregory Kahn http://rail.eecs.berkeley.edu/deeprlcourse-fa18/static/slides/lec-24.pdf
퍼실소개
윤성진

윤성진

퍼실 소개
소프트웨어 연구개발 및 제품기획 업무를 해왔고 최근에는 딥러닝/강화학습에 관심을 갖고 관련 연구, 강의, 책 쓰기 등을 하고 있습니다.

개설 동기
제가 이 강의를 들었을 때는 마법과 같은 인사이트로 어려운 이론들을 쉽게 풀어가는 세르게이 레빈 교수의 천재적인 스토리텔링 능력에 감탄을 하면서 들었던 것 같습니다. 
주옥과 같은 내용들이 가득 차있는 이 명강의를 많은 분들과 공유하고 싶어서 플립을 열게 되었습니다. 

퍼실 소개
소프트웨어 연구개발 및 제품기획 업무를 해왔고 최근에는 딥러닝/강화학습에 관심을 갖고 관련 연구, 강의, 책 쓰기 등을 하고 있습니다.

개설 동기
제가 이 강의를 들었을 때는 마법과 같은 인사이트로 어려운 이론들을 쉽게 풀어가는 세르게이 레빈 교수의 천재적인 스토리텔링 능력에 감탄을 하면서 들었던 것 같습니다. 
주옥과 같은 내용들이 가득 차있는 이 명강의를 많은 분들과 공유하고 싶어서 플립을 열게 되었습니다. 


풀잎스쿨 신청 및 결제를 위해서 로그인을 해주세요