음성 인식은 머신 러닝에서 가장 핫한 분야 중 하나입니다.
하지만 음성 인식 기술을 혼자 공부하기는 쉽지 않습니다.
음성 인식을 이해하기 위해서는 신호 처리, 언어학, 통계학 등 여러 배경 지식이 동시에 필요하기 때문입니다.
이 풀잎스쿨에서는 여러 사람이 함께 모여 음성 인식을 떠받치는 개념을 한 걸음씩 알아가 보고자 합니다.
음성 인식 부트캠프
진행일시
매주 (2시간)
모집현황

0.000000명 신청가능

진행장소
캠퍼스
Untitled-2 학습대상

음성 인식을 밑바닥부터 알아가고 싶으신 분

Untitled-2 선수지식

- 기본적인 행렬 연산과 미분, 통계 지식을 갖고 있음
- 머신 러닝의 기초 개념들을 이해하고 있음

Untitled-2 과목난이도

쉬움 (1단계) ~ 어려움(5단계)

학습목표

음성 인식의 바탕을 이루는 개념을 이해합니다

Untitled-2 학습 및 참고자료

Speech and Language Processing (Dan Jurafsky and James H. Martin) 에서 필요한 부분만을 골라서 읽습니다. (커리큘럼 참고)
부교재로는 Introduction to Speech Processing (Tom Bäckström, Okko Räsänen) 의 일부분을 사용합니다.

Untitled-2 운영방식

Stanford CS224S (Spoken Language Processing)에서 제시하는 커리큘럼을 대체로 따라가되, 여러 참고 자료로 부족한 부분들을 메꿉니다.

Untitled-2 커리큘럼
사전학습 / 이론

주차 모임내용 학습자료
1 주차 풀잎스쿨 소개 및 음성 인식 트렌드 리뷰 자체 자료
2 주차 Phonetics Speech and Language Processing 2nd Edition Chapter 7: Phonetics
3 주차 Acoustic Feature Extraction Introduction to Speech Processing Chapter 2: Basic representations and models
4 주차 Hidden Markov Models Speech and Language Processing 3rd Edition Appendix A: Hidden Markov Models
Speech and Language Processing 2nd Edition 9.1 ~ 9.2: The Hidden Markov Model Applied to Speech
5 주차 Gaussian Mixture Models Speech and Language Processing 2nd Edition Chapter 9.4 ~ 9.8: Acoustic Likelihood Computation
6 주차 Weighted Finite-State Transducers Speech Recognition with Weighted Finite-State Transducers
7 주차 Advanced Speech Recognition Speech and Language Processing 2nd Edition Chapter 10: Advanced Topics
8 주차 Neural Network Acoustic Models Deep Neural Networks for Acoustic Modeling in Speech Recognition
Building DNN acoustic models for large vocabulary speech recognition
9 주차 End-to-End Neural Network Recognition (1) Connectionist Temporal Classification: Labelling Unsegmented Sequence Data with Recurrent Neural Networks
Towards End-to-End Speech Recognition with Recurrent Neural Networks.
10 주차 End-to-End Neural Network Recognition (2) Lexicon-Free Conversational Speech Recognition with Neural Networks
Deep Speech: Scaling up end-to-end speech recognition
11 주차 End-to-End Neural Network Recognition (3) Sequence Transduction with Recurrent Neural Networks
Exploring Neural Transducers for End-to-End Speech Recognition
Untitled-2 퍼실소개
조용래

조용래

동영상 자막 제작 스타트업 보이스루에서 일하는 조용래입니다.
주로 음성 인식과 번역 기술을 연구하고 있습니다.
음성 인식 기술을 혼자 공부하기 보다는 함께 하면 배가 된다는 생각으로 풀잎스쿨을 열었습니다.

월 77,000원 / 3개월 231,000원

2020-01-11 부터 총 11주 진행

모집마감

2019년 12월 20일(금요일) 오후 3시에 모집이 시작됩니다.