본 과정은 OCR 분야의 Text Detection, Recognition, End-to-End 관련 최근 주요 논문들의 핵심 내용을 학습하고 구현 코드를 리팩터링 하는 것을 주요 목표로 합니다. Text Detection 의 이해를 위해 근본이 되는 object detection, segmentation 관련 기술들과 Text Recognition의 이해를 위해 근본이 되는 Seq2Seq, CTC 관련 기술들도 리뷰를 합니다.
보일듯 말듯 OCR
Object, OCR, Text Recognition
시작일
매주 2019년 10월 12일
진행일시
매주
모집현황

data-product-id="11845" data-recruit-progress="0" data-activity-progress="0"

진행장소
캠퍼스
학습대상
· 딥러닝, 영상인식, 자연어 처리 분야에 대해 기본적인 학습 후 더 깊이 이해하고 싶으신분
· TF 혹은 Pytorch 를 사용하실 수 있으신 분.. 이면 좋겠지만.. 잘 모르셔도 오셔서 열심히 준비하시고 무엇보다 꾸준히 하실 수 있는 분이시면 좋겠습니다.
과목난이도

쉬움 (1단계) ~ 어려움(5단계)

학습목표
OCR의 기술흐름을 이해할 수 있습니다.
Text Detection 과 Text Recognition, end2end 의 주요 기술 흐름과 방법들을 이해할 수 있습니다.
관련 기술들을 TF나 Pytorch로 구현해 볼 수 있습니다.
운영방식
매주 해당 논문들의 내용 및 코드에 대해 주도적으로 발표할 발표자를 선발하여 진행합니다.
또한 참석자 모두 해당 논문에 대해 사전 학습을 진행하여 관련 기술에 대한 토론를 진행하며 궁금증들을 해소합니다.
선수지식
영상인식 (cs231n) 과 자연어처리 (cs224n) 과정 선수 추천합니다.
TF, Pytorch 관련해서 주요 튜토리얼 코드 학습 역시 추천합니다.
학습 및 참고자료
매주 OCR 관련 논문 2편 내용 및 코드 리뷰
커리큘럼
/
주차 모임내용 학습자료
1 주차 풀잎소개 및 OCR 주요 기술 소개 "Scene Text Detection and Recognition : The Deep Learning Era""
2 주차 Text Detection 논문 1편 리뷰, Text Recognition 논문 1편 리뷰 "What is wrong with scene text recognition model comparisons? dataset and model analysis"
"Omnidirectional Scene Text Detection with Sequential Free Box discretization"
3 주차 Text Detection 논문 1편 리뷰, Text Recognition 논문 1편 리뷰 "Show, Attend and Read:A Simple and Strong Baseline for Irregular Text Recognition"
"Pyramid Mask Text Detector"
4 주차 Text Detection 논문 1편 리뷰, Text Recognition 논문 1편 리뷰 "Focus-Enhanced Scene Text Recognition with Deformable Convolutions"
"Arbitrary Shape Scene Text Detection with Adaptive Text Region Representation"
5 주차 Text Detection 논문 1편 리뷰, Text Recognition 논문 1편 리뷰 "Connectionist Temporal Classification with Maximum Entropy Regularization"
"Shape Robust Text Detection with Progressive Scale Expansion Network"
6 주차 Text Detection 논문 1편 리뷰, Text Recognition 논문 1편 리뷰 "NRTR: A No-Recurrence Sequence-to-Sequence Model For Scene Text Recognition"
"TextField: Learning A Deep Direction Field for Irregular Scene Text Detection"
7 주차 Text Detection 논문 1편 리뷰, Text Recognition 논문 1편 리뷰 "A Simple and Strong Convolutional-Attention Network for Scene Text Recognition"
"CURVE TEXT DETECTION WITH LOCAL SEGMENTATION NETWORK AND CURVE CONNECTION"
8 주차 Text Detection 논문 1편 리뷰, Text Recognition 논문 1편 리뷰 "Visual Re-ranking with Natural Language Understanding for Text Spotting"
"Towards Robust Curve Text Detection with Conditional Spatial Expansion"
9 주차 End-to-End 논문 1편 리뷰, Text Recognition 논문 1편 리뷰 "SAFE: Scale Aware Feature Encoder for Scene Text Recognition"
"Mask TextSpotter: An End-to-End Trainable Neural Network for Spotting Text with Arbitrary Shapes"
10 주차 Text Recognition 논문 2편 리뷰 "Aggregation Cross-Entropy for Sequence Recognition"
"Visual attention models for scene text recognition"
11 주차 Text Recognition 논문 2편 리뷰 "ESIR: End-to-end Scene Text Recognition via Iterative Image Rectification"
"Scene Text Recognition from Two-Dimensional Perspective"
퍼실소개
이성진

이성진

학교에서 영상인식, 이동통신, IoT 를 주로 연구하였고 실용화 및 최적화에 관심이 많습니다. 딥러닝을 연구하는 다양한 배경의 여러분들과 교류하여 서로 배우기를 희망합니다. 특히나 OCR 이라는 주제로 같이 공부하고 싶고 공부하고자 하는 사람들과 만나서 이야기하고 토론하고 싶어 개설 하게 되었습니다. 잘 모르지만 같이 모여서 서로 얘기하고 논의 하다 보면 2달뒤에는 더 나은 우리를 발견하게 될 거라 생각합니다.

학교에서 영상인식, 이동통신, IoT 를 주로 연구하였고 실용화 및 최적화에 관심이 많습니다. 딥러닝을 연구하는 다양한 배경의 여러분들과 교류하여 서로 배우기를 희망합니다. 특히나 OCR 이라는 주제로 같이 공부하고 싶고 공부하고자 하는 사람들과 만나서 이야기하고 토론하고 싶어 개설 하게 되었습니다. 잘 모르지만 같이 모여서 서로 얘기하고 논의 하다 보면 2달뒤에는 더 나은 우리를 발견하게 될 거라 생각합니다.



풀잎스쿨 신청 및 결제를 위해서 로그인을 해주세요