캐글의 예제을 중심으로 알고리즘과 코드에 대한 상세설명이 있는 책을 선정해서 책의 설명 내용을 공유하고 예제코드도 실행해 보는 방식으로 진행합니다.
비교적 상세하게 설명이 되어있는 책이라서 처음 접해보는 사람도 자세히 이해할 수 있을 것이고, 참가자 중에서 더 자세히 아는 사람의 도움을 받을 수도 있을 것으로 기대합니다.
캐글 분석기법 파헤치기
진행일시
매주 (2시간)
모집현황

0.000000명 신청가능

진행장소
캠퍼스
Untitled-2 학습대상

머신러닝, 딥러닝, 파이썬 입문서를 일독하고 코드를 실행해 봤지만 자세한 내용을 몰라서 응용에는 한계를 느끼는 사람
캐글에 올라온 문제를 시험 삼아서라도 답안을 작성해서 제출을 해본 경험이 있는 사람.
좋다는 책은 부지런히 사서 모았는데 어려워서 코드만 실행해보고 대충 이해한 사람

위의 경우에 해당되는데 그 이상의 수준으로 점프하고 싶은 사람

Untitled-2 선수지식

파이썬 기초
머신러닝 기초(지도학습과 비지도학습의 대표적 알고리즘에 대한 이해)
텍스트 분석 기초(용어를 이해하는 수준)

Untitled-2 과목난이도

쉬움 (1단계) ~ 어려움(5단계)

학습목표

교재를 처음부터 끝까지 마스터함으로써 실제 문제에 당면했을 때 문제해결 능력을 갖추는 것

Untitled-2 학습 및 참고자료

주교재: 파이썬 머신러닝 완벽가이드(위키북스 간, 권철민 지음)
부교재: 머신러닝 탐구생활(BJPublic간, 정권우 지음)

Untitled-2 운영방식

- 주교재의 내용을 매주 1장씩 따라 가려고 합니다.(난이도가 높거나 분량이 많은 챕터는 2번으로 나눠서 진행합니다)
- 매주 정해진 발표자가 스터디를 진행합니다.
- 발표자는 교재 내용에 대한 요약 및 관련 내용을 보강한 Presentation과 코드 리뷰를 진행합니다.(발표자와 코드 리뷰를 분리하여 분담하고 협업)

Untitled-2 커리큘럼
사전학습 / 이론+실습

주차 모임내용 학습자료
1 주차 파이썬 머신러닝 생태계를 구성하는 주요 패키지 주교재 1장 : 파이썬 기반의 머신러닝과 생태계 이해
2 주차 붓꽃 품종 예측, 모델 selection, 데이터 전처리 주교재 2장 : 싸이킷런으로 시작하는 머신러닝
3 주차 피마 인디언 당뇨병 예측하기, 정확도, 오차행렬, 정밀도와 재현율, F1스코어, ROC와 AUC 주교재 3장 : 평가
4 주차 결정트리, 앙상블(Voting), 랜덤 포레스트, GBM(Gradient Boosting Machine), XGBost(extra Gradient Boost), LightGBM), Stacking앙상블 주교재 4장 : 분류
5 주차 산탄데르 고객만족 예측, 신용카드 사기 검출, 주교재 4장 : 분류
6 주차 보스턴 주택 가격 회귀 예측, 자전거 대여 수요 예측, 경사하강법, 다항회귀, 릿지/라쏘/엘라스틱넷, 로지스틱 회귀, 회귀 트리 주교재 5장 : 회귀
7 주차 PCA, LDA, SVD, NMF 주교재 6장 : 차원축소
8 주차 K-평균, 군집평가(Cluster Evaluation), 평균이동(Mean Shift), GMM(Gaussian Mixture Model), DBSCAN, 고객 세그멘테이션 주교재 7장 : 군집화
9 주차 텍스트 전처리, BOW(Bag of Words), 텍스트 분류, 감성분석, 토픽모델링, 문서 군집화, 문서 유사도, 한글 텍스트 처리 주교재 8장 : 텍스트 분석
10 주차 네이버 영화 평점 감성분석, Mercari Price Suggestion Challenge 네이버 영화 평점 감성분석, Mercari Price Suggestion Challenge 주교재 8장 : 텍스트 분석
11 주차 콘텐츠 기반 필터링 추천시스템, 최근접 이웃 협업 필터링, 잠재요인 협업 필터링, 아이템기반 협업 필터링 주교재 9장 : 추천시스템
Untitled-2 퍼실소개
홍순근

홍순근

코스닥 상장 회사에서 지능정보기술연구소장을 맡고 있습니다. 지능정보기술을 익히기 위해서 무작정 시작한 연구과제가 2개인데 벌써 3년차에 접어들고 있습니다.
주변에 도움을 받을 사람을 찾기 힘들어서 직접 코드를 보기 시작한 게 2년째입니다. 금년에 회사 앞에 있는 모두연에 찾아와서 몇 개 모임을 참가해 보니 지금까지 참가했던 어떤 강의보다 도움이 되었고, 최근에는 데이터 분석의 실전 경험과 지식을 얻고자 캐글에 관심을 갖게 되었습니다.
특히, 사람들이 공통적으로 추천하는 책이 있어서 그 책을 마스터하고자 과정을 개설했습니다.

월 77,000원 / 3개월 231,000원

2020-01-10 부터 총 11주 진행

모집마감

2019년 12월 20일(금요일) 오후 3시에 모집이 시작됩니다.