data-product-id="11496" data-recruit-progress="0" data-activity-progress="0"
- 파이썬으로 데이터 분석을 경험해보고 싶으신 분들
- kaggle에 입문하고 싶으신 분들
쉬움 (1단계) ~ 어려움(5단계)
- 데이터 분석 방법을 배워봅니다.
- kaggle에서 제공되는 다양한 data를 활용하여 분석해봅니다. 기초적인 머신러닝을 배워봅니다.
2. 1번 과정에서 실제 코드도 입력하며 코드에 익숙해집니다.
3. 마지막 2~3주는 팀을 꾸려 데이터 분석을 진행해보고 노하우 등을 발표하며 공유합니다.
주차 | 모임내용 | 학습자료 |
---|---|---|
1 주차 | 모임 설명 및 환경설정과 파이썬 언어에 대한 설명 | 퍼실 정리 자료 |
2 주차 | python numpy, pandas 사용 방법 및 타이타닉 캐글 EDA 실습 | https://www.kaggle.com/c/titanic 및 퍼실 정리 자료 |
3 주차 | iris data를 활용하여 kfold, stratified kfold, gridsearch를 학습. 이후 kaggle의 타이타닉 데이터로 복습을 진행 | https://www.kaggle.com/c/titanic 및 퍼실 정리 자료 |
4 주차 | 평가 방법 학습(accuracy, confusion matrix, precision, recall, f1-score, roc-auc) 및 kaggle pima indian 데이터를 활용한 실습 | https://www.kaggle.com/uciml/pima-indians-diabetes-database 및 퍼실 정리 자료 |
5 주차 | ensemble(voting, bagging, boosting 등) 학습. human activity 데이터를 활용한 실습 | https://archive.ics.uci.edu/ml/datasets/human+activity+recognition+using+smartphones 및 퍼실 정리 자료 |
6 주차 | random forest, gradient boosting 학습 및 human activity 데이터를 활용한 실습 | https://archive.ics.uci.edu/ml/datasets/human+activity+recognition+using+smartphones 및 퍼실 정리 자료 |
7 주차 | XGBoost, LightBoost 학습 및 kaggle santander 예제를 활용한 실습 | https://www.kaggle.com/c/santander-customer-satisfaction 및 퍼실 정리 자료 |
8 주차 | 이상치(outlier) 탐지, 오버샘플링, 언더샘플링 방법 학습 및 kaggle credit card fraud data로 실습 | https://www.kaggle.com/mlg-ulb/creditcardfraud 및 퍼실 정리 자료 |
9 주차 | stacking 학습 및 타이타닉 전체 예제 학습 | https://www.kaggle.com/c/titanic 및 퍼실 정리 자료 |
10 주차 | 팀 활동을 통한 데이터 분석 실습 프로젝트 | |
11 주차 | 팀 활동을 통한 데이터 분석 실습 프로젝트 |
이수진
ST Unitas에서 Data Science팀에 소속되어 일하고 있습니다.
개인 공부로 머신러닝, 딥러닝을 하고 있고 공부 내용은 블로그에 정리하고 있습니다!
풀잎스쿨은 5기부터 시작했으며 7기에는 자연어 처리 기초반 퍼실도 담당했습니다.
제 블로그를 방문하신 분들께서 댓글 문의나 메일로 파이썬 기초와 관련된 질문을 많이 하십니다.
머신러닝과 딥러닝이 유행하면서 '한 번 해봐야지!' 하고 배경지식 없이 접근하셨다가 어려움을 겪는 분들이 많아 안타까운 마음이 있었습니다.
그래서 본 풀잎 과정에서는 이러한 데이터 분석과 머신러닝에 대한 기초를 다룹니다. 기초가 부족하신 분들은 오셔서 들으시면 도움이 될 수 있지 않을까 생각합니다!
ST Unitas에서 Data Science팀에 소속되어 일하고 있습니다.
개인 공부로 머신러닝, 딥러닝을 하고 있고 공부 내용은 블로그에 정리하고 있습니다!
풀잎스쿨은 5기부터 시작했으며 7기에는 자연어 처리 기초반 퍼실도 담당했습니다.
제 블로그를 방문하신 분들께서 댓글 문의나 메일로 파이썬 기초와 관련된 질문을 많이 하십니다.
머신러닝과 딥러닝이 유행하면서 '한 번 해봐야지!' 하고 배경지식 없이 접근하셨다가 어려움을 겪는 분들이 많아 안타까운 마음이 있었습니다.
그래서 본 풀잎 과정에서는 이러한 데이터 분석과 머신러닝에 대한 기초를 다룹니다. 기초가 부족하신 분들은 오셔서 들으시면 도움이 될 수 있지 않을까 생각합니다!
풀잎스쿨 신청 및 결제를 위해서 로그인을 해주세요
본 과정은 파이썬을 활용한 데이터 분석에 적응 하는 것을 도와드립니다.
나아가 kaggle 대회 데이터를 활용한 실습 분석과 scikit learn을 활용한 머신러닝 기법들에 대해서도 학습합니다.
마지막 2~3주 동안은 팀을 꾸려서 예제를 분석해보고 자신의 노하우를 소개하는 시간을 갖도록하여 자신감을 UP! 할 예정입니다.