본문 바로가기

캐글2

캐글(kaggle) - Titanic 나의 캐글 노트북 : [titanic 타이타닉] 문제 데이터 사이언스, 머신러닝, 캐글 입문자가 항상 추천 받는 타이타닉이다. 이 타이타닉 문제는 타이타닉 사고 당시 탑승했던 사람들의 신상 정보를 바탕으로 사람들의 생존 여부를 예측하는 모델을 만들어내는 것이다. 데이터 분석 도구(pandas, numpy), 데이터 시각화 도구(matplotlib, seaborn, plotly), 머신 러닝 도구(sklearn)를 사용할 것이다. 이 내용들은 이유한님의 타이타닉 튜토리얼을 보고 공부하며 만들었다. 로드맵 dataset확인 & 문제인식 EDA(exploratoty data analysis) - 탐색적 데이터 분석 여러 feature들을 개별적으로 분석하고 feature들 간의 상관관계를 확인한다. featu.. 2022. 2. 17.
캐글(kaggle) 필사하며 공부하기 머신러닝을 공부하고 싶어 검색을 하며 찾아다니던 도중 찾은 이유한님의 공부법이다. 원래 머신러닝의 기초부터 공부하고 있었는데 기본기도 없고, 수학도 어렵고 이게 제대로 공부하고 있는게 맞는 건가 의구심이 들던 도중이였다. 현재 캐글 대회 그랜드마스터를 달성하신 이유한님의 공부법은 커널을 3번 필사하고 다음 커널로 넘어가 똑같이 공부하는 방법이다. "코드를 필사하기만 하는데 실력이 늘까?"라는 의구심을 품었지만 첫번째 커널의 필사 1회 완주 후 생각이 180도 바뀌었다. 커널을 따라 쓰면서 이해가 안되는 부분이 많았지만, 오류가 발생한 부분을 수정하면서 코드에 사용되는 라이브러리의 역할과 기능에 대해 점점 알아가는 것이 재미있었다. 첫번째로 필사하고 있는 타이타닉 대회문제의 3회 필사가 끝나면 정리하여 업.. 2022. 1. 27.