Competition/Kaggle 31

[kaggle] Porto serqruo safe prediction(Bert Carremans) (1)

이번 주제는 Porto serqruo safe prediction 로, 목표는 운전자가 내년에 자동차 보험 청구를 시작할 확률울 예측하는 모델을 구축 하는 것이다. 이번 필사는 Bert Carremans님의 코드를 참고하였다. 총 2가지 포스트로 내용을 나누었고, 순서는 아래와 같다. Porto serqruo safe prediction(Bert Carremans) (1) 더보기 1.데이터확인 2. Metadata 3. 기술 통계(Description Statistics) 4. 불균형 클래스 처리 5. 데이터 품질검사 Porto serqruo safe prediction(Bert Carremans) (2) 더보기 6. EDA Visualization 7. Feature Engineering 8. Feat..

Competition/Kaggle 2020.09.05

[kaggle] Titanic: Machine Learning from Disaster (4)

캐글에서 가장 유명한 주제중 하나인 타이타닉 탑승자 생존률 구하기 데이터 분석을 캐글 코리아의 타이타닉 튜토리얼을 참고 하여 진행해보았다. 총 4가지 부분으로 나눴으며 순서는 아래와 같다. 1) DataSet 확인 2) EDA (Exploratory data analysis) 3) Modeling 4) Machin Learning In [49]: import numpy as np import pandas as pd from pandas import Series import matplotlib.pyplot as plt import seaborn as sns plt.style.use('seaborn') sns.set(font_scale=2.5) In [50]: import plotly.offline as p..

Competition/Kaggle 2020.09.04

[kaggle] Titanic: Machine Learning from Disaster (3)

캐글에서 가장 유명한 주제중 하나인 타이타닉 탑승자 생존률 구하기 데이터 분석을 캐글 코리아의 타이타닉 튜토리얼을 참고 하여 진행해보았다. 총 4가지 부분으로 나눴으며 순서는 아래와 같다. 1) DataSet 확인 2) EDA (Exploratory data analysis) 3) Modeling 4) Machin Learning In [49]: import numpy as np import pandas as pd from pandas import Series import matplotlib.pyplot as plt import seaborn as sns plt.style.use('seaborn') sns.set(font_scale=2.5) In [50]: import plotly.offline as p..

Competition/Kaggle 2020.09.02

[kaggle] Titanic: Machine Learning from Disaster (2)

캐글에서 가장 유명한 주제중 하나인 타이타닉 탑승자 생존률 구하기 데이터 분석을 캐글 코리아의 타이타닉 튜토리얼을 참고 하여 진행해보았다. 총 4가지 부분으로 나눴으며 순서는 아래와 같다. 1) DataSet 확인 2) EDA (Exploratory data analysis) 3) Modeling 4) Machin Learning In [53]: import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sns In [54]: plt.style.use('seaborn') sns.set(font_scale=2.5) In [55]: import missingno as msno import warnings wa..

Competition/Kaggle 2020.09.01

[kaggle] Titanic: Machine Learning from Disaster (1)

캐글에서 가장 유명한 주제중 하나인 타이타닉 탑승자 생존률 구하기 데이터 분석을 캐글 코리아의 타이타닉 튜토리얼을 참고 하여 진행해보았다. 총 4가지 부분으로 나눴으며 순서는 아래와 같다. 1) DataSet 확인 2) EDA (Exploratory data analysis) 3) Modeling 4) Machin Learning In [53]: import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sns In [54]: plt.style.use('seaborn') sns.set(font_scale=2.5) In [55]: import missingno as msno import warnings wa..

Competition/Kaggle 2020.08.31

[kaggle] House Prices: Advanced Regression Techniques - 상관관계, 정규 분포

Kaggle에서 진행하는 House Prices: Advanced Regression Techniques 데이터셋을 분석하였다. Regresssion을 통한 집값 예측하기 위해 그전에 아래 4가지 단계로 나누어 데이터 탐색을 진행하였다. 출처 : https://www.kaggle.com/c/house-prices-advanced-regression-techniques/data House Prices: Advanced Regression Techniques Predict sales prices and practice feature engineering, RFs, and gradient boosting www.kaggle.com 상관관계, 정규 분포 In [22]: # 면적과 가격의 상관관계 분석 corrM..

Competition/Kaggle 2020.04.30

[kaggle] House Prices: Advanced Regression Techniques (3) 그래프

Kaggle에서 진행하는 House Prices: Advanced Regression Techniques 데이터셋을 분석하였다. Regresssion을 통한 집값 예측하기 위해 그전에 아래 4가지 단계로 나누어 데이터 탐색을 진행하였다. 출처 : https://www.kaggle.com/c/house-prices-advanced-regression-techniques/data House Prices: Advanced Regression Techniques Predict sales prices and practice feature engineering, RFs, and gradient boosting www.kaggle.com 그래프 수치형 데이터 차트 보기¶ In [18]: ##### 범주형 변수와 가격..

Competition/Kaggle 2020.04.28

[kaggle] House Prices: Advanced Regression Techniques (2) 범주형 데이터 인코딩

Kaggle에서 진행하는 House Prices: Advanced Regression Techniques 데이터셋을 분석하였다. Regresssion을 통한 집값 예측하기 위해 그전에 아래 4가지 단계로 나누어 데이터 탐색을 진행하였다. 출처 : https://www.kaggle.com/c/house-prices-advanced-regression-techniques/data House Prices: Advanced Regression Techniques Predict sales prices and practice feature engineering, RFs, and gradient boosting www.kaggle.com 범주형 데이터 인코딩 범주형 데이터 인코딩 (One-hot-Coding )¶ I..

Competition/Kaggle 2020.04.27

[kaggle] House Prices: Advanced Regression Techniques (1) 데이터 형태

Kaggle에서 진행하는 House Prices: Advanced Regression Techniques 데이터셋을 분석하였다. Regresssion을 통한 집값 예측하기 위해 그전에 아래 4가지 단계로 나누어 데이터 탐색을 진행하였다. 출처 : https://www.kaggle.com/c/house-prices-advanced-regression-techniques/data House Prices: Advanced Regression Techniques Predict sales prices and practice feature engineering, RFs, and gradient boosting www.kaggle.com 데이터 형태 데이터 불러오기¶ In [1]: import pandas as pd..

Competition/Kaggle 2020.04.26

캐클 스터디 커리큘럼

데이터 분석 공부를 하기 위해 캐글 커리큘럼 관련 정보를 찾던 중에 `캐글코리아` 보석과 같은 사이트를 찾아냈다. 캐글 코리아 https://kaggle-kr.tistory.com/ Kaggle-KR No official relationship with Kaggle kaggle-kr.tistory.com 홈페이지 들어가보면 캐글 관련해서 분석 내용이나 가끔식 대회를 위한 팀원 모집도 한다. 하지만,,. 캐글 초보인 나는 이유한님이 올려주신 캐글 커리큘럼을 따라 캐글 필사에 도전하려고 한다. 이유한님 캐글 커리큘럼 https://kaggle-kr.tistory.com/32 [이유한님] 캐글 코리아 캐글 스터디 커널 커리큘럼 유한님이 이전에 공유해주신 캐글 커널 커리큘럼 정리본입니다. 다들 Keep Goin..

Competition/Kaggle 2020.03.11