Competition 117

[kaggle][필사] Costa Rican Household Proverty (2)

이번 주제는 Costa Rican Household Proverty 로, 목표는 미주 개발 은행(Inter-American Development Bank)의 세계에서 가장 빈곤 한 일부 가정의 소득 자격을 예측을 하는 것이다. 보통 세계 최 빈곤층은 그들의 자격을 증명하기가 어려운데, 라틴 아메리카는 알고리즘을 통해 소득자격을 확인한다. 예를 들어 프록시 수단 테스트(PMT)을 통해 벽과 천장의 재료 또는 집에서 발견 된 자산과 같은 가족의 관찰 가능한 가구 속성을 고려하는 것이다. 이를 바탕으로 다양한 feature가 제공 되었는데, LGBMClassifier를 사용하여 소득 자격을 예측해본다. 이번 필사는 이유한님의 코드를 참고하였다. 목록 Costa Rican Household Proverty (1..

Competition/Kaggle 2020.09.20

[kaggle][필사] Costa Rican Household Proverty (1)

이번 주제는 Costa Rican Household Proverty 로, 목표는 미주 개발 은행(Inter-American Development Bank)의 세계에서 가장 빈곤 한 일부 가정의 소득 자격을 예측을 하는 것이다. 보통 세계 최 빈곤층은 그들의 자격을 증명하기가 어려운데, 라틴 아메리카는 알고리즘을 통해 소득자격을 확인한다. 예를 들어 프록시 수단 테스트(PMT)을 통해 벽과 천장의 재료 또는 집에서 발견 된 자산과 같은 가족의 관찰 가능한 가구 속성을 고려하는 것이다. 이를 바탕으로 다양한 feature가 제공 되었는데, LGBMClassifier를 사용하여 소득 자격을 예측해본다. 이번 필사는 이유한님의 코드를 참고하였다. 목록 Costa Rican Household Proverty (1..

Competition/Kaggle 2020.09.19

[kaggle][필사] Porto serqruo safe prediction(Gabriel Preda) (3)

이번 주제는 Porto serqruo safe prediction 로, 목표는 운전자가 내년에 자동차 보험 청구를 시작할 확률울 예측하는 모델을 구축 하는 것이다. 이번 필사는 Gabriel Preda님의 코드를 참고하였다. 총 3가지 포스트로 내용을 나누었고, 순서는 아래와 같다. Porto serqruo safe prediction(Gabriel Preda) (1) 더보기 1. 데이터 분석 준비 2. 데이터 설명 3. Metadata 설명 Porto serqruo safe prediction(Gabriel Preda) (2) 더보기 4. 데이터 분석과 통계 Porto serqruo safe prediction(Gabriel Preda) (3) 더보기 5. 모델을 위한 데이터 준비 6. 모델 준비 7...

Competition/Kaggle 2020.09.10

[kaggle][필사] Porto serqruo safe prediction(Gabriel Preda) (2)

이번 주제는 Porto serqruo safe prediction 로, 목표는 운전자가 내년에 자동차 보험 청구를 시작할 확률울 예측하는 모델을 구축 하는 것이다. 이번 필사는 Gabriel Preda님의 코드를 참고하였다. 총 3가지 포스트로 내용을 나누었고, 순서는 아래와 같다. Porto serqruo safe prediction(Gabriel Preda) (1) 더보기 1. 데이터 분석 준비 2. 데이터 설명 3. Metadata 설명 Porto serqruo safe prediction(Gabriel Preda) (2) 더보기 4. 데이터 분석과 통계 Porto serqruo safe prediction(Gabriel Preda) (3) 더보기 5. 모델을 위한 데이터 준비 6. 모델 준비 7...

Competition/Kaggle 2020.09.08

[kaggle][필사] Porto serqruo safe prediction(Gabriel Preda) (1)

더보기 이번 주제는 Porto serqruo safe prediction 로, 목표는 운전자가 내년에 자동차 보험 청구를 시작할 확률울 예측하는 모델을 구축 하는 것이다. 이번 필사는 Gabriel Preda님의 코드를 참고하였다. 총 3가지 포스트로 내용을 나누었고, 순서는 아래와 같다. Porto serqruo safe prediction(Gabriel Preda) (1) 더보기 1. 데이터 분석 준비 2. 데이터 설명 3. Metadata 설명 Porto serqruo safe prediction(Gabriel Preda) (2) 더보기 4. 데이터 분석과 통계 Porto serqruo safe prediction(Gabriel Preda) (3) 더보기 5. 모델을 위한 데이터 준비 6. 모델 준..

Competition/Kaggle 2020.09.07

[kaggle] Porto serqruo safe prediction(Bert Carremans) (2)

이번 주제는 Porto serqruo safe prediction 로, 목표는 운전자가 내년에 자동차 보험 청구를 시작할 확률울 예측하는 모델을 구축 하는 것이다. 이번 필사는 Bert Carremans님의 코드를 참고하였다. 총 2가지 포스트로 내용을 나누었고, 순서는 아래와 같다. Porto serqruo safe prediction(Bert Carremans) (1) 더보기 1.데이터확인 2. Metadata 3. 기술 통계(Description Statistics) 4. 불균형 클래스 처리 5. 데이터 품질검사 Porto serqruo safe prediction(Bert Carremans) (2) 더보기 6. EDA Visualization 7. Feature Engineering 8. Feat..

Competition/Kaggle 2020.09.06

[kaggle] Porto serqruo safe prediction(Bert Carremans) (1)

이번 주제는 Porto serqruo safe prediction 로, 목표는 운전자가 내년에 자동차 보험 청구를 시작할 확률울 예측하는 모델을 구축 하는 것이다. 이번 필사는 Bert Carremans님의 코드를 참고하였다. 총 2가지 포스트로 내용을 나누었고, 순서는 아래와 같다. Porto serqruo safe prediction(Bert Carremans) (1) 더보기 1.데이터확인 2. Metadata 3. 기술 통계(Description Statistics) 4. 불균형 클래스 처리 5. 데이터 품질검사 Porto serqruo safe prediction(Bert Carremans) (2) 더보기 6. EDA Visualization 7. Feature Engineering 8. Feat..

Competition/Kaggle 2020.09.05

[kaggle] Titanic: Machine Learning from Disaster (4)

캐글에서 가장 유명한 주제중 하나인 타이타닉 탑승자 생존률 구하기 데이터 분석을 캐글 코리아의 타이타닉 튜토리얼을 참고 하여 진행해보았다. 총 4가지 부분으로 나눴으며 순서는 아래와 같다. 1) DataSet 확인 2) EDA (Exploratory data analysis) 3) Modeling 4) Machin Learning In [49]: import numpy as np import pandas as pd from pandas import Series import matplotlib.pyplot as plt import seaborn as sns plt.style.use('seaborn') sns.set(font_scale=2.5) In [50]: import plotly.offline as p..

Competition/Kaggle 2020.09.04

[kaggle] Titanic: Machine Learning from Disaster (3)

캐글에서 가장 유명한 주제중 하나인 타이타닉 탑승자 생존률 구하기 데이터 분석을 캐글 코리아의 타이타닉 튜토리얼을 참고 하여 진행해보았다. 총 4가지 부분으로 나눴으며 순서는 아래와 같다. 1) DataSet 확인 2) EDA (Exploratory data analysis) 3) Modeling 4) Machin Learning In [49]: import numpy as np import pandas as pd from pandas import Series import matplotlib.pyplot as plt import seaborn as sns plt.style.use('seaborn') sns.set(font_scale=2.5) In [50]: import plotly.offline as p..

Competition/Kaggle 2020.09.02

[kaggle] Titanic: Machine Learning from Disaster (2)

캐글에서 가장 유명한 주제중 하나인 타이타닉 탑승자 생존률 구하기 데이터 분석을 캐글 코리아의 타이타닉 튜토리얼을 참고 하여 진행해보았다. 총 4가지 부분으로 나눴으며 순서는 아래와 같다. 1) DataSet 확인 2) EDA (Exploratory data analysis) 3) Modeling 4) Machin Learning In [53]: import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sns In [54]: plt.style.use('seaborn') sns.set(font_scale=2.5) In [55]: import missingno as msno import warnings wa..

Competition/Kaggle 2020.09.01