Competition/Kaggle 31

[kaggle][필사] New York City Taxi Duration (2)

이번 필사 주제는 New York City Taxi Duration 이다. 이 대회는 뉴욕시에서 택시 여행의 총 승차 시간을 예측하는 모델을 구축하는 것이 목표이다. AiswaryaRamachandran님의 커널을 참고하여 필사를 진행했다. 목록 New York City Taxi Duration (1) 더보기 1. 데이터 분석 준비 1) data description 2. 데이터 살펴보기 1) missing data 찾기 2) 분석을 위한 새로운 컬럼 생성 New York City Taxi Duration (2) 더보기 3. Exploratory Data Analysis 1) HeatMap 2) 시간, 요일 3) 거리, 지역, 속도 New York City Taxi Duration (3) 더보기 4. F..

Competition/Kaggle 2020.10.04

[kaggle][필사] New York City Taxi Duration (1)

이번 필사 주제는 New York City Taxi Duration 이다. 이 대회는 뉴욕시에서 택시 여행의 총 승차 시간을 예측하는 모델을 구축하는 것이 목표이다. AiswaryaRamachandran님의 커널을 참고하여 필사를 진행했다. 목록 New York City Taxi Duration (1) 더보기 1. 데이터 분석 준비 1) data description 2. 데이터 살펴보기 1) missing data 찾기 2) 분석을 위한 새로운 컬럼 생성 New York City Taxi Duration (2) 더보기 3. Exploratory Data Analysis 1) HeatMap 2) 시간, 요일 3) 거리, 지역, 속도 New York City Taxi Duration (3) 더보기 4. F..

Competition/Kaggle 2020.10.02

[kaggle][필사] Statoil/C-CORE Iceberg Classifier Challenge

이번 필사 주제는 Statoil/C-CORE Iceberg Classifier Challenge 이다. 이미지 데이터로 빙하(iceberg)인지, 선박(ship)인지 구분하는 이진 분류를 사용하는 주제이다. 데이터 설명을 보면, 주어진 데이터는 특정 발생 각도에서 신호 펄스를 전송한 다음 다시 신호 펄스를 재코딩하여 보낸 백스케터( backscatter) 계수라고 한다. 흠.. 데이터 설명부터가 어렵다고 지레 겁먹진 말고, 차근 차근 따라가보자. In [2]: import numpy as np import pandas as pd from sklearn.model_selection import train_test_split from os.path import join as opj from matplotli..

Competition/Kaggle 2020.09.25

[kaggle][필사] Costa Rican Household Proverty (3)

이번 주제는 Costa Rican Household Proverty 로, 목표는 미주 개발 은행(Inter-American Development Bank)의 세계에서 가장 빈곤 한 일부 가정의 소득 자격을 예측을 하는 것이다. 보통 세계 최 빈곤층은 그들의 자격을 증명하기가 어려운데, 라틴 아메리카는 알고리즘을 통해 소득자격을 확인한다. 예를 들어 프록시 수단 테스트(PMT)을 통해 벽과 천장의 재료 또는 집에서 발견 된 자산과 같은 가족의 관찰 가능한 가구 속성을 고려하는 것이다. 이를 바탕으로 다양한 feature가 제공 되었는데, LGBMClassifier를 사용하여 소득 자격을 예측해본다. 이번 필사는 이유한님의 코드를 참고하였다. 목록 Costa Rican Household Proverty (1..

Competition/Kaggle 2020.09.22

[kaggle][필사] Costa Rican Household Proverty (2)

이번 주제는 Costa Rican Household Proverty 로, 목표는 미주 개발 은행(Inter-American Development Bank)의 세계에서 가장 빈곤 한 일부 가정의 소득 자격을 예측을 하는 것이다. 보통 세계 최 빈곤층은 그들의 자격을 증명하기가 어려운데, 라틴 아메리카는 알고리즘을 통해 소득자격을 확인한다. 예를 들어 프록시 수단 테스트(PMT)을 통해 벽과 천장의 재료 또는 집에서 발견 된 자산과 같은 가족의 관찰 가능한 가구 속성을 고려하는 것이다. 이를 바탕으로 다양한 feature가 제공 되었는데, LGBMClassifier를 사용하여 소득 자격을 예측해본다. 이번 필사는 이유한님의 코드를 참고하였다. 목록 Costa Rican Household Proverty (1..

Competition/Kaggle 2020.09.20

[kaggle][필사] Costa Rican Household Proverty (1)

이번 주제는 Costa Rican Household Proverty 로, 목표는 미주 개발 은행(Inter-American Development Bank)의 세계에서 가장 빈곤 한 일부 가정의 소득 자격을 예측을 하는 것이다. 보통 세계 최 빈곤층은 그들의 자격을 증명하기가 어려운데, 라틴 아메리카는 알고리즘을 통해 소득자격을 확인한다. 예를 들어 프록시 수단 테스트(PMT)을 통해 벽과 천장의 재료 또는 집에서 발견 된 자산과 같은 가족의 관찰 가능한 가구 속성을 고려하는 것이다. 이를 바탕으로 다양한 feature가 제공 되었는데, LGBMClassifier를 사용하여 소득 자격을 예측해본다. 이번 필사는 이유한님의 코드를 참고하였다. 목록 Costa Rican Household Proverty (1..

Competition/Kaggle 2020.09.19

[kaggle][필사] Porto serqruo safe prediction(Gabriel Preda) (3)

이번 주제는 Porto serqruo safe prediction 로, 목표는 운전자가 내년에 자동차 보험 청구를 시작할 확률울 예측하는 모델을 구축 하는 것이다. 이번 필사는 Gabriel Preda님의 코드를 참고하였다. 총 3가지 포스트로 내용을 나누었고, 순서는 아래와 같다. Porto serqruo safe prediction(Gabriel Preda) (1) 더보기 1. 데이터 분석 준비 2. 데이터 설명 3. Metadata 설명 Porto serqruo safe prediction(Gabriel Preda) (2) 더보기 4. 데이터 분석과 통계 Porto serqruo safe prediction(Gabriel Preda) (3) 더보기 5. 모델을 위한 데이터 준비 6. 모델 준비 7...

Competition/Kaggle 2020.09.10

[kaggle][필사] Porto serqruo safe prediction(Gabriel Preda) (2)

이번 주제는 Porto serqruo safe prediction 로, 목표는 운전자가 내년에 자동차 보험 청구를 시작할 확률울 예측하는 모델을 구축 하는 것이다. 이번 필사는 Gabriel Preda님의 코드를 참고하였다. 총 3가지 포스트로 내용을 나누었고, 순서는 아래와 같다. Porto serqruo safe prediction(Gabriel Preda) (1) 더보기 1. 데이터 분석 준비 2. 데이터 설명 3. Metadata 설명 Porto serqruo safe prediction(Gabriel Preda) (2) 더보기 4. 데이터 분석과 통계 Porto serqruo safe prediction(Gabriel Preda) (3) 더보기 5. 모델을 위한 데이터 준비 6. 모델 준비 7...

Competition/Kaggle 2020.09.08

[kaggle][필사] Porto serqruo safe prediction(Gabriel Preda) (1)

더보기 이번 주제는 Porto serqruo safe prediction 로, 목표는 운전자가 내년에 자동차 보험 청구를 시작할 확률울 예측하는 모델을 구축 하는 것이다. 이번 필사는 Gabriel Preda님의 코드를 참고하였다. 총 3가지 포스트로 내용을 나누었고, 순서는 아래와 같다. Porto serqruo safe prediction(Gabriel Preda) (1) 더보기 1. 데이터 분석 준비 2. 데이터 설명 3. Metadata 설명 Porto serqruo safe prediction(Gabriel Preda) (2) 더보기 4. 데이터 분석과 통계 Porto serqruo safe prediction(Gabriel Preda) (3) 더보기 5. 모델을 위한 데이터 준비 6. 모델 준..

Competition/Kaggle 2020.09.07

[kaggle] Porto serqruo safe prediction(Bert Carremans) (2)

이번 주제는 Porto serqruo safe prediction 로, 목표는 운전자가 내년에 자동차 보험 청구를 시작할 확률울 예측하는 모델을 구축 하는 것이다. 이번 필사는 Bert Carremans님의 코드를 참고하였다. 총 2가지 포스트로 내용을 나누었고, 순서는 아래와 같다. Porto serqruo safe prediction(Bert Carremans) (1) 더보기 1.데이터확인 2. Metadata 3. 기술 통계(Description Statistics) 4. 불균형 클래스 처리 5. 데이터 품질검사 Porto serqruo safe prediction(Bert Carremans) (2) 더보기 6. EDA Visualization 7. Feature Engineering 8. Feat..

Competition/Kaggle 2020.09.06