EDA 2

[kaggle][필사] Zillow Prize: Zillow’s Home Value Prediction (2)

이번 대회는 'Zestimate'라는 기관에서 지난 11년간 각 재산에 대한 데이터를 활요하여 통계 및 머신러닝 보통 부동산 집값 예측이라고 하면, 집과 관련된 여러변수들로 모델을 구축하여 집값을 예측하는 것 같지만, 이번 대회의 주제는 잔차 오차를 개선하기 위한 모델을 구축하는 것이 목표다. 여기서 잔차는 에러 즉, 실제 부동산값 - 예측 부동산 값을 의미한다. SRK 님의 Simple Exploration Notebook - Zillow Prize 커널을 참고하여 target value와 관련있는 변수들 중심으로 데이터를 살펴보았다. 목록 [kaggle][필사] Zillow Prize: Zillow’s Home Value Prediction (1) 더보기 1.train data 1) Logerror ..

Competition/Kaggle 2020.10.19

[kaggle] Porto serqruo safe prediction(Bert Carremans) (1)

이번 주제는 Porto serqruo safe prediction 로, 목표는 운전자가 내년에 자동차 보험 청구를 시작할 확률울 예측하는 모델을 구축 하는 것이다. 이번 필사는 Bert Carremans님의 코드를 참고하였다. 총 2가지 포스트로 내용을 나누었고, 순서는 아래와 같다. Porto serqruo safe prediction(Bert Carremans) (1) 더보기 1.데이터확인 2. Metadata 3. 기술 통계(Description Statistics) 4. 불균형 클래스 처리 5. 데이터 품질검사 Porto serqruo safe prediction(Bert Carremans) (2) 더보기 6. EDA Visualization 7. Feature Engineering 8. Feat..

Competition/Kaggle 2020.09.05