jupyter 5

[kaggle] House Prices: Advanced Regression Techniques - 상관관계, 정규 분포

Kaggle에서 진행하는 House Prices: Advanced Regression Techniques 데이터셋을 분석하였다. Regresssion을 통한 집값 예측하기 위해 그전에 아래 4가지 단계로 나누어 데이터 탐색을 진행하였다. 출처 : https://www.kaggle.com/c/house-prices-advanced-regression-techniques/data House Prices: Advanced Regression Techniques Predict sales prices and practice feature engineering, RFs, and gradient boosting www.kaggle.com 상관관계, 정규 분포 In [22]: # 면적과 가격의 상관관계 분석 corrM..

Competition/Kaggle 2020.04.30

[python] 공공자전거 데이터 분석(4) - pivot data 생성

서울 열린 데이터 광장에서 제공하는 공공자전거 대여 이력 정보 데이터를 활용하여 기본적인 데이터 탐색을 진행해보았다. 데이터 출처 : 서울 열린 데이터 광장 > 서울특별시 공공자전거 대여이력 정보 http://data.seoul.go.kr/dataList/OA-15182/F/1/datasetView.do 열린데이터 광장 댓글 입력 열린데이터 광장 데이터셋 댓글 입력 data.seoul.go.kr pivot data 생성 In [1]: import pandas as pd import numpy as np import matplotlib as mpl import matplotlib.pyplot as plt import seaborn as sns from scipy import stats # 노트북 안에 그래..

Study/Data Analysis 2020.04.28

[kaggle] House Prices: Advanced Regression Techniques (2) 범주형 데이터 인코딩

Kaggle에서 진행하는 House Prices: Advanced Regression Techniques 데이터셋을 분석하였다. Regresssion을 통한 집값 예측하기 위해 그전에 아래 4가지 단계로 나누어 데이터 탐색을 진행하였다. 출처 : https://www.kaggle.com/c/house-prices-advanced-regression-techniques/data House Prices: Advanced Regression Techniques Predict sales prices and practice feature engineering, RFs, and gradient boosting www.kaggle.com 범주형 데이터 인코딩 범주형 데이터 인코딩 (One-hot-Coding )¶ I..

Competition/Kaggle 2020.04.27

[kaggle] House Prices: Advanced Regression Techniques (1) 데이터 형태

Kaggle에서 진행하는 House Prices: Advanced Regression Techniques 데이터셋을 분석하였다. Regresssion을 통한 집값 예측하기 위해 그전에 아래 4가지 단계로 나누어 데이터 탐색을 진행하였다. 출처 : https://www.kaggle.com/c/house-prices-advanced-regression-techniques/data House Prices: Advanced Regression Techniques Predict sales prices and practice feature engineering, RFs, and gradient boosting www.kaggle.com 데이터 형태 데이터 불러오기¶ In [1]: import pandas as pd..

Competition/Kaggle 2020.04.26

[python] 공공자전거 데이터 분석(1) - 데이터 형태, 그래프 출력

서울 열린 데이터 광장에서 제공하는 공공자전거 대여 이력 정보 데이터를 활용하여 기본적인 데이터 탐색을 진행해보았다. 데이터 출처 : 서울 열린 데이터 광장 > 서울특별시 공공자전거 대여이력 정보 http://data.seoul.go.kr/dataList/OA-15182/F/1/datasetView.do 열린데이터 광장 댓글 입력 열린데이터 광장 데이터셋 댓글 입력 data.seoul.go.kr 데이터 형태 , 그래프 출력 In [2]: import pandas as pd import numpy as np import matplotlib as mpl import matplotlib.pyplot as plt import seaborn as sns from scipy import stats # 노트북 안에 ..

Study/Data Analysis 2020.04.25