서울 열린 데이터 광장에서 제공하는 공공자전거 대여 이력 정보 데이터를 활용하여 기본적인 데이터 탐색을 진행해보았다.
데이터 출처 : 서울 열린 데이터 광장 > 서울특별시 공공자전거 대여이력 정보
http://data.seoul.go.kr/dataList/OA-15182/F/1/datasetView.do
데이터 형태 , 그래프 출력
In [2]:
import pandas as pd
import numpy as np
import matplotlib as mpl
import matplotlib.pyplot as plt
import seaborn as sns
from scipy import stats
# 노트북 안에 그래프를 그리기 위해
%matplotlib inline
# 그래프에서 격자로 숫자 범위가 눈에 잘 띄도록 ggplot 스타일을 사용
plt.style.use('ggplot')
# 그래프에서 마이너스 폰트 깨지는 문제에 대한 대처
mpl.rcParams['axes.unicode_minus'] = False
from matplotlib import font_manager, rc
font_name = font_manager.FontProperties(fname="c:/Windows/Fonts/malgun.ttf").get_name()
rc('font', family=font_name)
In [3]:
bike = pd.read_csv('../data/bicycle-hourtime-201905-test.csv', parse_dates=["대여일자"] ,encoding='cp949')
bike.head()
Out[3]:
In [4]:
bike.columns
Out[4]:
In [5]:
bike.shape
Out[5]:
In [6]:
bike.info()
In [7]:
bike["년"] = bike["대여일자"].dt.year
bike["월"] = bike["대여일자"].dt.month
bike["일"] = bike["대여일자"].dt.day
In [8]:
bike.shape
Out[8]:
In [9]:
bike.describe()
Out[9]:
In [10]:
bike.isnull().sum()
Out[10]:
In [11]:
import missingno as msno
msno.matrix(bike, figsize=(12,5))
Out[11]:
In [12]:
bike.head()
Out[12]:
관련 글 모아보기
[DataSicence/Data Analysis] - [python] 공공자전거 데이터 분석(1) - 데이터 형태 그래프 출력
[DataSicence/Data Analysis] - [python] 공공자전거 데이터 분석(2) - histogram
[DataSicence/Data Analysis] - [python] 공공자전거 데이터 분석(3) - 상관관계 분석
[DataSicence/Data Analysis] - [python] 공공자전거 데이터 분석(4) - pivot data 생성
'Study > Data Analysis' 카테고리의 다른 글
[python] 공공자전거 데이터 분석(4) - pivot data 생성 (0) | 2020.04.28 |
---|---|
[python] 공공자전거 데이터 분석(3) - 상관관계 분석 (0) | 2020.04.27 |
[python] 공공자전거 데이터 분석(2) - histogram (0) | 2020.04.26 |