はじめに
国勢調査 / 時系列データ / CSV形式による主要時系列データ
コード
import pandas as pd
import matplotlib as mpl
import matplotlib.pyplot as plt
df = pd.read_csv("./c01.csv",encoding="cp932")
chiba = df.groupby('都道府県名').get_group('千葉県')
print(chiba[['西暦(年)', '人口(総数)']])
plt.figure()
chiba['人口(総数)'].plot()
plt.savefig('./chiba.png')
plt.close('all')
実行結果
西暦(年) 人口(総数)
12 1920 1336155
60 1925 1399257
108 1930 1470121
156 1935 1546394
204 1940 1588425
252 1945 1966862
300 1950 2139037
348 1955 2205060
396 1960 2306010
444 1965 2701770
494 1970 3366624
544 1975 4149147
594 1980 4735424
644 1985 5148163
694 1990 5555429
744 1995 5797782
794 2000 5926285
844 2005 6056462
894 2010 6216289
944 2015 6222666
生成されたグラフ
その他
- 関数の調査のまとめ
pd.read_csv() CSVデータからデータフレームの作成
DataFrame.head() データフレームの最初の5行を表示(デフォルト)
DataFrame.tail() データフレームの最後の5行を表示(デフォルト)
DataFrame['A'] 列「A」の要素へアクセス
DataFrame.corr() 各項目の相関係数
DataFrame.groupby() グルーピングによるデータの集計