フリーランス　技術調査ブログ

フリーランス/エンジニア　Ruby Python Nodejs Vuejs React Dockerなどの調査技術調査の備忘録

現役エンジニアのパーソナルメンターからマンツーマンで学べる

Pandasのメソッドについて

Pyhthon Pandas

はじめに

気分転換にたまにはPythonを触ってみる。

Pandasのメソッド

以下は、Pandasの機能だが、もっとあるはず・・・。

やりたいこと	メソッド
列名を抽出する	df.columns
最初の2行を選択します	df.iloc [2]
最初の2列を選択します	df.iloc [：、2]
名前で列を選択	df.loc [：、["col1"、 "col2"]]
ランダム番号を選択します。行の	df.sample（n = 10）
ランダムな行の一部を選択します	df.sample（frac = 0.2）
変数の名前を変更します	df.rename（）
インデックスとして列を選択する	df.set_index（）
行または列の削除	df.drop（）
値の並べ替え	df.sort_values（）
変数のグループ化	df.groupby（）
フィルタリング	df.query（）
不足している値を見つける	df.isnull（）
不足している値を削除する	df.dropna（）
重複を削除する	df.drop_duplicates（）
ダミーの作成	pd.get_dummies（）
ランキング	df.rank（）
累計	df.cumsum（）
分位数	df.quantile（）
数値変数の選択	df.select_dtypes（）
2つのデータフレームを連結する	pd.concat（）
共通変数に基づいてマージ	pd.merge（）

変数タイプを知る

dataFrameName.dtypesコマンドを使用して、データフレームに格納されている変数のタイプの情報を抽出できる。

データ型の変更

astype()メソッドで型を変換（キャスト）することができる

一部の行のみを表示するには

デフォルトでは、head（）は最初の5行を表示する。特定の行数を確認したい場合は、括弧内にそれを記載できます。　同様に、tail（）関数はデフォルトで最後の5行を表示します。

カテゴリ変数を定義する

Rのfactors（）関数と同様に、「category」dtypeを使用してPythonにカテゴリ変数を含めることができます。