PandasでDataFrameの行数を取得する方法
Pandasでは、DataFrameの行数を簡単に取得するためにいくつかの方法が用意されています。最も一般的な方法はdf.shape[0]を使うものですが、他にも効率的な手段があります。
shape属性を使う方法
df.shapeはDataFrameの行数と列数をタプルで返します。行数だけを取得したい場合はdf.shape[0]を使用します。
import pandas as pd
df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})
print(df.shape[0]) # 出力: 3
len()関数を使う方法
len(df)は、DataFrameの行数を返す簡単な方法です。shape[0]と同じ結果を得ることができます。
print(len(df)) # 出力: 3
len(df.index)を使う方法
df.indexはDataFrameのインデックスを取得し、それをlen()で包むことで行数を得られます。この方法は最も高速です。
print(len(df.index)) # 出力: 3
パフォーマンスの違い
実際のパフォーマンスでは、len(df.index)が最も高速であり、大規模なデータセットを扱う場合に有利です。ただし、len(df)やdf.shape[0]も直感的で使いやすい方法です。
まとめ
DataFrameの行数を取得する方法には複数の選択肢があります。shape[0]が最も一般的で、len(df.index)がパフォーマンス的に最も効率的です。状況に応じて使い分けると良いでしょう。