Pandasのinfo()メゾットとは
Pandasにはinfo()
メソッドが存在します。info()
メソッドは、Pandasのデータフレームやシリーズの情報を表示するためのメソッドです。データフレームやシリーズの行数、列数、欠損値の数、各列のデータ型などの情報を一覧表示します。データの前処理やデータの品質管理、また、メモリ使用量の確認などに役立ちます。
使用方法は以下の通りです。
データフレームまたはシリーズ.info()
例えば、以下のようなデータフレームがあるとします。
import pandas as pd
df = pd.DataFrame({
'name': ['Alice', 'Bob', 'Charlie', 'David'],
'age': [24, 37, 45, 18],
'gender': ['F', 'M', 'M', 'M'],
'height': [162.5, 175.0, 180.5, 156.5],
'weight': [55.0, 82.5, 88.0, 48.5]
})
このデータフレームの情報を表示するには、以下のようにします。
df.info()
出力:
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 4 entries, 0 to 3
Data columns (total 5 columns):
# Column Non-Null Count Dtype
--- ------ -------------- -----
0 name 4 non-null object
1 age 4 non-null int64
2 gender 4 non-null object
3 height 4 non-null float64
4 weight 4 non-null float64
dtypes: float64(2), int64(1), object(2)
memory usage: 288.0+ bytes
このように、info()
メソッドを使用することで、データフレームの情報を一覧表示することができます。データフレームの行数、列数、各列の非null値の数、各列のデータ型、およびメモリ使用量が表示されます。
Pandasのinfoメゾットを使用して、データ型・行数・列数・列名・Null値の有り無しなどを調べる
import pandas as pd
df = pd.read_csv('csvファイル名.csv')
#
df.head()
#
df.info()
#
df.describe()
行数・列数(shape)を調べる
import pandas as pd
df = pd.read_csv('/〇〇〇〇/〇〇〇〇/〇〇〇〇/csvファイル名.csv')
df.shape
#行数のみ
df.shape[0]
#列数のみ
df.shape[1]
行数(Len)のみ調べる
Len(df)
#カラム数のみ確認
Len(df.columns)
コメント