例文を使って繰り返し業務を時短

【Python】データ型などの情報を調べる

Pythonのinfo()を使ってデータ型などの情報を調べる方法 python

Pandasのinfo()メゾットとは

Pandasにはinfo()メソッドが存在します。info()メソッドは、Pandasのデータフレームやシリーズの情報を表示するためのメソッドです。データフレームやシリーズの行数、列数、欠損値の数、各列のデータ型などの情報を一覧表示します。データの前処理やデータの品質管理、また、メモリ使用量の確認などに役立ちます。

使用方法は以下の通りです。

データフレームまたはシリーズ.info()

例えば、以下のようなデータフレームがあるとします。

import pandas as pd

df = pd.DataFrame({
    'name': ['Alice', 'Bob', 'Charlie', 'David'],
    'age': [24, 37, 45, 18],
    'gender': ['F', 'M', 'M', 'M'],
    'height': [162.5, 175.0, 180.5, 156.5],
    'weight': [55.0, 82.5, 88.0, 48.5]
})

このデータフレームの情報を表示するには、以下のようにします。

df.info()

出力:

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 4 entries, 0 to 3
Data columns (total 5 columns):
 #   Column  Non-Null Count  Dtype  
---  ------  --------------  -----  
 0   name    4 non-null      object 
 1   age     4 non-null      int64  
 2   gender  4 non-null      object 
 3   height  4 non-null      float64
 4   weight  4 non-null      float64
dtypes: float64(2), int64(1), object(2)
memory usage: 288.0+ bytes

このように、info()メソッドを使用することで、データフレームの情報を一覧表示することができます。データフレームの行数、列数、各列の非null値の数、各列のデータ型、およびメモリ使用量が表示されます。

Pandasのinfoメゾットを使用して、データ型・行数・列数・列名・Null値の有り無しなどを調べる

import pandas as pd

df = pd.read_csv('csvファイル名.csv')

#
df.head()

#
df.info()

#
df.describe()

行数・列数(shape)を調べる

import pandas as pd
df = pd.read_csv('/〇〇〇〇/〇〇〇〇/〇〇〇〇/csvファイル名.csv')
df.shape

#行数のみ
df.shape[0]

#列数のみ
df.shape[1]

行数(Len)のみ調べる

Len(df)

#カラム数のみ確認
Len(df.columns)


コメント

タイトルとURLをコピーしました