在Python Pandas中获取列的数据类型

  • Post category:Python

在Python Pandas中获取列的数据类型可以通过dtypes属性或info()方法实现。

dtypes属性返回一个Series对象,其中包含数据帧中每个列的数据类型。例如:

import pandas as pd

data = {'name': ['John', 'Steve', 'Sarah'],
        'age': [25, 30, 27],
        'height': [175.5, 180.0, 165.5]}
df = pd.DataFrame(data)
print(df.dtypes)

输出结果为:

name       object
age         int64
height    float64
dtype: object

上面输出结果中,name列的数据类型是object,age列的数据类型是int64,height列的数据类型是float64

info()方法可以返回更详细的信息,包括每个列的名称、非空值的数量、每个列的数据类型以及占用的内存的使用情况。例如:

print(df.info())

输出结果为:

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3 entries, 0 to 2
Data columns (total 3 columns):
 #   Column  Non-Null Count  Dtype  
---  ------  --------------  -----  
 0   name    3 non-null      object 
 1   age     3 non-null      int64  
 2   height  3 non-null      float64
dtypes: float64(1), int64(1), object(1)
memory usage: 200.0+ bytes
None

上面输出结果中可以看出,数据帧中有3行。每个列都有3个非空值。其中第0列是name,类型为object;第1列是age,类型为int64;第2列是height,类型为float64。数据帧占用的内存使用了200字节。

总的来说,在Python Pandas中获取列的数据类型无论是通过dtypes属性还是info()方法都可以轻松实现。info()方法能够输出的信息更加详细。