在Python Pandas中获取列的数据类型可以通过dtypes
属性或info()
方法实现。
dtypes
属性返回一个Series对象,其中包含数据帧中每个列的数据类型。例如:
import pandas as pd
data = {'name': ['John', 'Steve', 'Sarah'],
'age': [25, 30, 27],
'height': [175.5, 180.0, 165.5]}
df = pd.DataFrame(data)
print(df.dtypes)
输出结果为:
name object
age int64
height float64
dtype: object
上面输出结果中,name列的数据类型是object
,age列的数据类型是int64
,height列的数据类型是float64
。
info()
方法可以返回更详细的信息,包括每个列的名称、非空值的数量、每个列的数据类型以及占用的内存的使用情况。例如:
print(df.info())
输出结果为:
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3 entries, 0 to 2
Data columns (total 3 columns):
# Column Non-Null Count Dtype
--- ------ -------------- -----
0 name 3 non-null object
1 age 3 non-null int64
2 height 3 non-null float64
dtypes: float64(1), int64(1), object(1)
memory usage: 200.0+ bytes
None
上面输出结果中可以看出,数据帧中有3行。每个列都有3个非空值。其中第0列是name
,类型为object
;第1列是age
,类型为int64
;第2列是height
,类型为float64
。数据帧占用的内存使用了200字节。
总的来说,在Python Pandas中获取列的数据类型无论是通过dtypes
属性还是info()
方法都可以轻松实现。info()
方法能够输出的信息更加详细。