Python Pandas常用函数方法总结

  • Post category:Python

PythonPandas常用函数方法总结

Pandas是Python语言的一个数据处理库,非常实用。下面详细讲解一些常用的Pandas函数方法。

1. Pandas读取文件

import pandas as pd

# 读取csv文件
df=pd.read_csv('filename.csv')
# 读取excel文件
df=pd.read_excel('filename.xlsx')

2. 数据查看

# 查看数据前5行
df.head()

# 查看数据后5行
df.tail()

# 查看数据基本信息,包括行数、列名、每列非空数据个数、数据类型、占用内存等
df.info()

# 查看数据统计信息,包括总数、平均值、标准差、最小值、25%分位数、中位数、75%分位数、最大值等
df.describe()

3. 数据清洗

3.1 缺失值处理

# 检查是否存在缺失值
df.isnull().sum()
# 填充缺失值为0
df.fillna(0)
# 删除所有含有缺失值的行
df.dropna()

3.2 重复值处理

# 删除所有完全相同的行
df.drop_duplicates()
# 删除指定列的重复值
df.drop_duplicates('column_name')

4. 数据分析

4.1 数据筛选

# 筛选某一列符合条件的行
df[df['column_name']==condition]

# 筛选某几列符合条件的行
df[(df['column_name1']==condition1) & (df['column_name2']==condition2)]

4.2 数据排序

# 根据某一列进行升序排序
df.sort_values(by='column_name', ascending=True)
# 根据某一列进行降序排序
df.sort_values(by='column_name', ascending=False)

5. 数据可视化

import matplotlib.pyplot as plt

# 柱状图
df['column_name'].value_counts().plot(kind='bar')
plt.show()

# 折线图
df.plot(kind='line', x='column_name1', y='column_name2')
plt.show()

以上就是PythonPandas常用函数方法的一些总结,希望对大家有所帮助。