PythonPandas常用函数方法总结
Pandas是Python语言的一个数据处理库,非常实用。下面详细讲解一些常用的Pandas函数方法。
1. Pandas读取文件
import pandas as pd
# 读取csv文件
df=pd.read_csv('filename.csv')
# 读取excel文件
df=pd.read_excel('filename.xlsx')
2. 数据查看
# 查看数据前5行
df.head()
# 查看数据后5行
df.tail()
# 查看数据基本信息,包括行数、列名、每列非空数据个数、数据类型、占用内存等
df.info()
# 查看数据统计信息,包括总数、平均值、标准差、最小值、25%分位数、中位数、75%分位数、最大值等
df.describe()
3. 数据清洗
3.1 缺失值处理
# 检查是否存在缺失值
df.isnull().sum()
# 填充缺失值为0
df.fillna(0)
# 删除所有含有缺失值的行
df.dropna()
3.2 重复值处理
# 删除所有完全相同的行
df.drop_duplicates()
# 删除指定列的重复值
df.drop_duplicates('column_name')
4. 数据分析
4.1 数据筛选
# 筛选某一列符合条件的行
df[df['column_name']==condition]
# 筛选某几列符合条件的行
df[(df['column_name1']==condition1) & (df['column_name2']==condition2)]
4.2 数据排序
# 根据某一列进行升序排序
df.sort_values(by='column_name', ascending=True)
# 根据某一列进行降序排序
df.sort_values(by='column_name', ascending=False)
5. 数据可视化
import matplotlib.pyplot as plt
# 柱状图
df['column_name'].value_counts().plot(kind='bar')
plt.show()
# 折线图
df.plot(kind='line', x='column_name1', y='column_name2')
plt.show()
以上就是PythonPandas常用函数方法的一些总结,希望对大家有所帮助。