下面我将详细讲解“python数据处理67个pandas函数总结看完就用”的完整攻略。
1. 简介
这篇文章介绍了针对数据分析所需的67个 pandas 函数,包括数据读取、数据清洗、数据重塑、数据拼接等操作。
2. 数据读取
2.1 read_csv
read_csv 用于读取以逗号分隔的文件(csv),返回一个 DataFrame 对象。
示例:
import pandas as pd
df = pd.read_csv('data.csv')
print(df)
2.2 read_excel
read_excel 用于读取 Excel 文件,返回一个 DataFrame 对象。
示例:
import pandas as pd
df = pd.read_excel('data.xlsx')
print(df)
3. 数据清洗
3.1 dropna
dropna 用于删除 DataFrame 中的空值(NaN)。
示例:
import pandas as pd
df = pd.read_csv('data.csv')
df.dropna()
print(df)
3.2 fillna
fillna 用于将 DataFrame 中的空值(NaN)替换为特定的值。
示例:
import pandas as pd
df = pd.read_csv('data.csv')
df.fillna(0)
print(df)
4. 数据重塑
4.1 pivot_table
pivot_table 用于对 DataFrame 进行透视操作,返回一个新的 DataFrame 对象。
示例:
import pandas as pd
df = pd.read_csv('data.csv')
pt = df.pivot_table(index='name', columns='year', values='value')
print(pt)
4.2 melt
melt 用于对 DataFrame 进行逆透视操作,返回一个新的 DataFrame 对象。
示例:
import pandas as pd
df = pd.read_csv('data.csv')
ml = df.melt(id_vars=['name'], value_vars=['year', 'value'], var_name='variable', value_name='value')
print(ml)
5. 数据拼接
5.1 concat
concat 用于对多个 DataFrame 进行合并操作,返回一个新的 DataFrame 对象。
示例:
import pandas as pd
df1 = pd.read_csv('data1.csv')
df2 = pd.read_csv('data2.csv')
concat_df = pd.concat([df1, df2])
print(concat_df)
5.2 merge
merge 用于对两个 DataFrame 进行合并操作,返回一个新的 DataFrame 对象。
示例:
import pandas as pd
df1 = pd.read_csv('data1.csv')
df2 = pd.read_csv('data2.csv')
merge_df = pd.merge(df1, df2, on='id')
print(merge_df)
希望这些示例能够帮助你更好的理解 pandas 相关函数的使用。