下面是Pandas数据读取与写入的完整攻略,包括数据读取和数据写入,通过多个实例进行说明。
数据读取
读取CSV文件
Pandas可以轻松读取csv格式的文件。
import pandas as pd
df = pd.read_csv('path/to/file.csv')
注意:文件路径应该是相对路径或绝对路径。
读取Excel文件
Pandas也可以读取Excel文件,需要安装xlrd库。
import pandas as pd
df = pd.read_excel('path/to/file.xls')
同样,文件路径应该是相对路径或绝对路径。
读取JSON文件
Pandas可以读取JSON格式的文件,需要安装json库。
import pandas as pd
df = pd.read_json('path/to/file.json')
同样,文件路径应该是相对路径或绝对路径。
读取HTML文件
Pandas可以将HTML文件中的表格读取为DataFrame。
import pandas as pd
dfs = pd.read_html('path/to/file.html')
使用pd.read_html()
方法后,返回的是一个DataFrame的列表,因为一个HTML文件可能包含多个表格。
数据写入
写入CSV文件
Pandas可以将DataFrame数据写入到CSV文件中。
import pandas as pd
df.to_csv('path/to/output.csv', index=False)
to_csv()
方法默认情况下会将DataFrame的索引写入到CSV文件中,通常我们不需要这个功能,因此需要将index
参数设置为False
。
写入Excel文件
Pandas可以将DataFrame数据写入到Excel文件中,需要安装openpyxl库。
import pandas as pd
df.to_excel('path/to/output.xls', index=False)
注意:Pandas也可以写入.xlsx
后缀的Excel文件,只需要将文件名后缀从.xls
改为.xlsx
。
写入JSON文件
Pandas可以将DataFrame数据写入到JSON文件中。
import pandas as pd
df.to_json('path/to/output.json', orient='records')
orient
参数用于设定输出的JSON格式,可以设定为records
、index
、columns
、values
中的任意一个。
数据处理实例
下面通过实例对数据读取和数据写入进行演示。
实例1:读取CSV文件并输出前5行
import pandas as pd
df = pd.read_csv('path/to/file.csv')
print(df.head(5))
实例2:读取Excel文件并输出前5行
import pandas as pd
df = pd.read_excel('path/to/file.xls')
print(df.head(5))
实例3:读取JSON文件并输出
import pandas as pd
df = pd.read_json('path/to/file.json')
print(df)
实例4:将DataFrame数据写入CSV文件
import pandas as pd
data = {'name': ['Alice', 'Bob', 'Charlie'], 'age': [25, 30, 35]}
df = pd.DataFrame(data)
df.to_csv('path/to/output.csv', index=False)
实例5:将DataFrame数据写入Excel文件
import pandas as pd
data = {'name': ['Alice', 'Bob', 'Charlie'], 'age': [25, 30, 35]}
df = pd.DataFrame(data)
df.to_excel('path/to/output.xls', index=False)
实例6:将DataFrame数据写入JSON文件
import pandas as pd
data = {'name': ['Alice', 'Bob', 'Charlie'], 'age': [25, 30, 35]}
df = pd.DataFrame(data)
df.to_json('path/to/output.json', orient='records')
以上就是Pandas数据读取与写入的完整攻略,希望对你有所帮助。