前置知识:
– Python基础知识
– pandas库的基础使用知识
1. 安装pandas库
在终端或命令行输入以下命令,即可安装pandas库:
pip install pandas
2. 创建Excel文件
首先,我们需要创建一个空的Excel文件。这可以通过pandas库中的“pd.ExcelWriter()”方法轻松实现。
下面是一个完整的示例代码,演示如何创建一个空的Excel文件:
import pandas as pd
# 创建一个Excel写入对象
writer = pd.ExcelWriter('example.xlsx', engine='xlsxwriter')
# 保存文件
writer.save()
这段代码首先通过导入pandas库来获取“pd.ExcelWriter()”方法。该方法需要传入两个参数,包括要创建的文件名和文件类型。
该方法返回一个Excel写入对象,我们将其存储在变量“writer”中。
最后,我们调用“writer.save()”方法将Excel文件保存到磁盘上。
3. 写入数据到Excel文件
在创建了空白的Excel文件后,接下来是向其中写入数据。pandas库的“dataframe.to_excel()”方法可以让我们把Python列表或numpy数组写入到Excel文件中。
现在让我们看一个完整示例代码,来向Excel文件写入一些数据:
import pandas as pd
# 创建一个Excel写入对象
writer = pd.ExcelWriter('example.xlsx', engine='xlsxwriter')
# 创建一个数据集
data = {'Name': ['Lucas', 'Lily', 'Tom', 'Jerry'],
'Age': [25, 24, 22, 29],
'Country': ['China', 'USA', 'England', 'Canada']}
# 转换数据集为DataFrame对象
df = pd.DataFrame(data)
# 写入到Excel文件
df.to_excel(writer, sheet_name='Sheet1')
# 保存文件
writer.save()
代码解析:
-
我们先创建了一个“pd.ExcelWriter()”对象,赋值给变量“writer”,用来向文件中写入数据。
-
创建了一个数据集‘data’,它是一个Python字典,包括Name/Age/Country三个属性以及对应的值。
-
将数据集转换成Pandas DataFrame,这是一种用于表格处理的数据类型。
-
使用“df.to_excel()”方法,将DataFrame的值写入到Excel工作簿中。该方法需要传递一个参数“sheet_name”,用来指定要写入数据的Sheet名称。
-
最后通过调用“write.save()”方法保存Excel文件。
4. 写入多个Sheet到Excel文件
pandas库可以将多个Sheet写入到同一个Excel文件中,这可以通过再次调用“pd.ExcelWriter()”来实现。
下面我们看一个示例代码,演示如何将两个Sheet写入同一个Excel文件:
import pandas as pd
# 创建一个Excel写入对象
writer = pd.ExcelWriter('example.xlsx', engine='xlsxwriter')
# 创建数据集1
data1 = {'Name': ['Lucas', 'Lily', 'Tom', 'Jerry'],
'Age': [25, 24, 22, 29],
'Country': ['China', 'USA', 'England', 'Canada']}
# 转换数据集1为DataFrame对象
df1 = pd.DataFrame(data1)
# 创建数据集2
data2 = {'Product': ['Apple', 'Banana', 'Orange'],
'Price': [2.50, 3.20, 1.89],
'Status': ['In stock', 'Out of stock', 'In stock']}
# 转换数据集2为DataFrame对象
df2 = pd.DataFrame(data2)
# 往每个Sheet写入数据
df1.to_excel(writer, sheet_name='Personal Info')
df2.to_excel(writer, sheet_name='Product Info')
# 保存文件
writer.save()
代码解析:
-
我们在之前的示例中创建了一个Excel写入对象,存储在变量“writer”中。
-
然后定义了两个数据集“data1”和“data2”,分别对应要写入两个Sheet的值。
-
通过“pd.DataFrame()”方法分别将两个数据集转换成Pandas DataFrame。
-
最后分别调用“df1.to_excel(….)”和“df2.to_excel(….)”将两个DataFrame的值写入到两个不同的Sheet中。
-
最后调用“writer.save()”方法对Excel文件进行保存。
5. 总结
本文演示了如何使用Python和pandas库创建Excel文件,并向其中写入数据。其中包括如何写入单个Sheet以及写入多个Sheet的示例。其中我们使用了pandas的数据类型DataFrame,它是一种处理表格数据的强大工具,可用于读写Excel文件和处理数据库中的数据。
如果你需要进一步了解pandas和DataFrame的相关知识,建议参阅pandas官方文档,对其中基础的数据操作和表格处理进行学习。