下面我将详细讲解如何使用Python对Excel中的特定数据进行提取并写入新表的方法,这里将使用Python中的第三方库pandas来完成操作。
1.安装pandas库
首先需要安装pandas库,可以通过pip命令来安装,终端输入:
pip install pandas
2.读取Excel文件
在本示例中,将使用一个名为data.xlsx的Excel文件进行演示。使用pandas来读取该Excel文件,代码如下:
import pandas as pd
excel_file = pd.ExcelFile('data.xlsx')
df = excel_file.parse('Sheet1')
print(df)
运行该代码,将输出该Excel文件中Sheet1的全部内容。
3.提取特定数据
假设我们现在需要找出该Excel文件中“科目”为“数学”的行并将其提取出来写入新的表格。使用pandas可以很轻松地完成该操作,代码如下:
import pandas as pd
# 读取Excel文件
excel_file = pd.ExcelFile('data.xlsx')
df = excel_file.parse('Sheet1')
# 筛选数据并写入新的表格
df_math = df[df['科目'] == '数学']
df_math.to_excel('math.xlsx', index=False)
运行该代码,将把符合筛选条件的数据写入一个新的Excel文件math.xlsx中。
4.提取多个特定数据
除了提取单个特定数据之外,还有可能需要同时提取多个特定数据。以本示例中的Excel文件为例,如果需要找出“学生姓名”为“张三”并且“科目”为“英语”的行,并将符合条件的行提取出来存入一个新的Excel文件中,代码如下:
import pandas as pd
# 读取Excel文件
excel_file = pd.ExcelFile('data.xlsx')
df = excel_file.parse('Sheet1')
# 筛选数据并写入新的表格
df_filtered = df[(df['学生姓名'] == '张三') & (df['科目'] == '英语')]
df_filtered.to_excel('filtered.xlsx', index=False)
运行该代码,将把符合筛选条件的数据写入一个新的Excel文件filtered.xlsx中。
至此,我们成功地利用Python对Excel中的特定数据进行提取并写入新表。以上是完整的实例教程,希望对你有所帮助。