Python Excel vlookup函数实现过程解析

  • Post category:Python

Python Excel vlookup 函数实现过程解析

本文介绍利用 Python 脚本实现 Excel 表格中 vlookup 函数的操作步骤。vlookup 函数可以在一个 Excel 表格中查找特定值,并返回该值所在行中的其他列的相关数据。通过 Python 脚本实现 vlookup 函数的操作,可以同时在多个表格中查找数据,大大提高了数据处理的效率。

准备工作

  1. 安装 Python
    首先需要安装 Python,可通过官方网站下载对应版本的 Python 安装程序。本文所述内容基于 Python 3.6 版本。

  2. 安装 pandas 库
    pandas 是一款 Python 库,专门用于数据处理,在本文中它将会被用于实现 vlookup 函数的功能。可以通过 pip 命令来安装,命令如下:

pip install pandas

  1. 准备需操作的 Excel 文件
    需要在本地计算机中准备至少两个 Excel 文件,其中一个文件是 vlookup 函数执行的源文件,另一个文件是存储 vlookup 函数返回结果的目标文件。需要注意的是,这两个文件具有相同的列名,才能够执行 vlookup 函数。

实现过程

下面将详细介绍 Python 实现 Excel vlookup 函数的过程。本文所述内容将基于以下两个 Excel 表格:

  • 源表格: source.xlsx
Country Population GDP
China 1439 14393
India 1380 2976
United US 331 19390
Brazil 213 2056
Pakistan 220 278
  • 目标表格: target.xlsx
Country GDP Population
China
India
United US
Brazil
Pakistan

要实现 vlookup 函数的功能,按照以下步骤进行操作:

  1. 引入 pandas 库
import pandas as pd
  1. 加载源表格和目标表格
source = pd.read_excel('source.xlsx')
target = pd.read_excel('target.xlsx')
  1. 执行 vlookup 函数
result = pd.merge(target, source[['Country', 'GDP', 'Population']], on='Country', how='left')

以上代码中,利用 pandas 库的 merge() 函数实现了 vlookup 的功能。merge() 函数将目标表格和源表格连接起来。

  1. 将结果保存为 Excel 文件
result.to_excel('result.xlsx', index=False)

完整代码实例:

import pandas as pd

# 加载源表格和目标表格
source = pd.read_excel('source.xlsx')
target = pd.read_excel('target.xlsx')

# 执行 vlookup 函数
result = pd.merge(target, source[['Country', 'GDP', 'Population']], on='Country', how='left')

# 将结果保存为 Excel 文件
result.to_excel('result.xlsx', index=False)

示例说明

下面通过两个具体的示例,进一步展示 vlookup 函数的实现过程。

示例 1

假设源表格和目标表格如下:

  • 源表格: source1.xlsx
Name Age Sex Height
John 20 M 175
Mary 19 F 162
Tom 21 M 178
  • 目标表格: target1.xlsx
Name Height Gender
John
Mary
Tom

执行以下 Python 脚本:

import pandas as pd

# 加载源表格和目标表格
source = pd.read_excel('source1.xlsx')
target = pd.read_excel('target1.xlsx')

# 执行 vlookup 函数
result = pd.merge(target, source[['Name', 'Height', 'Sex']], on='Name', how='left')

# 将结果保存为 Excel 文件
result.to_excel('result1.xlsx', index=False)

脚本执行后,结果为:

  • 结果表格: result1.xlsx
Name Height Gender
John 175 M
Mary 162 F
Tom 178 M

从结果表格可以看出,vlookup 函数成功地将源表格中的身高数据与目标表格连接起来。

示例 2

假设源表格和目标表格如下:

  • 源表格: source2.xlsx
Product Price
Apple 5
Banana 3
Orange 4
  • 目标表格: target2.xlsx
Product Price Quantity
Apple
Banana
Orange

执行以下 Python 脚本:

import pandas as pd

# 加载源表格和目标表格
source = pd.read_excel('source2.xlsx')
target = pd.read_excel('target2.xlsx')

# 执行 vlookup 函数
result = pd.merge(target, source[['Product', 'Price']], on='Product', how='left')

# 将结果保存为 Excel 文件
result.to_excel('result2.xlsx', index=False)

脚本执行后,结果为:

  • 结果表格: result2.xlsx
Product Price Quantity
Apple 5
Banana 3
Orange 4

从结果表格可以看出,vlookup 函数成功地将源表格中的价格数据与目标表格连接起来。

通过以上两个示例,可以看出 Python 脚本实现 Excel vlookup 函数非常便捷,操作简单,效率高,可将数据处理的速度大大提高。