查找两个数据框架共享的列

  • Post category:Python

查找两个数据框架共享的列,可以通过以下步骤实现:

  1. 使用pandas库读取两个数据框架,可以使用pd.read_csv()函数读取csv文件,或者使用pd.read_excel()函数读取excel文件。
import pandas as pd

# 读取第一个数据框架
df1 = pd.read_csv('data1.csv')

# 读取第二个数据框架
df2 = pd.read_excel('data2.xlsx')
  1. 使用pandas库的.columns属性获取列名列表。
# 获取第一个数据框架的列名列表
cols1 = df1.columns.tolist()

# 获取第二个数据框架的列名列表
cols2 = df2.columns.tolist()
  1. 使用Python内置函数set()将两个数据框架的列名转换成集合。
# 将第一个数据框架的列名转换为集合
set_cols1 = set(cols1)

# 将第二个数据框架的列名转换为集合
set_cols2 = set(cols2)
  1. 使用Python内置函数&获取两个集合的交集,即共享的列名。
# 获取第一个数据框架和第二个数据框架共享的列名
shared_cols = set_cols1 & set_cols2

# 将共享的列名转换成列表
shared_cols_list = list(shared_cols)
  1. 最终的共享列名列表即为shared_cols_list,可以用于后续处理。
# 输出共享的列名列表
print(shared_cols_list)

以下为一个完整的实例代码:

import pandas as pd

# 读取第一个数据框架
df1 = pd.read_csv('data1.csv')

# 读取第二个数据框架
df2 = pd.read_excel('data2.xlsx')

# 获取第一个数据框架的列名列表
cols1 = df1.columns.tolist()

# 获取第二个数据框架的列名列表
cols2 = df2.columns.tolist()

# 将第一个数据框架的列名转换为集合
set_cols1 = set(cols1)

# 将第二个数据框架的列名转换为集合
set_cols2 = set(cols2)

# 获取第一个数据框架和第二个数据框架共享的列名
shared_cols = set_cols1 & set_cols2

# 将共享的列名转换成列表
shared_cols_list = list(shared_cols)

# 输出共享的列名列表
print(shared_cols_list)

上述代码中,data1.csvdata2.xlsx为两个示例数据文件,实际应用时需要替换成自己合适的文件路径。