查找两个数据框架共享的列

查找两个数据框架共享的列，可以通过以下步骤实现：

使用pandas库读取两个数据框架，可以使用pd.read_csv()函数读取csv文件，或者使用pd.read_excel()函数读取excel文件。

import pandas as pd

# 读取第一个数据框架
df1 = pd.read_csv('data1.csv')

# 读取第二个数据框架
df2 = pd.read_excel('data2.xlsx')

使用pandas库的.columns属性获取列名列表。

# 获取第一个数据框架的列名列表
cols1 = df1.columns.tolist()

# 获取第二个数据框架的列名列表
cols2 = df2.columns.tolist()

使用Python内置函数set()将两个数据框架的列名转换成集合。

# 将第一个数据框架的列名转换为集合
set_cols1 = set(cols1)

# 将第二个数据框架的列名转换为集合
set_cols2 = set(cols2)

使用Python内置函数&获取两个集合的交集，即共享的列名。

# 获取第一个数据框架和第二个数据框架共享的列名
shared_cols = set_cols1 & set_cols2

# 将共享的列名转换成列表
shared_cols_list = list(shared_cols)

最终的共享列名列表即为shared_cols_list，可以用于后续处理。

# 输出共享的列名列表
print(shared_cols_list)

以下为一个完整的实例代码：

import pandas as pd

# 读取第一个数据框架
df1 = pd.read_csv('data1.csv')

# 读取第二个数据框架
df2 = pd.read_excel('data2.xlsx')

# 获取第一个数据框架的列名列表
cols1 = df1.columns.tolist()

# 获取第二个数据框架的列名列表
cols2 = df2.columns.tolist()

# 将第一个数据框架的列名转换为集合
set_cols1 = set(cols1)

# 将第二个数据框架的列名转换为集合
set_cols2 = set(cols2)

# 获取第一个数据框架和第二个数据框架共享的列名
shared_cols = set_cols1 & set_cols2

# 将共享的列名转换成列表
shared_cols_list = list(shared_cols)

# 输出共享的列名列表
print(shared_cols_list)

上述代码中，data1.csv和data2.xlsx为两个示例数据文件，实际应用时需要替换成自己合适的文件路径。

你可能也喜欢

将嵌套的JSON结构转换为Pandas DataFrames

计算Pandas数据框架中的所有行或满足某些条件的行

用谷歌表格和Pandas收集数据