查找两个数据框架共享的列,可以通过以下步骤实现:
- 使用
pandas
库读取两个数据框架,可以使用pd.read_csv()
函数读取csv文件,或者使用pd.read_excel()
函数读取excel文件。
import pandas as pd
# 读取第一个数据框架
df1 = pd.read_csv('data1.csv')
# 读取第二个数据框架
df2 = pd.read_excel('data2.xlsx')
- 使用
pandas
库的.columns
属性获取列名列表。
# 获取第一个数据框架的列名列表
cols1 = df1.columns.tolist()
# 获取第二个数据框架的列名列表
cols2 = df2.columns.tolist()
- 使用Python内置函数
set()
将两个数据框架的列名转换成集合。
# 将第一个数据框架的列名转换为集合
set_cols1 = set(cols1)
# 将第二个数据框架的列名转换为集合
set_cols2 = set(cols2)
- 使用Python内置函数
&
获取两个集合的交集,即共享的列名。
# 获取第一个数据框架和第二个数据框架共享的列名
shared_cols = set_cols1 & set_cols2
# 将共享的列名转换成列表
shared_cols_list = list(shared_cols)
- 最终的共享列名列表即为
shared_cols_list
,可以用于后续处理。
# 输出共享的列名列表
print(shared_cols_list)
以下为一个完整的实例代码:
import pandas as pd
# 读取第一个数据框架
df1 = pd.read_csv('data1.csv')
# 读取第二个数据框架
df2 = pd.read_excel('data2.xlsx')
# 获取第一个数据框架的列名列表
cols1 = df1.columns.tolist()
# 获取第二个数据框架的列名列表
cols2 = df2.columns.tolist()
# 将第一个数据框架的列名转换为集合
set_cols1 = set(cols1)
# 将第二个数据框架的列名转换为集合
set_cols2 = set(cols2)
# 获取第一个数据框架和第二个数据框架共享的列名
shared_cols = set_cols1 & set_cols2
# 将共享的列名转换成列表
shared_cols_list = list(shared_cols)
# 输出共享的列名列表
print(shared_cols_list)
上述代码中,data1.csv
和data2.xlsx
为两个示例数据文件,实际应用时需要替换成自己合适的文件路径。