问题描述:
在使用Python时,尝试读取一个xlsx格式的Excel文件时,会出现以下报错:
xlrd.biffh.XLRDError: Excel xlsx file; not supported
这是因为Python的xlrd库只支持读取Excel 2003及以前的xls文件格式。因此,如果需要读取xlsx格式的文件,则需要安装并使用openpyxl库来实现。
解决方法:
安装openpyxl库:
在命令行中输入以下指令安装openpyxl库:
pip install openpyxl
读取xlsx文件:
使用openpyxl库的load_workbook函数来读取xlsx文件。
例子一:
假设有一个excel文件,文件名为test.xlsx,其中包含一个名为Sheet1的工作表。读取并打印该工作表的第一列数据,可以按照以下方式实现。
import openpyxl
wb = openpyxl.load_workbook('test.xlsx')
sheet = wb['Sheet1']
for cell in sheet['A']:
print(cell.value)
例子二:
假设excel文件中有多个工作表,我们想要读取第二个工作表的数据。可以按照以下方式实现。
import openpyxl
wb = openpyxl.load_workbook('test.xlsx')
sheet = wb.worksheets[1]
for row in sheet.rows:
for cell in row:
print(cell.value)
在例子二中,我们通过wb.worksheets[1]来获取第二个工作表。并通过嵌套的for循环遍历每个格子并打印其值。
总结:
以上两个例子演示了如何使用openpyxl库来读取xlsx格式的Excel文件。openpyxl库的使用方式比较简单,基本上只需要调用load_workbook函数来加载工作簿,即可开始读取数据。