如何解决 Pandas 读取 XLSX 文件出现的“Excel 文件格式无法确定”错误?

如何解决 pandas 读取 xlsx 文件出现的“excel 文件格式无法确定”错误?

pandas 读取所有 xlsx 文件时出现“excel 文件格式无法确定”错误

在使用 pandas 从文件夹中读取所有 xlsx 文件时,可能会遇到如下错误:

excel file format cannot be determined, you must specify an engine manually.

根源

此错误通常是由 ms excel 创建的隐藏临时文件引起的,这些文件会在打开 excel 文件时在同一目录中创建,文件名格式为:

~$datasheet.xlsx

解决方案

为了避免此错误,可以:

  • 关闭所有 excel 文件后运行代码:确保在运行代码读取文件之前关闭所有打开的 excel 文件。
  • 手动指定引擎:使用 engine 参数指定引擎,例如 openpyxl,如下所示:

    df = pd.read_excel(f, engine="openpyxl")

注意事项

使用 openpyxl 引擎可能会导致另一个错误:“badzipfile: file is not a zip file”。这是因为 pandas 的旧版本(

以上就是如何解决 Pandas 读取 XLSX 文件出现的“Excel 文件格式无法确定”错误?的详细内容,更多请关注其它相关文章!