pandas.read_excel 为列导入错误的值

哈里斯·加格

我正在使用 pandas.read_excel 将 excel 文件导入到 DataFrame 中。这是代码...

#!/usr/bin/python
import pandas as pd
file = 'sample.xls'
df = pd.read_excel(file, sheetname=0, skiprows=7)

这将导入文件,但带有以下警告...

警告 *** OLE2 流“SSCS”:预期大小 128640,实际大小 512

当我打印数据框时,我看到最后一列的值完全错误(而不是该列的实际值,每行显示 4 个。

我正在附上 xls 文件的屏幕截图。 示例 Xls 文件第一页屏幕抓取

马丁·埃文斯

如果您使用的是 Windows,您可以在使用 Pandas 加载它们之前使用 Excel 本身来修改所有 XLS 文件。以下脚本将自动取消隐藏在给定文件夹中找到的所有 XLS 文件中的所有列:

import win32com.client as win32
import glob

excel = win32.gencache.EnsureDispatch('Excel.Application')

for xls in glob.glob(r"C:\My Path\*.xls"):
    print xls
    wb = excel.Workbooks.Open(xls)
    ws = wb.Worksheets(1)
    ws.Columns.EntireColumn.Hidden = False
    excel.DisplayAlerts = False     # Allow file overwrite
    wb.Close(True)

excel.Application.Quit()

您可能希望在执行此操作之前制作 XLS 文件的副本,因为它将就地完成。或者,您可以使用wb.SaveAs()指定不同的输出位置。

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

Pandas read_excel 忽略我需要保留的空白列

python- pandas read_excel为index_col获取错误的数字

在Python中使用Pandas中的read_excel为参数分配值

Python Pandas read_excel和to_json日期格式错误

Pandas read_excel na_values 和转换器之间的干扰错误?

在 Pandas Read_excel 中使用 UseCols 時保持列的原始順序

pandas read_excel:强制将同一列中的其他值转换为float的nan值

如果excel文件是由程序创建的,Pandas read_excel为具有简单公式的单元格返回nan

熊猫read_excel()导入xlrd失败

Pandas read_excel:正确解析 Excel 日期时间字段

Python Pandas read_excel方法KeyError'显示'

python pandas read_excel:sep参数可用吗?

Python Pandas read_excel returns empty Dataframe

Python Pandas read_excel返回空数据框

Panda read_excel() 给出了错误的日期值

将read_excel与转换器一起用于将Excel文件读取到Pandas DataFrame中会导致对象类型的数字列

使用read_excel()时将...设置为na

熊猫数据框在read_excel时更改浮点值

将pandas read_excel生成的dict保存到多表excel文件

如何在Pandas中使用read_excel提高处理速度?

使用Pandas read_excel()读取xlsx文件的完整行失败

Python Pandas read_excel无法识别空单元格

将Pandas .read_excel数据框追加到新数据框

read_excel将号码重新编码为na值

将read_excel放入数据框,并将文件名保留为列(熊猫)

Python Pandas read_excel 在 Pandas 0.18.1 和 Pandas > 0.19 之间解析多索引数据帧时的不同行为

read_excel(),一列字符串,但是excel格式,是日期,会报错

在panda中使用read_excel函数浏览Excel文件中的所有列

将 read_excel 中的多个 Excel 工作表循环到 Pandas 中的连接数据框中