提高excel文件操作的速度（使用openpyxl）：如果有条件检查值和删除行操作

用户3541631

我有一个中等大小的 excel 文件，大约有 25000 行。

在 excel 文件中，我检查特定列值是否在列表中，如果在列表中，我将删除该行。

我正在使用 openpyxl。

编码：

   count = 1
    while count <= ws.max_row:
        if ws.cell(row=count, column=2).value in remove_list:
            ws.delete_rows(count, 1)
        else:
            count += 1
    wb.save(src)

该代码有效，但完成速度非常慢（需要数小时）。

我知道这是只读和只写模式，但在我的情况下，我同时使用，首先检查和第二次删除。

爸爸

我看到您正在使用需要删除的行列表。相反，您可以创建要删除的行的“序列”，从而将像 [2,3,4,5,6,7,8,45,46,47,48] 这样的删除列表更改为 [[2, 7] ],[45, 4]]

即从第 2 行开始删除 7 行，然后从第 45 行开始删除 4 行

批量删除比 1 x 1 快。我在大约 10 秒内删除了 6k 行

以下代码将列表转换为列表/序列列表：

def get_sequences(list_of_ints):
    sequence_count = 1
    sequences = []
    for row in list_of_ints:
        next_item = None
        if list_of_ints.index(row) < (len(list_of_ints) - 1):
            next_item = list_of_ints[list_of_ints.index(row) + 1]

        if (row + 1) == next_item:
            sequence_count += 1
        else:
            first_in_sequence = list_of_ints[list_of_ints.index(row) - sequence_count + 1]
            sequences.append([first_in_sequence, sequence_count])
            sequence_count = 1

    return sequences

然后运行另一个循环删除

    for sequence in sequences:
        sheet.delete_rows(sequence[0], sequence[1])

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-07-7

我来说两句

0 条评论

登录后参与评论

上一篇：从图像的右中心使用 jquery 的图像幻灯片

如果有条件，则在执行其他操作后执行Redux呼叫操作

如果有条件，则在else中使用空值运算符

使用&&和！的正确语法是什么？如果有条件？

如果有条件则为条件

MySQL：如果有条件存在于其他表中，则从表中删除行

jQuery-如果有条件

如果有条件通过，则退出foreach

SQL，如果有条件查询

如果有条件则余烬

如果有条件，改进 Python

Matlab：如果有条件则嵌套循环

Phoenix模板（如果有条件）

猫鼬：$ sum（如果有条件）

Rails验证（如果有条件）

如果有条件，如何遍历列表？

如果有条件则测试摘要

如果有条件进行测验

如果有条件，简化PHP乘法

如果有条件则退出程序

python pandas：如果有条件则删除df列

如果有条件，请删除列名称中的字符串

如果有条件，如何在短时间内使用null，dbnull和datetime

如果有条件，则为内部变量分配值-总是不好的做法吗？

bash，如果有条件，则使用awk命令打印行字符

如果有条件使用React Router V4更改路线

如果有条件使用jquery停止折叠（'hide'）函数-Bootstrap 3

如果有值，如何在django admin中有条件地显示字段？

如果有空，如何有条件地将Makefile变量设置为某些值？

如果有条件更改样式类值，我可以使用 Jade 吗？使用闪存变量

TOP 榜单

文章

提高excel文件操作的速度（使用openpyxl）：如果有条件检查值和删除行操作

提高excel文件操作的速度（使用openpyxl）：如果有条件检查值和删除行操作

IE 11中的FormData未定义

如何一次从多个文本框中获取值？

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

OpenCv：改变 putText() 的位置

Redux动作正常，但减速器无效

如何从JavaScript中的MP3文件读取元数据属性？

如何使用Redux-Toolkit重置Redux Store

将加号/减号添加到jQuery菜单

OpenGL纹理格式的颜色错误

获取并汇总所有关联的数据

超过时间限制错误C ++

ActiveModelSerializer仅显示关联的ID

在交互式Python Shell中获得最后结果

如何开始为Ubuntu开发

去噪自动编码器和常规自动编码器有什么区别？

Excel 2016图表将增长与4个参数进行比较

算术中的c ++常量类型转换

使用因子时如何在y轴上的ggplot中插入count或％

TreeMap中的自定义排序

如何在R中转置数据

在 React Native Expo 中使用 react-redux 更改另一个键的值