python - 加快 openpyxl 读取速度-6ren

python - 加快 openpyxl 读取速度

转载作者：行者123 更新时间：2023-12-02 21:02:36

48

4

我正在开发一个相当大的程序，它再次从一个相当大的 Excel 电子表格中获取数据。由于一些奇怪的原因，加载这个大的 Excel 文件需要很长时间，我希望能以某种方式加快速度。我做了自己的研究并尝试了 read_only，但这不允许我读取任何单元格(至少如下所示的方式)。非常欢迎任何建议。

def LoadSheet(Filename,worksheet_nr):
    import time as t
    st = t.clock()
    wb = xl.load_workbook(str(Filename))#workbook, loading workbook
    Sheets = wb.get_sheet_names()#Worksheets, shows all sheets in the workbook loaded
    ActiveSheet = wb.get_sheet_by_name(Sheets[worksheet_nr])#Selects the first sheet
    print round(t.clock() - st,3), "seconds of loading time."
    print "Sheet is loaded and reading..."
    return ActiveSheet



def CountRC_nr(ActiveSheet, StartR,StartC):
    R = StartR#Selected starting Row number
    C = StartC#Selected starting Column number
    Val = None #Value in cell (Right now, none is selected, thus zero value)
    while (Val != "None"):
        Val = str(ActiveSheet.cell(row=R,column=C).value)
        R += 1

    NumberRows = R - StartR - 1
    Val = None
    R=StartR

    while (Val != "None"):
        Val = str(ActiveSheet.cell(row=R,column=C).value)
        C += 1
    NumberColumns = C - StartC - 1

    return NumberRows, NumberColumns

由于有些人要求查看我如何使用 read_only，这里是修改后的代码:

def LoadSheet(Filename,worksheet_nr):
    import time as t
    st = t.clock()
    wb = xl.load_workbook(str(Filename), read_only = True)#workbook, loading workbook
    Sheets = wb.get_sheet_names()#Worksheets, shows all sheets in the workbook loaded
    ActiveSheet = wb.get_sheet_by_name(Sheets[worksheet_nr])#Selects the first sheet
    print round(t.clock() - st,3), "seconds of loading time."
    print "Sheet is loaded and reading..."
    return ActiveSheet



def CountRC_nr(ActiveSheet, StartR,StartC):
    R = StartR#Selected starting Row number
    C = StartC#Selected starting Column number
    Val = None #Value in cell (Right now, none is selected, thus zero value)
    while (Val != "None"):
        Val = str(ActiveSheet.cell(row=R,column=C).value)
        R += 1

    NumberRows = R - StartR - 1
    Val = None
    R=StartR

    while (Val != "None"):
        Val = str(ActiveSheet.cell(row=R,column=C).value)
        C += 1
    NumberColumns = C - StartC - 1

    return NumberRows, NumberColumns

最佳答案

正如我已经说过的，您正在针对 API 进行工作。如果工作表的尺寸已知，那么您可以访问它们，否则您可以构建自己的计数器，但没有什么意义。

只读模式对于单个查找来说非常快，但是由于每个查找都涉及将行中的所有单元格解析到感兴趣的单元格，因此对于许多单元格来说效率非常低，例如您的代码正在使用。

wb = load_workbook(filename, read_only=True)
for ws in wb:
    print(ws.dimensions)
    for row in ws.rows:
         for cell in row:
             print(cell.value)  # do whatever you want with the cell

您可以使用(行中单元格的cell.value)轻松将行转换为NumPy数组，但Pandas库也可以将工作表直接读入数据帧。

关于python - 加快 openpyxl 读取速度，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/37470392/

48

4

0

文章推荐： arm - 将 24 位二进制补码转换为 float_32t

文章推荐： modelica - “Variability” 函数调用模型出错

文章推荐： asp.net - 内存不足异常-ASP.NET-IIS 7

文章推荐： r - Quantstrat:在同一柱上执行

openpyxl - 使用 openpyxl 折叠多行
有没有办法使用 openpyxl 折叠多行？似乎没有与 openpyxl simple usage page 上的示例等效的行。 import openpyxl wb = openpyxl.Workb
openpyxl - 确定 openpyxl 中的工作表是否为空
我有一个应用程序，如果已经有数据，我将工作表写入最后一列 + 2，如果工作表为空，则写入最后一列 + 1。我得到了我认为是空的工作表，如下所示: from openpyxl.workbook.work
openpyxl - 确定 openpyxl 中的工作表是否为空
我有一个应用程序，如果已经有数据，我将工作表写入最后一列 + 2，如果工作表为空，则写入最后一列 + 1。我得到了我认为是空的工作表，如下所示: from openpyxl.workbook.work
openpyxl - 如何解决 Openpyxl TypeError : expected error in openpyxl-3. 0.3
当我从 openpyxl-2.5.12 升级到 openpyxl-3.0.3 时，我开始收到以下错误: C:\workspace\venv_py37_64\lib\site-packages\open
python - Openpyxl - 我可以使用 Openpyxl 创建水平条形图吗？
我可以使用以下代码创建垂直条形图: from openpyxl import Workbook wb = Workbook() ws = wb.active for i in range(10):
excel - Openpyxl，如何在使用 openpyxl .save() 函数保存后保留之前的 .xlsx 文件样式？
我对 openpyxl 库有疑问。问题: 当我使用 xlwt，打开一个 .xls 文件，并在其中写入一些单元格时，我没有触及的单元格的样式保持不变。但现在我必须处理 xlsx 文档，所以我选择了 o
openpyxl AttributeError when i attempt to add data in dict from multiple sheets(当我尝试从多个工作表添加词典中的数据时，Openpyxl AttributeError)
我想将Excel中的数据添加到词典中。但是，当我使用.append(TOTAL_SALES)时出现错误，当然，如果我使用+=TOTAL_SALES，则没有问题，只是我获得的是总和，而不是3个单独月份的
openpyxl AttributeError when i attempt to add data in dict from multiple sheets(当我尝试从多个工作表添加词典中的数据时，Openpyxl AttributeError)
我想将Excel中的数据添加到词典中。但是，当我使用.append(TOTAL_SALES)时出现错误，当然，如果我使用+=TOTAL_SALES，则没有问题，只是我获得的是总和，而不是3个单独月份的
openpyxl - 使用 openpyxl 1.8.6 将 excel 单元格编号格式 "General"更改为 "Text"
如何更改excel单元格数字格式General至Text不考虑单元格中的数据？我正在使用 openpyxl 1.8.6。最佳答案我知道这个问题真的很老了，但它仍然可能是相关的，因为我在谷歌搜索同
python - Openpyxl 1.8.5 : Reading the result of a formula typed in a cell using openpyxl
我正在其中一个 Excel 工作表中打印一些公式: wsOld.cell(row = 1, column = 1).value = "=B3=B4" 但我不能使用它的结果来实现其他一些逻辑，如: if
openpyxl - 如何在openpyxl中将数据表添加到图例中
如何使用openpyxl将数据表添加到图例区域如下图所示: openpyxl 中有一个 openpyxl.chart.chartspace.DataTable 类，但我找不到任何示例来使用它。最佳答
openpyxl - 使用openpyxl从命名范围读取值
如何使用openpyxl从Excel中的命名范围读取值？我在http://openpyxl.readthedocs.org/en/latest/_modules/openpyxl/workbook/
openpyxl - 使用openpyxl复制整个工作表
请有人给我一个例子，如何复制带有样式的整个工作表（来自行和列）到同一工作簿中的第二个工作表？（也可以在新工作簿中）谢谢。 P.S .：我尝试进行深度复制，但是在保存更改的数据单元时失败了。目
python - Openpyxl 给出不一致的错误信息
我有以下函数，可以使用 openpyxl 库从 excel 工作簿中读取数据: import openpyxl def read_excel(path): excel_workbook = o
python - openpyxl - 检查工作表是否被隐藏
我有大量 Excel 文件，我只想处理未隐藏的工作表，我想忽略所有隐藏的工作表。目前我的 python 脚本循环遍历每张纸，无论它是否被隐藏。有没有一种简单的方法来检查工作表是否被隐藏？我在网上看
python - Openpyxl 创建具有工作表名称和特定单元格值的数据框？
我需要做什么: 在 Python/Pandas 中打开 Excel 电子表格使用 [name, balance] 创建 df 例子: 姓名平衡琼斯事工 45,408.83 史密斯事工 38,59
Python/Openpyxl 重复数据
我正在创建一个程序，使用 python 和 openpyxl 将所有单个引号移动到一个单引号矩阵中，但是当尝试加载模型信息时，它似乎是从第一个引号重复模型。每个报价都是一个单独的 excel 文件，这
python - 读取和打印工作簿中工作表的内容 - openpyxl
我有一个在 openpyxl 中打开并清理它并关闭工作簿的 excel 文件，示例代码如下: #filename is the name of the excel file used wb = loa
python openpyxl 在所选单元格上设置光标
我正在使用 openpyxl库在电子表格上执行一些 excel 剪切/粘贴操作。假设我的操作产生了以下数据(请将其用于重现性目的): col1;col2 1;0,17153686 2;0,61532
python - openpyxl - 只写工作表无法添加表
我想写一个新的工作簿，一张纸，然后在这张纸上添加一个表格。 AFAIK 应该是可能的，这个提交应该做到 https://bitbucket.org/openpyxl/openpyxl/commits/

首页

博学

6Ren·AI

商城

python - 加快 openpyxl 读取速度