- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在开发一个相当大的程序,它再次从一个相当大的 Excel 电子表格中获取数据。由于一些奇怪的原因,加载这个大的 Excel 文件需要很长时间,我希望能以某种方式加快速度。我做了自己的研究并尝试了 read_only,但这不允许我读取任何单元格(至少如下所示的方式)。非常欢迎任何建议。
def LoadSheet(Filename,worksheet_nr):
import time as t
st = t.clock()
wb = xl.load_workbook(str(Filename))#workbook, loading workbook
Sheets = wb.get_sheet_names()#Worksheets, shows all sheets in the workbook loaded
ActiveSheet = wb.get_sheet_by_name(Sheets[worksheet_nr])#Selects the first sheet
print round(t.clock() - st,3), "seconds of loading time."
print "Sheet is loaded and reading..."
return ActiveSheet
def CountRC_nr(ActiveSheet, StartR,StartC):
R = StartR#Selected starting Row number
C = StartC#Selected starting Column number
Val = None #Value in cell (Right now, none is selected, thus zero value)
while (Val != "None"):
Val = str(ActiveSheet.cell(row=R,column=C).value)
R += 1
NumberRows = R - StartR - 1
Val = None
R=StartR
while (Val != "None"):
Val = str(ActiveSheet.cell(row=R,column=C).value)
C += 1
NumberColumns = C - StartC - 1
return NumberRows, NumberColumns
由于有些人要求查看我如何使用 read_only,这里是修改后的代码:
def LoadSheet(Filename,worksheet_nr):
import time as t
st = t.clock()
wb = xl.load_workbook(str(Filename), read_only = True)#workbook, loading workbook
Sheets = wb.get_sheet_names()#Worksheets, shows all sheets in the workbook loaded
ActiveSheet = wb.get_sheet_by_name(Sheets[worksheet_nr])#Selects the first sheet
print round(t.clock() - st,3), "seconds of loading time."
print "Sheet is loaded and reading..."
return ActiveSheet
def CountRC_nr(ActiveSheet, StartR,StartC):
R = StartR#Selected starting Row number
C = StartC#Selected starting Column number
Val = None #Value in cell (Right now, none is selected, thus zero value)
while (Val != "None"):
Val = str(ActiveSheet.cell(row=R,column=C).value)
R += 1
NumberRows = R - StartR - 1
Val = None
R=StartR
while (Val != "None"):
Val = str(ActiveSheet.cell(row=R,column=C).value)
C += 1
NumberColumns = C - StartC - 1
return NumberRows, NumberColumns
最佳答案
正如我已经说过的,您正在针对 API 进行工作。如果工作表的尺寸已知,那么您可以访问它们,否则您可以构建自己的计数器,但没有什么意义。
只读模式对于单个查找来说非常快,但是由于每个查找都涉及将行中的所有单元格解析到感兴趣的单元格,因此对于许多单元格来说效率非常低,例如您的代码正在使用。
wb = load_workbook(filename, read_only=True)
for ws in wb:
print(ws.dimensions)
for row in ws.rows:
for cell in row:
print(cell.value) # do whatever you want with the cell
您可以使用(行中单元格的cell.value)轻松将行转换为NumPy数组
,但Pandas库也可以将工作表直接读入数据帧。
关于python - 加快 openpyxl 读取速度,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37470392/
有没有办法使用 openpyxl 折叠多行?似乎没有与 openpyxl simple usage page 上的示例等效的行。 import openpyxl wb = openpyxl.Workb
我有一个应用程序,如果已经有数据,我将工作表写入最后一列 + 2,如果工作表为空,则写入最后一列 + 1。我得到了我认为是空的工作表,如下所示: from openpyxl.workbook.work
我有一个应用程序,如果已经有数据,我将工作表写入最后一列 + 2,如果工作表为空,则写入最后一列 + 1。我得到了我认为是空的工作表,如下所示: from openpyxl.workbook.work
当我从 openpyxl-2.5.12 升级到 openpyxl-3.0.3 时,我开始收到以下错误: C:\workspace\venv_py37_64\lib\site-packages\open
我可以使用以下代码创建垂直条形图: from openpyxl import Workbook wb = Workbook() ws = wb.active for i in range(10):
我对 openpyxl 库有疑问。 问题: 当我使用 xlwt,打开一个 .xls 文件,并在其中写入一些单元格时,我没有触及的单元格的样式保持不变。但现在我必须处理 xlsx 文档,所以我选择了 o
我想将Excel中的数据添加到词典中。但是,当我使用.append(TOTAL_SALES)时出现错误,当然,如果我使用+=TOTAL_SALES,则没有问题,只是我获得的是总和,而不是3个单独月份的
我想将Excel中的数据添加到词典中。但是,当我使用.append(TOTAL_SALES)时出现错误,当然,如果我使用+=TOTAL_SALES,则没有问题,只是我获得的是总和,而不是3个单独月份的
如何更改excel单元格数字格式General至Text不考虑单元格中的数据? 我正在使用 openpyxl 1.8.6。 最佳答案 我知道这个问题真的很老了,但它仍然可能是相关的,因为我在谷歌搜索同
我正在其中一个 Excel 工作表中打印一些公式: wsOld.cell(row = 1, column = 1).value = "=B3=B4" 但我不能使用它的结果来实现其他一些逻辑,如: if
如何使用openpyxl将数据表添加到图例区域如下图所示: openpyxl 中有一个 openpyxl.chart.chartspace.DataTable 类,但我找不到任何示例来使用它。 最佳答
如何使用openpyxl从Excel中的命名范围读取值? 我在http://openpyxl.readthedocs.org/en/latest/_modules/openpyxl/workbook/
请有人给我一个例子,如何复制 带有样式的整个工作表(来自行和列) 到同一工作簿中的第二个工作表? (也可以在新工作簿中) 谢谢。 P.S .:我尝试进行深度复制,但是在保存更改的数据单元时失败了。 目
我有以下函数,可以使用 openpyxl 库从 excel 工作簿中读取数据: import openpyxl def read_excel(path): excel_workbook = o
我有大量 Excel 文件,我只想处理未隐藏的工作表,我想忽略所有隐藏的工作表。 目前我的 python 脚本循环遍历每张纸,无论它是否被隐藏。有没有一种简单的方法来检查工作表是否被隐藏? 我在网上看
我需要做什么: 在 Python/Pandas 中打开 Excel 电子表格 使用 [name, balance] 创建 df 例子: 姓名 平衡 琼斯事工 45,408.83 史密斯事工 38,59
我正在创建一个程序,使用 python 和 openpyxl 将所有单个引号移动到一个单引号矩阵中,但是当尝试加载模型信息时,它似乎是从第一个引号重复模型。每个报价都是一个单独的 excel 文件,这
我有一个在 openpyxl 中打开并清理它并关闭工作簿的 excel 文件,示例代码如下: #filename is the name of the excel file used wb = loa
我正在使用 openpyxl库在电子表格上执行一些 excel 剪切/粘贴操作。 假设我的操作产生了以下数据(请将其用于重现性目的): col1;col2 1;0,17153686 2;0,61532
我想写一个新的工作簿,一张纸,然后在这张纸上添加一个表格。 AFAIK 应该是可能的,这个提交应该做到 https://bitbucket.org/openpyxl/openpyxl/commits/
我是一名优秀的程序员,十分优秀!