gpt4 book ai didi

python-3.x - 流模式还是点阵模式,tabula-py模块中默认设置了哪个?

转载 作者:行者123 更新时间:2023-12-05 06:25:24 24 4
gpt4 key购买 nike

我想知道是否有熟悉 Python 的 tabula-py 模块的人可以帮助我解决这个问题。在任何 tabula-py 文档中都不清楚 tabula.read_pdf() 是否如果没有latticestream 参数传递给函数,函数使用latticestream 模式提取作为其默认设置.代码是否会根据 pdf 文本中遇到的“表格”以某种方式猜测两种模式中的哪一种更可取,如果不是,请您澄清两种提取模式中的哪一种被用作默认模式(因此呈现其中一种这两个参数是多余的,因为事实上,如果你将 lattice 设置为 False 那么你必须根据定义将流设置为 True ,反之亦然)?提前致谢。

很容易设置 tabula.read_pdf()模式到格或流模式提取,所以这不是我的问题。如果我没有指定我想使用哪一个,我只想知道这两个中的哪一个被用作默认提取模式。

最佳答案

Camelot 中解析方法的命名(即 Lattice 和 Stream)的灵感来自 Tabula。 Lattice用于解析单元格之间有分界线的表格,而Stream用于解析单元格之间有空格的表格以模拟表格结构。


https://github.com/camelot-dev/camelot/wiki/Comparison-with-other-PDF-Table-Extraction-libraries-and-tools

你会更好地理解这个存储库

关于python-3.x - 流模式还是点阵模式,tabula-py模块中默认设置了哪个?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57111194/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com