gpt4 book ai didi

python - 如何从 json 文件中提取一些文本而不加载它?

转载 作者:行者123 更新时间:2023-12-01 02:17:42 24 4
gpt4 key购买 nike

python lxml 可用于从 XML 文件中提取文本(例如,使用 xpath),而无需完全解析 XML。例如,我可以执行以下操作,这比 BeautifulSoup 更快,尤其是对于大输入。我想要一些等效的 JSON 代码。

from lxml import etree
tree = etree.XML('<foo><bar>abc</bar></foo>')
print type(tree)
r = tree.xpath('/foo/bar')
print [x.tag for x in r]

我明白了http://goessner.net/articles/JsonPath/ 。但我没有看到在不使用 json.load() 的情况下从 json 文件中提取一些文本的示例 python 代码。有人能给我举个例子吗?谢谢。

最佳答案

我假设出于性能原因您不想加载整个 JSON。

如果是这样的话,也许 ijson就是你所需要的。我用它来搜索巨大的 JSON 文件(>8gb)并且效果很好。

但是,您必须自己实现搜索代码。

关于python - 如何从 json 文件中提取一些文本而不加载它?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48237809/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com