gpt4 book ai didi

python - 获取当前节点所有子节点的值

转载 作者:太空宇宙 更新时间:2023-11-03 19:36:05 26 4
gpt4 key购买 nike

我正在尝试检索 div 中的所有值。例如:

<div>xyz <span> abc </span> def</div>

这是代码

the_page="<div>xyz <span> abc </span> def</div>"
doc = libxml2dom.parseString(the_page, html=1)
divs=doc.getElementsByTagName("div")
print divs[0].firstChild.nodeValue

这仅打印“xyz”。我尝试只打印 divs[0].nodeValue,但这给了我一个错误。我想要所有的文字。我该如何解决这个问题?

最佳答案

为您:

divs=doc.getElementsByTagName("div")

用途:

childs = divs[0].childNodes

然后,您就可以抓取它们了。每个子节点都包含一个子节点列表和节点值

for child in childs :
if child.childNode == []:
print child.nodeValue
else :
## Recurse

关于python - 获取当前节点所有子节点的值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3488572/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com