gpt4 book ai didi

javascript - 如何提取两个节点之间的文本内容

转载 作者:太空宇宙 更新时间:2023-11-04 11:08:00 24 4
gpt4 key购买 nike

我想提取红色和绿色矩形中包含的文本,如下面的屏幕截图所示,注意:文本不包含在开始和结束标记中

http://temperate.theferns.info/plant/Acacia+omalophylla

enter image description here

例如,对于绿色矩形的文本,我测试了这个 xpath 查询和以下代码(python/selenium):

greenrec_xpath = "//*[preceding::h3[contains(text(), 'General Information')] and following::h3[contains(text(), 'Known Hazards')]]"
driver.find_elements_by_xpath(greenrec_xpath)

但没有得到预期的结果

任何想法!

最佳答案

当文本周围没有直接包围的括号时,它被称为文本节点,并且查找起来有点棘手,因为它不能像您尝试的那样直接访问。我通常要做的是找到直接父级的位置,并从中获取文本。如果该父节点下有多个文本节点,这会变得有点棘手,并且在获得整个文本后通常需要进行一些解析/拆分。

或者,如果您处于可以保证您的文本节点包含某些特定文本的情况,您可以将 text() 替换为 . 并制作 xpath那样。例如://*[contains(.,'Acacia omalophylla')]

关于javascript - 如何提取两个节点之间的文本内容,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58960069/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com