gpt4 book ai didi

python - 使用 Python Selenium 从其组合中包含
的元素获取文本

转载 作者:太空宇宙 更新时间:2023-11-03 14:00:58 26 4
gpt4 key购买 nike

我正在从网站提取联系信息(文本),并且当前可以使用以下 XPath 语法提取所有类数据:

//*[@id="nomapdata"]/div/div/div/div[2]/div[1]

使用该元素的 XPath 表达式,我得到以下文本作为结果:

Name
Title
Company Website
Phone Number

我想单独提取这些元素,但问题是,数据由 <br> </br> 分隔。 ,而且我还没有成功隔离每个元素。

下面是 HTML 结构的示例:

<div class="col-sm-d">
"
Name"
<br>
"
Title"
<br>
a href="www.website.com" target="_blank">http://www.website.com</a>
<br>
"

Phone: (555) 555-5555"
<br>

我能够隔离的唯一元素是网站。

在这种情况下如何隔离每个数据?

最佳答案

尝试获取文本节点列表

driver.find_element_by_xpath('//*[@id="nomapdata"]/div/div/div/div[2]/div[1]').text.split("\n")

如果电话号码后面有更多您不想使用的文本节点:

driver.find_element_by_xpath('//*[@id="nomapdata"]/div/div/div/div[2]/div[1]').text.split("\n")[:4]

关于python - 使用 Python Selenium 从其组合中包含 <br> 的元素获取文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49239935/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com