gpt4 book ai didi

python - 使用XPath获取网页数据

转载 作者:太空宇宙 更新时间:2023-11-03 16:44:45 26 4
gpt4 key购买 nike

我正在尝试编写一个程序来遍历 HTML 页面并获取页面上的数据。我的问题是在使用 XPath 时出现的。该网页的布局如下:

<div class="left">
<div class="name">
</div>
</div>
<div class="right">
<div class="name">
</div>
</div>

我尝试使用 xpath 分隔每个名称类,但是当我使用时:

tree.xpath('//div[@class="name"]/text()')

我获得了页面上使用类名称的所有内容。我将如何使 xpath 更加具体?

到目前为止,我已经尝试过以下方法:

tree.xpath('//div[class="left"]/div[@class="name"]/text()')

但这不起作用并返回一个空数组。

最佳答案

//div[class="left"]/div[@class="name"]/text()

这几乎是正确的,您只是在class之前缺少@:

//div[@class="left"]/div[@class="name"]/text()
HERE^

关于python - 使用XPath获取网页数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36429111/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com