gpt4 book ai didi

html - 使用 scrapy 和 css 从 HTML 中提取特定值

转载 作者:太空宇宙 更新时间:2023-11-03 21:05:02 25 4
gpt4 key购买 nike

我有以下 HTML 代码:

<div class="sites-split">
<ul>
<li><a href="http://www.page1.com/" target="_blank">text 1</a></li>
<li><a href="http://www.page2.com/" target="_blank">text 2</a></li>
</ul>
<ul>
<li><a href="http://www.page3.com/" target="_blank">text 3</a></li>
<li><a href="http://www.page4.com/" target="_blank">text 4</a></li>
</ul>
</div>

我想提取 te 链接和与该链接关联的文本,我设法通过以下方式获取链接:

response.css("div.sites-split a::attr(href)").getall()

但我不知道如何获取文本,我试过:

response.css("div.sites-split a::attr(target)").getall()

但我得到的只是:

['_blank',
'_blank',
'_blank',
'_blank']

最佳答案

您正在提取另一个属性,但您需要文本。尝试 response.css("div.sites-split a::text").getall()

关于html - 使用 scrapy 和 css 从 HTML 中提取特定值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54673650/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com