gpt4 book ai didi

Python Scrapy 无法从类中提取文本

转载 作者:太空狗 更新时间:2023-10-29 22:03:36 28 4
gpt4 key购买 nike

请看这段html代码:

<header class="online">
<img src="http://static.flv.com/themes/h5/img/iconos/online.png"> <span>online</span>
<img src="http://static.flv.com/themes/h5/img/iconos/ojo16.png"> 428 <p>xxfantasia</p>
</header>

我想获取里面的文本(在本例中为 428)。我用过这个:

        def parse(self, response):
sel = Selector(response)
cams = sel.css('header.online')
for cam in cams:
print cam.css('text').extract()

我想我使用了正确的 css 选择器,但我得到的结果是空的。

有什么帮助吗?

最佳答案

CSS 选择器 don't normally have syntax to extract text content .

但是 Scrapy 使用 ::text 伪元素扩展了 CSS 选择器,所以你想使用 cam.css('::text').extract()那应该给你同样的东西 cam.xpath('.//text()').extract()

注意:Scrapy 还添加了 ::attr(attribute_name) 功能伪元素来提取属性值(这对于标准 CSS 选择器也是不可能的)

关于Python Scrapy 无法从类中提取文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21575540/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com