gpt4 book ai didi

python - scrapy python 重新声明

转载 作者:行者123 更新时间:2023-11-30 23:29:35 25 4
gpt4 key购买 nike

我正在学习scrapy。我正在使用 scrapy 0.20,这就是我遵循本教程的原因。 http://doc.scrapy.org/en/0.20/intro/tutorial.html

我理解这些概念。不过,我还有一件事。

在此声明中

sel.xpath('//title/text()').re('(\w+):')

输出为

[u'Computers', u'Programming', u'Languages', u'Python']

re('(\w+):') 的用途是什么?

帮助回答:

本声明

sel.xpath('//title/text()').extract()

有这个输出:

[u'Open Directory - Computers: Programming: Languages: Python: Books']

为什么元素之间要添加逗号,?此外,所有“:”都被删除。

此外:请问这是Python纯语法吗?

最佳答案

这是一个正则表达式 (regex),它本身就是一个完整的世界。

(\w+): 将返回以冒号结尾的任何文本(但不返回冒号) Here is an example of how it works with the ":" getting removed

(\w+:) 将返回以冒号结尾的任何文本(并且还将返回冒号) Here is an example of how it works with the ":" staying in

另外,如果你想学习正则表达式,Codecademy 有一个很好的 python course

关于python - scrapy python 重新声明,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21088666/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com