- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我已经启动了 Scrapy shell 并成功地 ping 维基百科。
scrapy shell http://en.wikipedia.org/wiki/Main_Page
我相信这一步是正确的,从 Scrapy 响应的冗长性质来看。
接下来我想看看我写的时候会发生什么
hxs.select('/html').extract()
此时,我得到了错误:
NameError: 名称 'hxs' 未定义
问题是什么?我知道 Scrapy 安装正常,接受了目标 URL,但为什么 hxs
命令会出现问题?
最佳答案
我怀疑您使用的 Scrapy 版本没有 hxs
不再在外壳上。
使用 sel
相反(0.24 后弃用,见下文):
$ scrapy shell http://en.wikipedia.org/wiki/Main_Page
>>> sel.xpath('//title/text()').extract()[0]
u'Wikipedia, the free encyclopedia'
或者,从 Scrapy 1.0 开始,您应该使用 response
的 Selector 对象, 它是 .xpath
和 .css
便捷方法:
$ scrapy shell http://en.wikipedia.org/wiki/Main_Page
>>> response.xpath('//title/text()').extract()[0]
u'Wikipedia, the free encyclopedia'
仅供引用,引自 Using selectors在 Scrapy 文档中:
... after the shell loads, you’ll have the response available as
response
shell variable, and its attached selector inresponse.selector
attribute.
...
Querying responses using XPath and CSS is so common that responses include two convenience shortcuts:response.xpath()
andresponse.css()
:
>>> response.xpath('//title/text()')
[<Selector (text) xpath=//title/text()>]
>>> response.css('title::text')
[<Selector (text) xpath=//title/text()>]
关于web-scraping - 名称错误 : name 'hxs' is not defined when using Scrapy,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25955289/
我知道 hxs 文件是编译后的帮助文件,是 .chm 文件的替代品,但我似乎无法打开它们。 我读到您使用帮助浏览器 dexplore.exe 阅读它们,该文件位于此处: C:\Program File
关闭。这个问题需要更多focused .它目前不接受答案。 想改善这个问题吗?更新问题,使其仅关注一个问题 editing this post . 2年前关闭。 Improve this questi
我正在尝试从 here 中获取赔率. 目前只是尝试使用以下蜘蛛记录结果: def parse(self, response): log.start("LogFile.txt",
我已经在这工作了 12 小时,我希望有人可以帮我一把。 这是我的代码,我想要的只是在页面爬行时获取页面上每个链接的 anchor 和 url。 from scrapy.contrib.spiders
我是这个领域的新手,我需要更多信息。我在互联网上找不到任何信息。例如现在我使用这个函数 hxs.select('//div[@id="CategoryBreadcrumb"]//text()').ex
我已经启动了 Scrapy shell 并成功地 ping 维基百科。 scrapy shell http://en.wikipedia.org/wiki/Main_Page 我相信这一步是正确的,从
首先,我遵循以下教程:http://doc.scrapy.org/en/0.16/intro/tutorial.html . 我跑: scrapy shell http://www.dmoz.org/
我是一名优秀的程序员,十分优秀!