Stack Overflow 中从下一页到 scrapy 的 Xpath-6ren

Stack Overflow 中从下一页到 scrapy 的 Xpath

转载作者：行者123 更新时间：2023-12-01 23:10:03

24

4

我正在尝试使用 scrapy 抓取 Stack Overflow，但我还不够清楚，无法制定获取下一页的规则。我不知道我选择的 XPath 是否也正确。

他遵循代码:

class StackCrawlerSpider(CrawlSpider):
    name = 'stack_crawler'
    allowed_domains = ['stackoverflow.com']
    start_urls = [
        'http://stackoverflow.com/questions?pagesize=50&sort=newest'
    ]
    rules = [
        Rule(LinkExtractor(allow=(), restrict_xpaths=('div[@class="pager fl"]/a[@class="page-numbers next"]/@href',)),
             callback='parse_item', follow=True)
    ]

了解 scrapy 和 XPath 的人可以帮助我从下一页 ( http://stackoverflow.com/questions?pagesize=50&sort=newest ) 获取下一页并将其添加到规则中吗？

最佳答案

您需要选择根元素//然后转到span包含类 page-numbers next和文本next然后转到它的父项 ..这是 a标签。

//span[@class="page-numbers next"]/../@href

关于Stack Overflow 中从下一页到 scrapy 的 Xpath，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/53421924/

24

4

0

文章推荐： delphi - 子集与其超集不兼容

文章推荐： swift - 如何在 SwiftUI 中删除列表左侧和右侧的填充

文章推荐： upload - 在sailsjs中上传后立即显示图像

c++ - "struct *Stack stack"和 "struct Stack* stack"和有什么区别？
在编写代码时，当我编写 struct *Stack stack 时，代码无法工作，而当我像 struct Stack* stack 那样编写代码时，代码可以工作有人告诉我这两个代码之间的区别吗？最佳
stack - "Implement a stack"实际上是什么意思？
我的教授要我绘制堆栈吗？他想让我付诸行动吗？我觉得自己很愚蠢，但这不像任何人告诉我的那样!感谢您的帮助。哇，你们真快。已经谢谢你了。完整的问题是:考虑两个堆栈，每个堆栈的大小为 n(即，每个堆栈最多
Java - 对于通用数据类型 Stack，new Stack[N] 是否等同于 new Stack[N]？
是new Stack[N]相当于new Stack[N]对于通用数据类型 Stack ？编辑:虽然我知道最好避免混合泛型类型和数组，并且存在更强大的解决方案，但我的查询仍然存在:被广泛认可的教科书，
c++ - cpp 中使用 stack 的 stack.top() 和 stack.pop() 的返回类型是什么？
我正在尝试使用堆栈的 printf() 打印 stack.top() 的返回值，但它给出的格式不匹配。代码如下: int main(){ stack cards; char *ch1
stack - CompilerError : Stack too deep, 尝试删除局部变量
我正在尝试做一个 dapp 项目。我有一个堆栈太深的错误，但我不知道如何解决这个问题。 CompilerError: Stack too deep, try removing local varia
haskell-stack - 'stack haddock' 在哪里放置它生成的文档？
在哪里stack haddock (或 stack build --haddock )放置它生成的文档？最佳答案这取决于为“属于”生成黑线鳕的包的位置。 “本地”包的 Haddocks 是堆栈项目
stack - 来自采访 : what's the benefit of the stack in C?
按照目前的情况，这个问题不适合我们的问答形式。我们希望答案得到事实、引用或专业知识的支持，但这个问题可能会引发辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开，visit the
stack - Ada 初学者 Stack 程序
基本上，我有 2 个文件(.adb 和 .ads)。我对 Ada 以及如何编译 2 个文件完全陌生。该程序是一个基本的堆栈实现。编译 .adb 文件时出现此编译错误。 $ gcc -c test_ad
stack - 术语 "web stack?"是什么意思
关闭。这个问题需要更多focused .它目前不接受答案。想改善这个问题吗？更新问题，使其仅关注一个问题 editing this post . 5年前关闭。 Improve this questi
elastic-stack - 微服务架构上的 ELK Stack
您好，我正在尝试在微服务架构中使用 ELK 堆栈，其中有许多服务分布在许多服务器上。现在我已经配置了 Kibana 和 ElasticSearch。现在我的疑问是我必须在哪里安装 Logstash。
stack - 如何用 LISP 语言实现 Stack
很难说出这里要问什么。这个问题模棱两可、含糊不清、不完整、过于宽泛或夸夸其谈，无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开，visit the help center . 关闭 9
haskell - *** 异常 : stack overflow : Stack overflow
我正在学习 Haskell，但遇到了我没想到的异常“堆栈溢出”。代码相当简单: type Reals = Double prod :: Reals -> Reals -> Reals prod a
java - Stack 类型的非法开始 myStack= new Stack()
在我的 PC(最新的 JDK 和编译器版本)上，我的程序运行得非常顺利。但在我教授的计算机上，她说她遇到了两个错误 1) Stack myStack= new Stack() 类型的非法开始 2) 非
stack - 在 devstack 中运行 ./stack.sh 时出错
当我尝试在调用跟踪后执行 ./stack.sh 时，我收到以下错误: `[Call Trace] ./stack.sh:217:source /home/work/devstack/stackrc
haskell - `stack clean` 和删除 `.stack-work` 目录有什么区别？
1 上下文我参与了一个涉及大量 C 位和 FFI 的 Haskell 项目。所以我发现自己经常运行和重新运行命令，比如 $ stack build $ stack build --force-dir
stack - Fortran : trying to make a minimal stack datastructure
关于 SO 上的堆栈的问题，终于!我的一生都让我走到了这一步。所以我需要将我制作的一些相当大的自定义数据结构合并到一个堆栈中。我决定编写一个仅包含一个整数值的最小堆栈结构。这里是 - MODULE
powershell - "(gl -stack)"和 "gl -stack"之间的区别
我只是想知道为什么在括号之间嵌入表达式时会得到两个不同的成员列表，例如gl-stack。看起来，如果没有括号，表达式就会被完全求值，并且结果会立即传递到下一个管道组件。但通过括号，集合中的单个对象将被
java - 是否可以在 onSaveInstanceState 中保存 Stack>
是否可以保存Stack>在onSaveInstanceState . 是否可以通过另一种方式保存某些特定数据来管理 Activity 状态？最佳答案您无法将 View 保存到 bundle 中。无
java - 为什么我可以使用 Stack 而不能使用 Stack？
这个问题已经有答案了: Why don't Java Generics support primitive types? (5 个回答) 已关闭 9 年前。为什么我不能使用Stack ？除了拳击之
c - 为什么需要在 stack.c 中包含 stack.h ？
基于数组的实现级别 #include "stack.h" void creat_stack(Stack *s) { s->Top = 0; } int isFull(Stack s) {

首页

博学

6Ren·AI

商城

Stack Overflow 中从下一页到 scrapy 的 Xpath