- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我将 scrapy 与 scrapy-selenium 一起使用,但无法处理分页,因为 href 仅包含 # 符号。
class PropertyScraperSpider(scrapy.Spider):
name = 'property_scraper'
allowed_domains = ['www.samtrygg.se']
def start_requests(self):
yield SeleniumRequest(
url='https://www.samtrygg.se/RentalObject/NewSearch',
wait_time=3,
headers=self.headers,
callback=self.parse_links
)
def parse_links(self, response):
cards = response.xpath("//div[@class='owl-carousel owl-theme show-nav-hover']/div/a")
for card in cards:
link = card.xpath(".//@href").get()
print('\n\n:link',len(link))
yield SeleniumRequest(
url= link,
wait_time=3,
headers=self.headers,
callback=self.parse,
)
next_page = response.xpath("//a[@id='next']/@href").get()
print('\n\n\nNEXT_PAGE',next_page)
if next_page:
absolute_url = f'https://www.samtrygg.se/RentalObject/NewSearch{next_page}'
yield SeleniumRequest(
url=absolute_url,
headers=self.headers,
wait_time=3,
callback=self.parse_links
)
def parse(self,response):
pass
我需要有关此分页问题的帮助。我该如何处理?任何帮助将不胜感激。
最佳答案
Ryan 说的是正确的。为了扩展这一点,可以通过几种方式获取动态内容。
如果可能的话,这是迄今为止获取动态内容的最佳方式,它是最高效且比 selenium 更不易损坏的方式。这取决于 JavaScript 是否触发 HTTP 请求来抓取网页数据。在这种情况下,在采取其他手段之前应该首先尝试
Scrapy有一个集成了splash的中间件。 Splash 预渲染页面,因此可以访问 javascript 加载的 HTML。它还具有一些浏览器事件功能。比 selenium 的劳动密集度要低,但它仍然是浏览器事件。
这是您在这里尝试的解决方案,问题是,它并没有真正提供很多选项来执行复杂的浏览器事件。所以它的真正目的是能够获取已经被 javascript 加载的 HTML。
您可以使用中间件来过滤请求,使用完整的 selenium 包。当没有其他选择并且您想要满足每个请求时,这是可以的。或者您想根据您发出的请求类型对其进行自定义
在我看来,当所有其他选项都不可用并且您确实需要针对脚本的特定部分进行复杂的浏览器事件并且无法使用请求来完成它时,这是最后的手段。
现在您已经基本了解它是什么了。您的浏览器(我更喜欢 Chrome)可以访问浏览器为显示您所看到的网站而发出的所有请求。如果您检查页面 --> 网络工具 --> XHR,您将看到所有 AJAX 请求(通常是 API 端点所在的位置)。
您可以看到所有请求,按大小排序往往会起作用,因为通常数据会是较大的请求。单击请求时,您可以访问它发送的 header 、响应预览和响应。
这里我们预览了您可能想要的数据。然后,我将以 cURL 的形式复制此请求并将其输入到像curl.trillworks.com 这样的网站中。
如果需要发出正确的 Scrapy 请求,这将为您提供 header 、参数和 cookie。在这种情况下,您实际上只需要其中一个参数来模拟 HTTP 请求。我倾向于使用 requests 包来处理我实际需要的内容,因为复制请求会为您提供请求中的所有内容,有些是您不需要的。
关于python - 无法点击分页中的下一个按钮,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/63395605/
所以我有这个 javascript 片段,它有两个按钮可以进入全屏,一个按钮可以退出全屏。我想做到这一点,如果我不在全屏模式下,按钮会显示转到全屏模式,而当我处于全屏模式时,按钮会显示退出全屏模式..
我在自定义控件中添加了一个新属性作为可扩展属性,例如属性网格中的字体属性。在 Windows 窗体应用程序项目中使用我的自定义控件后,我在属性网格中看到一个省略号 (…) 按钮,如字体属性的“…”按钮
我在自定义控件中添加了一个新属性作为可扩展属性,例如属性网格中的字体属性。在 Windows 窗体应用程序项目中使用我的自定义控件后,我在属性网格中看到一个省略号 (…) 按钮,如字体属性的“…”按钮
我尝试将 Twitter 上的“Tweet Me”按钮 ( http://twitter.com/goodies/tweetbutton ) 添加到我的网站。然而,每当按下按钮时,我都会收到此 Jav
我试图在我的文本区域中获取一个按钮值,如果我使用 则工作正常但如果我使用那么它就不起作用了。你能找出问题所在吗? HTML 1 2 3 4 JavaScript $(document).read
我的 C# Winform 面板中有一堆文本框。每行文本框的命名如下: tb1 tbNickName1 comboBox1 tb2 tbNickName2 comboBox2 tb3 tbNickNa
我有一个表单,其中过滤器下方有按钮(应用过滤器和清除过滤器),我试图在单击“应用”按钮时显示“清除”,并在单击“清除”按钮时隐藏“清除”按钮。 下面的代码(如果我的表有的话):
excel 按钮正在工作,但是当我添加 pdf 按钮时,它添加仅显示 pdf 按钮 excel 按钮在 pdf 按钮添加后隐藏 $(document).ready(function() { $
我想创建一个 div 作为标题并分成 3 列,并按以下顺序在其中放置 2 个按钮和一个标题:Button1(左位) Title(居中) Button2(右位) 这是我为这个 div 编写的代码:
仅当选中所有框时才应禁用“允许”按钮。我该怎么做?我已经完成了 HTML 部分,如下所示。如何执行其中的逻辑部分?即使未选中一个复选框,也应禁用“允许”按钮
很难说出这里问的是什么。这个问题是含糊的、模糊的、不完整的、过于宽泛的或修辞性的,无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开它,visit the help center 。 已关
如您所知,您可以使用 2 种方法在 HTML5 中呈现按钮: 使用 void 元素 或 如果您需要内容,请使用 元素(不是空元素)。 在JSF2中,有2种方式生成按钮;与UICommand或 UIOu
我尝试根据表单元素的更改禁用/启用保存按钮。但是,当通过弹出按钮选择更改隐藏输入字段值时,保存按钮不受影响。 下面是我的代码。我正在尝试序列化旧的表单值并与更改后的表单值进行比较。但我猜隐藏的字段值无
我有用于在消息(电子邮件、短信)上输入内容的 EditText。我希望在单击 ActionDone 按钮时立即发布消息。我为此使用以下代码: message.setOnEditorActionList
我的 Android 应用程序中有一堆 EditText,每个都将 InputMethod 设置为 numberSigned。我的目标设备没有硬件键盘,而是使用软件键盘输入数字。 Android 将输
我无法以编程方式隐藏弧形菜单中的 fab 按钮。我正在使用https://github.com/saurabharora90/MaterialArcMenu在我的代码中。如何在Java中以编程方式隐藏
我已经看到这在其他类型的对话框窗口中是可能的,例如“showConfirmDialog”,其中可以指定按钮的数量及其名称;但是使用“showInputDialog”时是否可以实现相同的功能?我似乎无法
相同的按钮用于激活和停用。第一次,当代码运行按钮单击并成功“停用”时。但第二次,代码无法找到该元素。第一个案例按钮位于第二个“a”标签中,然后停用第一个“a”标签中的按钮。 案例1: Edit
是否可以将按钮的 onclick 操作设置为 JavaScript 变量?这个想法是我们用 JavaScript 控制一个表。每当点击该表的一行时,我们就会更新一个 JavaScript 变量。该 v
我想创建一个按钮,它包含左侧的文本和右侧的复选框(或任何其他组件)。我怎样才能做到这一点? 我发现我可以制作自己的 View extends Button,但是如果可以的话我应该如何实现 onDraw
我是一名优秀的程序员,十分优秀!