- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
Chrome 驱动程序版本:2.41Chrome版本:69.0.3497.92
这是我的代码,通过异常处理向一个网络驱动程序发送多个请求:
from selenium import webdriver
from selenium.common.exceptions import *
options = webdriver.ChromeOptions()
options.add_argument('--headless')
options.add_argument('--no-sandbox')
driver = webdriver.Chrome('/usr/local/bin/chromedriver', chrome_options=options)
driver.set_page_load_timeout(30)
for link in links:
try:
driver.get(link)
except TimeoutException as e:
# do something
continue
except Exception as e:
# do some other thing
continue
预期的行为是,如果抛出 TimeoutException,我将继续向下一个链接发出请求,依此类推。但是,我得到的是,当发生一个 TimeoutException 时,所有其余链接也会抛出 TimeoutException。
这是来自 Chrome 记录器的相关日志。
[1536872569.507][SEVERE]: Timed out receiving message from renderer: 29.449
[1536872569.509][INFO]: Timed out. Stopping navigation...
[1536872569.509][DEBUG]: DEVTOOLS COMMAND Page.stopLoading (id=1243) {
}
[1536872569.509][DEBUG]: DEVTOOLS RESPONSE Page.stopLoading (id=1243) {
}
[1536872569.509][DEBUG]: DEVTOOLS COMMAND Runtime.evaluate (id=1244) {
"expression": "1"
}
[1536872569.510][SEVERE]: Timed out receiving message from renderer: -0.002
[1536872569.513][INFO]: Done waiting for pending navigations. Status: timeout
[1536872569.513][INFO]: RESPONSE Navigate timeout
(Session info: headless chrome=69.0.3497.92)
[1536872569.516][INFO]: COMMAND Navigate {
"sessionId": "9caf0bad68147065f14c9c22632cd6d8",
"url": "www.example.com"
}
[1536872569.516][DEBUG]: DEVTOOLS EVENT Page.frameStoppedLoading {
"frameId": "620369B66F0605C0CE359F34F9D95E36"
}
[1536872569.516][DEBUG]: DEVTOOLS RESPONSE Runtime.evaluate (id=1244) {
"result": {
"description": "1",
"type": "number",
"value": 1
}
}
[1536872569.516][INFO]: Waiting for pending navigations...
[1536872569.516][DEBUG]: DEVTOOLS COMMAND Runtime.evaluate (id=1245) {
"expression": "1"
}
[1536872569.517][DEBUG]: DEVTOOLS RESPONSE Runtime.evaluate (id=1245) {
"result": {
"description": "1",
"type": "number",
"value": 1
}
}
[1536872599.516][SEVERE]: Timed out receiving message from renderer: 30.000
[1536872599.518][INFO]: Timed out. Stopping navigation...
[1536872599.518][DEBUG]: DEVTOOLS COMMAND Page.stopLoading (id=1246) {
}
[1536872599.518][DEBUG]: DEVTOOLS RESPONSE Page.stopLoading (id=1246) {
}
[1536872599.518][DEBUG]: DEVTOOLS COMMAND Runtime.evaluate (id=1247) {
"expression": "1"
}
[1536872599.518][SEVERE]: Timed out receiving message from renderer: -0.002
[1536872599.522][INFO]: Done waiting for pending navigations. Status: timeout
[1536872599.522][INFO]: RESPONSE Navigate timeout
(Session info: headless chrome=69.0.3497.92)
[1536872599.524][INFO]: COMMAND Navigate {
"sessionId": "9caf0bad68147065f14c9c22632cd6d8",
"url": "www.example2.com"
}
以下是我将此事件与其他无任何异常完成的后续请求进行比较时发现的差异。
1) DEVTOOLS EVENT Page.frameStoppedLoading
在向新的“www.example.com”链接发送请求后立即发生。
2) 对从上一个链接发送的 DEVTOOLS COMMAND Runtime.evaluate (id=1244)
的响应会在对新 URL 的请求之后记录。
问题:除了每次发生 TimeoutException 时重新启动驱动程序之外,还有其他方法可以处理此问题吗?
如果有人也能详细说明这种行为,我将非常感激。谢谢。
最佳答案
通过进一步阅读日志,我意识到立即尝试发送另一个请求会导致请求根本无法发送。我在原来的帖子中提出的两个观察结果是在请求成功时发生的,因此您可以忽略它。
以下是成功的连续请求的日志与超时异常处理后的连续请求的日志的比较。
当 Chrome 驱动程序启动时,浏览器 session 会获取一个 id(后面称为frameId)。
[1536915601.693][DEBUG]: DevTools request: http://localhost:34899/json
[1536915601.694][DEBUG]: DevTools response: [ {
"description": "",
"devtoolsFrontendUrl": "/devtools/inspector.html?ws=localhost:34899/devtools/page/A417CC5AE2C87A4D0FC64CF66B54ED72",
"id": "A417CC5AE2C87A4D0FC64CF66B54ED72",
"title": "data:,",
"type": "page",
"url": "data:,",
"webSocketDebuggerUrl": "ws://localhost:34899/devtools/page/A417CC5AE2C87A4D0FC64CF66B54ED72"
} ]
现在情况1:成功响应后的正常请求:
[1536915607.033][INFO]: Done waiting for pending navigations. Status: ok
[1536915607.033][INFO]: RESPONSE GetSource "\u003C!DOCTYPE html>\u003Chtml xmlns=\"http://www.w3.org/1999/xhtml\" lang=\"ko\">\u003Chead>\u003Cmeta http-equiv=\"Content-Type\" content=\"text/h tml; charset=utf-8\" />\n\u003Cmeta name=\"viewport\" content=\"width=device-width, in..."
[1536915607.044][INFO]: COMMAND Navigate {
"sessionId": "d11fb86ec1b49a141f99fe1ec4286a85",
"url": "http://www.gelloy.com/product/detail.html?product_no=438&cate_no=30&display_group=1"
}
# ------ skip for concisiveness ----- #
[1536915607.044][INFO]: Done waiting for pending navigations. Status: ok
[1536915607.044][DEBUG]: DEVTOOLS COMMAND Page.navigate (id=49) {
"url": "http://www.gelloy.com/product/detail.html?product_no=438&cate_no=30&display_group=1"
}
[1536915609.244][DEBUG]: DEVTOOLS RESPONSE Page.navigate (id=49) {
"frameId": "A417CC5AE2C87A4D0FC64CF66B54ED72",
"loaderId": "0EB53CDA615428AA73A9DB67F5FF65E1"
}
在这里,我可以看到
- COMMAND Navigate
- 准备下一个请求
- COMMAND Page.navigate
- 发出请求
- RESPONSE Page.navigate
- 返回开头给出的frameId
对比
情况 2:触发超时后立即发送请求:
[1536872569.513][INFO]: Done waiting for pending navigations. Status: timeout
[1536872569.513][INFO]: RESPONSE Navigate timeout
(Session info: headless chrome=69.0.3497.92)
[1536872569.516][INFO]: COMMAND Navigate {
"sessionId": "9caf0bad68147065f14c9c22632cd6d8",
"url": "www.example.com"
}
[1536872569.516][DEBUG]: DEVTOOLS EVENT Page.frameStoppedLoading {
"frameId": "620369B66F0605C0CE359F34F9D95E36"
}
[1536872569.516][DEBUG]: DEVTOOLS RESPONSE Runtime.evaluate (id=1244) {
"result": {
"description": "1",
"type": "number",
"value": 1
}
}
[1536872569.516][INFO]: Waiting for pending navigations...
[1536872569.516][DEBUG]: DEVTOOLS COMMAND Runtime.evaluate (id=1245) {
"expression": "1"
}
[1536872569.517][DEBUG]: DEVTOOLS RESPONSE Runtime.evaluate (id=1245) {
"result": {
"description": "1",
"type": "number",
"value": 1
}
}
[1536872599.516][SEVERE]: Timed out receiving message from renderer: 30.000
但是,超时后,我看到 COMMAND Navigate
以及要获取的下一个 url,但 COMMAND Page.navigate
从未发生。因此,当从创建 COMMAND Navigate
开始 30 秒后,驱动程序会根据最新的 RESPONSE Page.navigate
的结果确定页面是否已加载。此后会导致超时。
driver.quit()
关闭驱动程序,并在每次发生超时异常时重新打开一个新浏览器。在继续循环之前放置一个
time.sleep(1)
似乎也有效,但我不能确定 1 秒是否足够。
这是我更新后的代码:
driver = webdriver.Chrome('/usr/local/bin/chromedriver', chrome_options=options)
driver.set_page_load_timeout(30)
for link in links:
try:
driver.get(link)
except TimeoutException as e:
# do something
driver.quit()
driver = webdriver.Chrome('/usr/local/bin/chromedriver', chrome_options=options)
driver.set_page_load_timeout(30)
continue
except Exception as e:
# do some other thing
continue
关于python - python 中的selenium - 一次超时会导致所有后续请求超时,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52324331/
我正在尝试从该网站抓取历史天气数据: http://www.hko.gov.hk/cis/dailyExtract_uc.htm?y=2016&m=1 在阅读了 AJAX 调用后,我发现请求数据的正确
我有两个 postman 请求 x,y,它们命中了两个不同的休息 api X,Y 中的端点。 x 会给我一个身份验证 token ,这是发出 y 请求所必需的。如何在请求 y 中发出请求 x ?也就是
我使用请求库通过 API 与其他服务器进行通信。但现在我需要同时发送多个(10 个或更多)POST 请求,并且只有在所有响应都正确的情况下才能进一步前进。通常语法看起来有点像这样: var optio
背景:当用户单击按钮时,其类会在class1和class2之间切换,并且此数据是通过 AJAX 提交。为了确认此数据已保存,服务器使用 js 进行响应(更新按钮 HTML)。 问题:如果用户点击按钮的
我正在将 Node.js 中的请求库用于 Google 的文本转语音 API。我想打印出正在发送的请求,如 python example . 这是我的代码: const request = requi
我经常使用requests。最近我发现还有一个 requests2 和即将到来的 requests3 虽然有一个 page其中简要提到了 requests3 中的内容,我一直无法确定 requests
我正在尝试将图像发送到我的 API,然后从中获取结果。例如,我使用发送一个 bmp 图像文件 file = {"img": open("img.bmp)} r = requests.post(url,
我发现 Google Cloud 确保移出其物理环境的任何请求都经过强制加密,请参阅(虚拟机到虚拟机标题下的第 6 页)this link Azure(和 AWS)是否遵循类似的程序?如果有人能给我指
我有一个 ASP.NET MVC 应用程序,我正在尝试在 javascript 函数中使用 jQuery 来创建一系列操作。该函数由三部分组成。 我想做的是:如果满足某些条件,那么我想执行同步 jQu
我找不到如何执行 get http 请求,所以我希望你们能帮助我。 这个想法是从外部url(例如 https://api.twitter.com/1.1/search/tweets.json?q=tw
我的应用只需要使用“READ_SMS”权限。我的问题是,在 Android 6.0 上,当我需要使用新的权限系统时,它会要求用户“发送和查看短信”。 这是我的代码: ActivityCompat.re
我的前端代码: { this.searchInput = input; }}/> 搜索 // search method: const baseUrl = 'http://localho
我有一个由 AJAX 和 C# 应用程序使用的 WCF 服务, 我需要通过 HTTP 请求 header 发送一个参数。 在我的 AJAX 上,我添加了以下内容并且它有效: $.ajax({
我正在尝试了解如何使用 promises 编写代码。请检查我的代码。这样对吗? Node.js + 请求: request(url, function (error, response, body)
如果失败(除 HTTP 200 之外的任何响应代码),我需要重试发送 GWT RPC 请求。原因很复杂,所以我不会详细说明。到目前为止,我在同一个地方处理所有请求响应,如下所示: // We
当用户单击提交按钮时,我希望提交表单。然而,就在这种情况发生之前,我希望弹出一个窗口并让他们填写一些数据。一旦他们执行此操作并关闭该子窗口,我希望发出 POST 请求。 这可能吗?如果可能的话如何?我
像 Facebook 这样的网站使用“延迟”加载 js。当你必须考虑到我有一台服务器,流量很大时。 我很感兴趣 - 哪一个更好? 当我一次执行更多 HTTP 请求时 - 页面加载速度较慢(由于限制(一
Servlet 容器是否创建 ServletRequest 和 Response 对象或 Http 对象?如果是ServletRequest,谁在调用服务方法之前将其转换为HttpServletReq
这是维基百科文章的摘录: In contrast to the GET request method where only a URL and headers are sent to the serv
我有一个循环,每次循环时都会发出 HTTP post 请求。 for(let i = 1; i console.log("succes at " + i), error => con
我是一名优秀的程序员,十分优秀!