- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我们正在学习使用 JSOUP 和 urlconnection,因此我们正在解析我们选择的网站中的页面,并解析页面以回答有趣的问题。
一切正常,但是时不时地我会收到 SocketTimeOutException。我认为这是因为网站断开了我的程序(或者超时,或者限制,或者其他什么)。
每次下载新页面时,我都实现了 0-30 秒的随机 sleep 。我认为这有帮助,但这种情况仍然会发生。所以现在我 try catch 异常并 hibernate 15 分钟,然后再次递归尝试。
有没有更好的方法来处理这个问题?这是我收到异常的原因吗?
此外,每隔几分钟以某种方式更改 IP 是否会有帮助(这在 Java 中可能)?谢谢
最佳答案
Everything works well, however every now an then I get a
SocketTimeOutException
. I think this is because the website disconnects my program (or times me out, or throttles, or something).
HTTP 中的连接失败是预期的。这就是协议(protocol)的本质。造成这种情况的原因可能有很多(您的 newtork 不稳定,他们的网络不稳定,他们的防火墙认为您正在攻击他们并阻止,您的防火墙认为您受到攻击并阻止)。
I have implemented a random sleep between 0-30 seconds every time a new page is downloaded. and I think it helps but it still happens. So now I try to catch the exception and sleep for 15 minutes before recursively trying again.
每次成功获取页面或每次出现错误时我都会 sleep ,然后重试。不过,我不会等太久(15 分钟?),我会让两者都最多 1 分钟。
Is there a better way to handle this? Is this the reason I am getting the exception?
如上所述,由于网络原因,您会遇到异常。您对此无能为力,这是正常的网络行为。
Also, would it help to change IP somehow every few minutes (and is that possible in Java)?
如果目标网站执行某种日志记录并在 n
个请求后阻止 IP 地址,则会有所帮助。尽管如此,您仍无法通过 Java 按照您想要的方式更改它。 IP 地址属于机器(而不是程序),并且大多数情况下是由其他人而不是您分配的。
您可以通过代理发出 HTTP 请求,然后它们的 IP 地址将到达目标服务器(当代理被禁止时您将更改代理),但这将使您的连接更加不稳定,因为您在“交易”上再添加一层。
关于java - 解析网站时出现 SocketTimeoutException(HW),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16753341/
我需要用*制作一棵树,高度需要是用户插入的数字,再加上2个*作为额外的行,以及它的树干的1/3。 另外,最后一行之前不能有空格。我编写了整个代码,但最后一行也是最长的一行出现之前有一个空格.. 我哪里
我正在尝试编写一个函数来检测是否在数字中找到数字: // returns 1 if source contains num, 0 otherwise int contains_num(source,
我先把整个问题写下来。 A ring is a collection of items that has a reference to a current item. An operation --
以下是我遇到问题的作业。我意识到字符串 piglatin 未初始化,但我不确定如何为其设置变量。 import java.util.*; public class PigLatinHomework {
我对如何使用堆栈以及为什么我什至会在我编写的代码中使用堆栈有点困惑。该评估说要编写一个程序来检查用户输入是否格式正确。这是一个简单的程序,具有三种不同的选项供用户选择。 1. 基本括号 () 2. 标
我做了一个 N 个皇后的 java 项目,需要我打印一个多维数组,显示可以放置皇后的位置。我的数组是整数。它在合适的位置打印出 1 和 0。我想知道是否有一种方法可以在不将数组更改为 String 类
我们正在学习使用 JSOUP 和 urlconnection,因此我们正在解析我们选择的网站中的页面,并解析页面以回答有趣的问题。 一切正常,但是时不时地我会收到 SocketTimeOutExcep
这是为了研究,我只是想确保我的答案 100% 正确。问题给了我骨架代码,我需要填写它。这是代码。 public class WebFragment extends WebViewFragment {
已关闭。这个问题是 not reproducible or was caused by typos 。目前不接受答案。 这个问题是由拼写错误或无法再重现的问题引起的。虽然类似的问题可能是 on-top
我需要计算一个float 数字的位数并保留该数字。我可以将 scanf() 与 %f 或 %c 一起使用,但不能将 %s 与 %s 一起使用,而且我可以使用 getchar()。 我可以使用 getc
在“AmDocs”最近组织的比赛中,我遇到了以下问题:(问题的基本思路) 给定一个大小固定为 12x12 的矩阵。给定六个长度为 6、5、5、4、3、2 的线段。矩阵有空的空间和填充的空间。您必须返回
我们遇到了一个问题,我将其简化为以下内容:给你一个全为 1 的二进制数(例如 11111)和一组相同长度的二进制数(00101、10000、01100、00100、11100)。有两个玩家 A 和 B
我正在做一项作业,但我不知道如何实现它。我必须做一个函数 sadd(int x, int y)返回加在一起的数字,除非它溢出(然后只返回最大可能的整数)。我已经能够想出一些涉及强制转换和条件语句的解决
对于家庭作业,我必须用 C 编写一个函数,将两个有符号整数相加,但如果存在正溢出则返回 INT_MAX,如果存在负溢出则返回 INT_MIN。我必须遵循非常严格的操作符限制。所有整数都是二进制补码形式
我有一个 Loan 类,它在其 printPayment 方法中打印硬件分配的贷款摊销表。我们还将实现先打印付款方式和最后打印付款方式。由于我的计算是在 printPayment 方法中完成的,所以我
大家好。我需要帮助来理解我的硬件分配。我刚开始使用 C++,不太了解。我确实知道堆栈和斐波那契数列的基础知识。但是我并不完全理解给我的问题,不需要解决问题的代码,而是帮助澄清一些步骤。这是硬件: “通
作为我的 C++ 硬件的一部分,我必须实现一个通用的 Map 容器。 我应该实现的映射应该有一个迭代器和一个常量迭代器。我决定将数据存储在 map 中的一个节点内 [就像在链表中一样]。 我得到了 m
C/C++ 程序在具有硬件断点功能的调试器下的嵌入式 PowerPC 上运行。在2个文件和2个任务中相应地已知全局变量'char Name [256]'。例如,一项任务读取 Name,另一项任务用文本
我正在阅读 CSAPP 并尝试完成作业问题。假设 w = 32,2.75 是关于通过将两个 32 位无符号整数相乘得到高 32 位。给定函数 int signed_high_prod(int x, i
我正在寻找最官方的来源来完成/维护这个方法: -(NSString*)platformString { NSString *platform = [self platform]; if
我是一名优秀的程序员,十分优秀!