- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我们正在学习使用 JSOUP 和 urlconnection,因此我们正在解析我们选择的网站中的页面,并解析页面以回答有趣的问题。
一切正常,但是时不时地我会收到 SocketTimeOutException。我认为这是因为网站断开了我的程序(或者超时,或者限制,或者其他什么)。
每次下载新页面时,我都实现了 0-30 秒的随机 sleep 。我认为这有帮助,但这种情况仍然会发生。所以现在我 try catch 异常并 hibernate 15 分钟,然后再次递归尝试。
有没有更好的方法来处理这个问题?这是我收到异常的原因吗?
此外,每隔几分钟以某种方式更改 IP 是否会有帮助(这在 Java 中可能)?谢谢
最佳答案
Everything works well, however every now an then I get a
SocketTimeOutException
. I think this is because the website disconnects my program (or times me out, or throttles, or something).
HTTP 中的连接失败是预期的。这就是协议(protocol)的本质。造成这种情况的原因可能有很多(您的 newtork 不稳定,他们的网络不稳定,他们的防火墙认为您正在攻击他们并阻止,您的防火墙认为您受到攻击并阻止)。
I have implemented a random sleep between 0-30 seconds every time a new page is downloaded. and I think it helps but it still happens. So now I try to catch the exception and sleep for 15 minutes before recursively trying again.
每次成功获取页面或每次出现错误时我都会 sleep ,然后重试。不过,我不会等太久(15 分钟?),我会让两者都最多 1 分钟。
Is there a better way to handle this? Is this the reason I am getting the exception?
如上所述,由于网络原因,您会遇到异常。您对此无能为力,这是正常的网络行为。
Also, would it help to change IP somehow every few minutes (and is that possible in Java)?
如果目标网站执行某种日志记录并在 n
个请求后阻止 IP 地址,则会有所帮助。尽管如此,您仍无法通过 Java 按照您想要的方式更改它。 IP 地址属于机器(而不是程序),并且大多数情况下是由其他人而不是您分配的。
您可以通过代理发出 HTTP 请求,然后它们的 IP 地址将到达目标服务器(当代理被禁止时您将更改代理),但这将使您的连接更加不稳定,因为您在“交易”上再添加一层。
关于java - 解析网站时出现 SocketTimeoutException(HW),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16753341/
我有一个给定的 FTP 服务器。我可以通过 WinSCP 和其他程序连接到服务器。我已经通过 Java 连接到服务器,但过了一会儿我无法连接。根据 WinSCP,我可以一直连接。现在的问题是服务器是问
以下代码应根据是否达到超时抛出异常: public boolean isAlive(int workerNum) throws Exception { System.out.println("
我正在编写一个从服务器接收数据的 Android 应用程序。理论上不可能有互联网连接,所以我尝试通过捕获 SocketTimeoutException 来显示错误消息重试屏幕或其他内容来捕获这种情况。
我试图在我的 Android 手机上测试我的第一个应用程序,但扫描后,我收到以下错误消息: “ Uncaught Error :java.error.sockettimeoutexception:10
当客户端 A 连接到服务器 B 时,我们在服务器 B 上收到 java.net.SocketTimeoutException。不知道为什么。客户端正在向服务器发送数据,然后服务器抛出此异常。如何解决此
以下是我尝试编写的 Java 应用程序的一小部分: Socket socket = new Socket(hostname, portnumber); DataInputStream socketIn
'java.net.SocketTimeoutException:连接超时' 循环一段时间后我收到此错误。为什么我会收到 SocketTimeoutException?我该如何修复这个错误? @Ove
很抱歉,如果这已发布在我工作/寻找几天的地方。 问题: 当通过对等网络与 Android 设备进行通信时,我收到 SocketTimeoutExceptions。 详细信息: 发生这种情况时,andr
我正在尝试使用 DOT NET 网络服务将我的 Android 应用程序连接到我计算机中存在的 MySql 数据库(本地主机)。我能够仅通过单一输入 (EditText) 连接到在线数据库。这里有 3
我正在我的 android 应用程序中使用改造构建一个 Restful 客户端,但是我在尝试从我的网络服务中检索数据时遇到异常,第一次调用毫无异常(exception)地工作,但我更改了参数并重试获取
我有一个复杂的应用程序,可以从我在 AWS 上的网络服务下载大量内容。但是,我一直有 50% 的时间收到 SocketTimeoutException。根据我的研究,我怀疑可能有以下原因: 连接超时
我想在我的应用程序中使用 REST API。它为我从这个应用程序发出的所有请求抛出 SocketTimeoutException。 Logcat 输出:(您也可以在此处看到带有漂亮格式的输出:http
假设我有一个名为 SuperSocket 的套接字变量,有什么方法可以捕获超时异常吗? SuperSocket.setSoTimeout(5000); catch (Soc
我为 Retrofit 设置: private Interceptor interceptor = new Interceptor() { @Override publ
我正在尝试向服务器发送 POST 请求以获取数据,但有时会发生 SocketTimeoutException! 我使用 Ok3Client 解决了它,但我遇到了同样的异常我该如何解决它? 我的代码在下
我正在运行多个工作线程(大约 10 个)来访问来自 redis Q 的数据。 对于我正在为 Jedis Client 使用无限超时。 Jedis jedis = pool.getResource();
我有一个运行spring-boot的应用程序,可以访问mongodb 当我使用单个docker run命令时,该应用程序运行正常。但是,当我尝试将它们全部作为服务运行时,由于某种原因,该应用程序永远无
我正在开发一个 Web 应用程序,它接受来自第三方的 json 数据,处理该数据并使用处理后的 json 数据响应它们。 我在生产服务器上收到 java.net.SocketTimeoutExcept
我们正在学习使用 JSOUP 和 urlconnection,因此我们正在解析我们选择的网站中的页面,并解析页面以回答有趣的问题。 一切正常,但是时不时地我会收到 SocketTimeOutExcep
我正在编写一个小应用程序,它使用深度优先搜索通过URL扫描所有页面。所以我应该多联系。在 n 页之后,我通常会捕获 SocketTimeoutException 并且我的应用程序崩溃。那么避免这种情况
我是一名优秀的程序员,十分优秀!