gpt4 book ai didi

java - 获取网页并保存在数据库中?

转载 作者:可可西里 更新时间:2023-11-01 08:22:30 24 4
gpt4 key购买 nike

我如何在 JAVA 中获取 HTML 页面并将其保存到我的数据库中?有没有简单的方法可以做到这一点?

最佳答案

使用 URL 通过 http 接收文件非常简单类:

String rawHtml = IOUtils.toString(new URL("http://yahoo.com").openStream());

IOUtils取自org.apache.commons.io,toString方法将整个输入流读入一个String。不幸的是,通过使用 java.net.URL,您无法控制除网站地址之外的任何内容(cookie、标题信息等):-/就个人而言,我会尽可能使用这种方法,因为 HttpClient 的 API 太复杂(太多 LOC)而无法简单地检索网站的源代码。

关于java - 获取网页并保存在数据库中?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3350704/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com