gpt4 book ai didi

java - 将网页转换为 HTML

转载 作者:太空宇宙 更新时间:2023-11-04 06:51:23 25 4
gpt4 key购买 nike

我想以编程方式将网页转换为 HTML 页面。
我搜索了很多网站,但只提供了转换为 pdf 格式等详细信息。
对于我的程序,现在我将页面另存为 .html,然后提取必要的数据。
有什么方法可以将网页转换为 html 页面吗?谁能帮助我?
如有任何帮助,我们将不胜感激。

我可以详细解释一下

我正在提取喜欢我所管理的页面的用户的姓名。所以我找到了一个链接https://www.facebook.com/browse/?type=page_fans&page_id=pageid我可以在哪里找到用户列表。因此,为了首先获取它,我必须将其保存为 .html 页面,然后提取必要的数据。所以这里我将其转换为 .html,然后提取数据。但我需要的是使用我的程序将该页面转换为 HTML 页面。我希望我的问题现在清楚了

最佳答案

Oracle 提供了以下代码片段,用于以编程方式检索 html 页面 here .

import java.net.*;
import java.io.*;

public class URLReader {
public static void main(String[] args) throws Exception {

URL oracle = new URL("http://www.oracle.com/");
BufferedReader in = new BufferedReader(
new InputStreamReader(oracle.openStream()));

String inputLine;
while ((inputLine = in.readLine()) != null)
System.out.println(inputLine);
in.close();
}
}

您可以使用 FileWriter 和 BufferedWriter 将内容保存到文件中,而不是打印到控制台(this question 中的示例):

    FileWriter fstream = new FileWriter("fileName");
BufferedWriter fbw = new BufferedWriter(fstream);

while ((line = in.readLine()) != null) {

fbw.write(line + "\n");

}

关于java - 将网页转换为 HTML,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23267017/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com