gpt4 book ai didi

java - 为什么用Jsoup解析后内容不一样

转载 作者:行者123 更新时间:2023-12-01 11:57:55 27 4
gpt4 key购买 nike

我正在尝试解析this使用 JSOUP 的 url。当我解析 this 时,我得到解析的文档,例如 unicode 格式,而不是实际数据。 url 根据需要为我提供了正确的印地文文本。我正在使用下面的代码来解析 URl。顺便说一句,网址托管在我的网站上。服务器上的文本文件有问题吗?我无法弄清楚这一点。

    Document doc = Jsoup
.connect(
"hindi-stories.kratav.com/content/social_aalha.html")
.userAgent("Mozilla").timeout(15 * 1000).get();

最佳答案

我检查了第一个URL的源代码,没有指定编码。而第二个有一个元:

<meta http-equiv="Content-Type" content="text/html; charset=utf-8">

尝试使用指定字符集的方法解析第一个 URL,即:

Document document = Jsoup.parse(new URL(url).openStream(), "UTF-16", url);

关于java - 为什么用Jsoup解析后内容不一样,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28214491/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com