gpt4 book ai didi

C#和HtmlAgilityPack编码问题

转载 作者:IT王子 更新时间:2023-10-29 04:26:29 24 4
gpt4 key购买 nike

WebClient GodLikeClient = new WebClient();
HtmlAgilityPack.HtmlDocument GodLikeHTML = new HtmlAgilityPack.HtmlDocument();

GodLikeHTML.Load(GodLikeClient.OpenRead("www.alfa.lt");

因此此代码返回:“Skaitytojo klausimas psichologui: kas lemia homoseksualumÄ…? - Naujienų portalas Alfa.lt”而不是“Skaitytojo klausimas psichologui: kas lemia homoseksualumą? - Naujienų portalas Alfa.lt”。

此网页采用 1257(波罗的海)编码,但 textBox1.Text = GodLikeHTML.DocumentNode.OuterHtml; 返回扭曲的文本 - 波罗的海变音符号被转换为一些奇怪的几个字符长字符串:(

是的,我试过 HtmlAgilityPack 论坛。他们确实很糟糕。

附言我不是程序员,但我从事社区项目,我真的需要让这段代码正常工作。谢谢;

最佳答案

实际上页面是用UTF-8编码的。

GodLikeHTML.Load(GodLikeClient.OpenRead("http://www.alfa.lt"), Encoding.UTF8);

会起作用。

或者您可以使用我的 SO answer 中的代码它检测来自 http header 或元标记的编码,然后正确重新编码。 (它还支持 gzip 以最小化您的下载)。

使用下载类,您的代码将如下所示:

HttpDownloader downloader = new HttpDownloader("http://www.alfa.lt",null,null);
GodLikeHTML.LoadHtml(downloader.GetPage());

关于C#和HtmlAgilityPack编码问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3452343/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com