gpt4 book ai didi

c# - 当我抓取阿拉伯语网站时如何解决陌生人字符的问题?

转载 作者:行者123 更新时间:2023-12-01 22:21:30 27 4
gpt4 key购买 nike

我想抓取这个网站:https://haraj.com.sa

但是当我这样做时,我会得到像这样的字符 stranger character

我尝试了这些方法,但对我不起作用:

string str = "مكاتب ادارية للإيجار";

var bytes = Encoding.UTF8.GetBytes(str);

dataGridView.Rows.Add( Encoding.UTF8.GetString(bytes) );

最佳答案

您应该尝试使用 Unicode 进行此类转换。

string str = "مكاتب ادارية للإيجار";

var bytes = Encoding.Unicode.GetBytes(str);

dataGridView.Rows.Add( Encoding.UTF8.GetString(bytes) );

对于你的情况来说,.Net strings are always as Unicode 更安全。 ,因此您基本上是将 UTF-16 转换为 UTF-8,这可能会导致问题。让我知道这是否适合您。

关于c# - 当我抓取阿拉伯语网站时如何解决陌生人字符的问题?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59477184/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com