- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
这可能与其他韩语编码问题不同。
我必须抓取这个网站,它是韩文的。
他们网站上的一个例句是这样的"개인정보보호를 위해 뒤로가기 버튼 대신 검색결과 화면 상단과 하단의 이전 버튼을 사용하랍닸의
"我正在使用 HttpWebRequest 和 HttpWebResponse 来抓取网站。
这就是我检索 html 的方式
-- 部分代码--
using (Stream data = resp.GetResponseStream())
{
response.Append(new StreamReader(data, Encoding.GetEncoding(code), true).ReadToEnd());
}
现在我的问题是,我没有得到正确的韩文字符。在我的“代码”变量中,代码页基于 MSDN http://msdn.microsoft.com/en-us/library/system.text.encoding.aspx (让我缩小范围)。
这里是韩语代码页:51949, 50225, 20949, 20833, 10003, 949
但我仍然没有得到正确的韩文字符?您认为问题是什么?
最佳答案
很可能该页面不是特定的韩文编码,而是其中一种 Unicode 编码。
尝试使用 Encoding.UTF8
、Encoding.Default
(UTF-16) 而不是特定的代码页。还有 Encoding.UTF7
和 Encoding.UTF32
,但它们并不常见。
为了确定,请检查服务器返回的内容类型的元标记和 header 。
更新(从评论中收集):
由于内容类型 header 是 EUC-KR
,相应的代码页是 51949,这就是您检索页面所需要使用的。
不清楚您是否将其写出到文件中 - 您需要在写出文件时使用相同编码,或者转换 byte[]
从原始文件到输出文件编码(使用 Encoding.Convert
)。
关于C# - 朝鲜语编码,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10031782/
我是一名优秀的程序员,十分优秀!