gpt4 book ai didi

c# - 如何检测文本的字符集?

转载 作者:可可西里 更新时间:2023-11-01 00:50:15 26 4
gpt4 key购买 nike

我有一个文本,其中包含显示错误的变音符号,例如:¤ 或 ˇ 或 ˘。我不知道文本是什么字符集。有什么简单的方法可以解决吗?如果有一些在线字符集检测器或者字符集转换预览器会很好吗?我想有一个应用程序可以向我展示一些特定的变音符号在所有可用编码中看起来是如何畸形的,这样我就能够跟踪适合我在文本中的字符的那个。

有什么想法吗?

最佳答案

在 Windows PowerShell 中:

$bytes = [IO.File]::ReadAllBytes('some file.txt')
[Text.Encoding]::GetEncodings() |
%{
$_|Add-Member -pass Noteproperty Text ($_.GetEncoding().GetString($bytes))
} | fl Name,Codepage,Text

调整文件路径并浏览结果,直到您看到看起来正确的内容;-)

这只是遍历 .NET 已知的所有编码,并使用相应的编码将文本转换为字符串。

关于c# - 如何检测文本的字符集?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9142835/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com