c# - 如何在 c# 中将字符串从 utf8 转换(音译)为 ASCII(单字节)？-6ren

c# - 如何在 c# 中将字符串从 utf8 转换(音译)为 ASCII(单字节)？

转载作者：可可西里更新时间：2023-11-01 08:30:37

24

4

我有一个字符串对象

“有多个字符甚至特殊字符”

我正在尝试使用

UTF8Encoding utf8 = new UTF8Encoding();
ASCIIEncoding ascii = new ASCIIEncoding();

对象，以便将该字符串转换为 ascii。我可以请某人为这个简单的任务带来一些启发，那就是我的下午。

编辑 1:我们正在努力完成的是摆脱特殊字符，如一些特殊的 Windows 撇号。我在下面作为答案发布的代码不会解决这个问题。基本上

O'Brian will become O?Brian. where ' is one of the special apostrophes

最佳答案

这是对你的另一个问题的回应，看起来它已被删除......重点仍然存在。

看起来像 classic Unicode to ASCII issue .诀窍是找到它发生的位置。

.NET 可以很好地处理 Unicode，假设 it's told it's Unicode开始(或保留默认值)。

我猜测是您的接收应用无法处理它。所以，我可能会使用 ASCIIEncoder with一个EncoderReplacementFallback与 String.Empty:

using System.Text;

string inputString = GetInput();
var encoder = ASCIIEncoding.GetEncoder();
encoder.Fallback = new EncoderReplacementFallback(string.Empty);

byte[] bAsciiString = encoder.GetBytes(inputString);

// Do something with bytes...
// can write to a file as is
File.WriteAllBytes(FILE_NAME, bAsciiString);
// or turn back into a "clean" string
string cleanString = ASCIIEncoding.GetString(bAsciiString); 
// since the offending bytes have been removed, can use default encoding as well
Assert.AreEqual(cleanString, Default.GetString(bAsciiString));

当然，在过去，我们只是循环并删除所有字符 greater than 127 ......好吧，至少我们这些在美国的人。 ;)

关于c# - 如何在 c# 中将字符串从 utf8 转换(音译)为 ASCII(单字节)？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/497782/

24

4

0

文章推荐：当 Activity 在后台时，Android 服务无法连接到服务器

Emacs 音译？
有没有办法让音译在 Emacs 中工作，就像现在在 Gmail 中一样？我特别有兴趣让它在西里尔文中工作。作为引用，Gmail 执行以下操作:我可以输入svoboda，它会输出свобода。这允许
ruby - ruby 音译
ruby中非英文字符的音译最简单的方法是什么。即转换如: 翻译“Gévry” #=> "Gevry" 最佳答案 Ruby 有一个 Iconv其 stdlib 中的库以与通常的 iconv 命令非常相似
ruby - iconv 以后会弃用，音译
ruby 1.9.3 警告 iconv 弃用，但我使用 iconv 删除变音符号以从 Iconv.iconv('asccii//translit', 'utf-8', 'Těžiště') 返回 Te
javascript - 如何在 Javascript 中参数化/音译？
在 Ruby on Rails 中，您可以轻松地将“任何”文本转换为适用于子域/路径名的格式。 1) "I am nobody." -> "i-am-nobody" 2) "Grünkohl is a
ios - 音译/转置 NSString 中的字符
我想将西里尔文字符串音译成最接近的拉丁文等价物。例如。 “матрешка”=> “matreshka”，“водка”=> “伏特加”。所以理想情况下，我希望在 NSString 或其他已经了解字母
c# - 如何为多个动态文本框启用 Google 音译 (ASP.Net)
以下是将 Google Transliteration 代码集成到 ASP.Net Pages 中的示例代码(随处可用)。但我的问题是，如何在将在运行时生成的文本框中启用音译？此脚本需要文本框的 I
java - Java Swing 项目中的 Google 音译 API
我正在使用 Java Swing 开发一个音译项目。它可以访问互联网，但我无法设置它。我们该怎么做？我们需要下载 Google API 库还是只需要一个函数调用就可以了？这里有一些有用的音译链接:
ruby-on-rails - postgres unaccent 函数 vs RoR 音译
在我们的 RoR 项目中，我们使用 postgres unaccent 函数来检索我们模型名称属性之一的非重音版本。 name 属性可以包含来自各种语言的任何重音字符。然后我们将其保存为 unacce
java - 如何在我的 Java Web 应用程序中使用 Google 音译 API？
如何在我的 Java 应用程序中使用 Google Transliteration API。如果我给一个String(英语或阿拉伯语)作为输入，Google Transliterator API 应
javascript - 如何根据 Class 而不是 Id 进行 Google 音译
我正在做一个基于泰米尔语的 Web 应用程序。在我的应用程序中，我使用动态字段来添加用户详细信息。那么，动态字段有多个 ID 如何做到这一点或如何使用基于类的 Google 音译？ // Lo
c# - 如何在 c# 中将字符串从 utf8 转换(音译)为 ASCII(单字节)？
我有一个字符串对象 “有多个字符甚至特殊字符” 我正在尝试使用 UTF8Encoding utf8 = new UTF8Encoding(); ASCIIEncoding ascii = new AS
ajax - 谷歌 AJAX 音译 API : Is it possible to make all input fields in the page transliteratable?
我使用过“Google AJAX Transliteration API”，它对我来说很顺利。 http://code.google.com/apis/ajaxlanguage/documentati

首页

博学

6Ren·AI

商城

c# - 如何在 c# 中将字符串从 utf8 转换(音译)为 ASCII(单字节)？