gpt4 book ai didi

unicode - Unicode 文本的罗马化

转载 作者:行者123 更新时间:2023-12-03 11:38:32 33 4
gpt4 key购买 nike

我正在寻找一种方法将 Unicode 字母字符从任何语言音译为带重音的拉丁字母。目的是让外国人深入了解以任何非拉丁文字书写的姓名和单词的发音。

例子:

希腊语:Romanize("Αλφαβητικός")返回 "Alphabētikós" (或“Alfavi̱tikós”)

日语:Romanize("しんばし")返回 "shimbashi" (或“辛巴西”)

俄语:Romanize("яйца Фаберже")返回 "yaytsa Faberzhe" (或“jajca Faberže”)

理想情况下,它应该支持以下脚本中的字符:CJK、印度语、西里尔语、闪米特语和希腊语。它应该是数据驱动和可扩展的,使用来自 Unicode 联盟、美国、欧盟或联合国的数据。代码应该是用 .NET 或 Java 编写的开源代码。

有这样的图书馆吗?

最佳答案

您可以使用 Unidecode Sharp :

[a C#] port from Python Unidecode that itself port from Perl unidecode. (there are also PHP and Ruby implementations available)



用法;
using BinaryAnalysis.UnidecodeSharp;

.......................................

string _Greek="Αλφαβητικός";
MessageBox.Show(_Greek.Unidecode());

string _Japan ="しんばし";
MessageBox.Show(_Japan.Unidecode());

string _Russian ="яйца Фаберже";
MessageBox.Show(_Russian.Unidecode());

我希望,这对你有好处。

关于unicode - Unicode 文本的罗马化,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9842527/

33 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com