gpt4 book ai didi

icu - 如何使用 uconv 将地名列表转换为 ASCII?

转载 作者:行者123 更新时间:2023-12-04 05:31:06 25 4
gpt4 key购买 nike

我正在尝试“智能地”将地名字符串转换为 ASCII。我想我正在寻找的是音译。我能够使用“uconv”实用程序获得一些令人鼓舞的结果:

假设我的输入是“Emberá”:

uconv -x Latin-ASCII input.dat > output.dat

相应的输出将是“Embera”——正是我想要的。然而,在某些情况下,我没有得到预期的结果,(也许如果输入不是拉丁语?)。例如,检查此地点(我无法将名称正确复制并粘贴到此文本框中) http://maps.google.ca/maps?q=karpos+macedonia&hl=en&ie=UTF8&hnear=Karpo%C5%A1,+Macedonia+(FYROM)&t=m&z=12 .

理想情况下,这将被音译为“Karpos”(我认为),但如果我将其用作 uconv 的输入,使用上述命令,uconv 根本不会修改它。

因此,给定一个地名列表(如果有人好奇,这里是列表 - http://www.mediafire.com/file/gb0guu117yp1p26/test.dat ),我如何将它们转换为 ASCII?

最佳答案

试试 -x 'Any-Latin;Latin-ASCII'您也可以添加 --to-callback escape-unicode -t ascii强制输出中的所有内容为 ascii,否则类似于 {U+3045} .

请注意,“智能”在这里是......相对的。您正在剥离大量信息并进行多层翻译。这不会有多大帮助,但您可以执行以下操作 -x 'el-en;Any-Latin;Latin-ASCII'如果您知道文本是从希腊语到英语(即 el-en),那么它可以尝试使用特定于语言的音译。

关于icu - 如何使用 uconv 将地名列表转换为 ASCII?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12611945/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com