gpt4 book ai didi

perl - 如何将 UTF8 编码的非 ASCII 字符转换为 Perl 中的 ASCII 等效字符?

转载 作者:行者123 更新时间:2023-12-04 10:46:18 25 4
gpt4 key购买 nike

我有一个 Perl 脚本,第三方调用它来向我发送注册我的软件的人的姓名。其中一方使用 UTF-8 对名称进行编码,因此我相应地调整了我的脚本,以使用 Encode::decode_utf8(...) 将 UTF-8 解码为 ASCII。

这通常可以正常工作,但每 6 个月左右,其中一个名称包含西里尔字母、希腊语或罗马尼亚语字符,因此解码该名称会产生诸如“ПодражанÑкає之类的垃圾字符。我必须跟进客户并要求他提供其姓名的“拉丁字符版本”,以便颁发注册码。

那么,是否有任何 Perl 模块可以检测是否存在此类字符并在必要时自动将它们转换为最接近的 ASCII 表示?

似乎我可以使用 Lingua::Cyrillic::Translit::ICAO 加上 Lingua::DetectCharset 来处理 Cyrillic,但我更喜欢与其他字符集一起使用的东西。

最佳答案

我相信你可以使用 Text::Unidecode为此,这正是它试图做的。

关于perl - 如何将 UTF8 编码的非 ASCII 字符转换为 Perl 中的 ASCII 等效字符?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/638060/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com