gpt4 book ai didi

按照官方 'Revised Romanization of Korean' 罗马化韩文

转载 作者:行者123 更新时间:2023-12-04 07:34:31 24 4
gpt4 key购买 nike

我希望将韩文地名罗马化。函数 stringi::stri_trans_general 支持韩文罗马化,但显然不符合广泛应用和官方的 Revised Romanization of Korean 方案。
下面的代码揭示了一些潜在的转换问题:

library(stringi)
Sys.setlocale(category="LC_ALL", locale="Korean")

#Read hangul "서울특별시 종로구 사직동" pasted in win10 notepad file because directly pasting in console doesn't work
x <- readLines("hangul.txt", encoding="UTF-8")

#Try the two different tranform identifiers I have found in stri_trans_list for hangul-to-latin
stri_trans_general(x, "Hangul-Latin")
[1] "seoulteugbyeolsi jonglogu sajigdong"
stri_trans_general(x, "Hang-Lat")
[1] "seoulteugbyeolsi jonglogu sajigdong"
根据韩国的修改过的Romanization,输出应为“seoulteu ķ byeolsi麻将 Ñ OGU佐治 ķ洞”而不是“seoulteu ģ byeolsi麻将 大号 OGU佐治 ģ洞”(我的大写表示强调)。如何在 R 中使用 stringi 或其他方式实现所需的罗马化?

最佳答案

手册上说stri_trans_general使用ICU图书馆做音译,ICU手册说它使用“韩国文化和旅游部音译与可逆性第8条变体”。我不知道这与您想要的方案有何不同,但在 stringi 的最新开发版本 1.6.2.9004 中是可能的。修改音译。
要获得此版本,请使用

remotes::install_github("gagolews/stringi")
这将需要编译,因此您可能需要安装一些额外的工具才能使用它。运行需要一段时间...
拥有后,您可以执行以下操作(来自 stri_trans_general 的修订帮助页面):
x <- "\uC11C\uC6B8\uD2B9\uBCC4\uC2DC\u0020\uC885\uB85C\uAD6C\u0020\uC0AC\uC9C1\uB3D9"
stringi::stri_trans_general(x, "Hangul-Latin")
## [1] "seoulteugbyeolsi jonglogu sajigdong"
# Deviate from the ICU rules of Romanisation of Korean,
# see https://en.wikipedia.org/wiki/%E3%84%B1
id <- "
:: NFD;
\u11A8 > k;
\u11AE > t;
\u11B8 > p;
\u1105 > r;
:: Hangul-Latin;
"
stringi::stri_trans_general(x, id, rules=TRUE)
## [1] "seoulteukbyeolsi jongrogu sajikdong"

关于按照官方 'Revised Romanization of Korean' 罗马化韩文,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/67801061/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com