按照官方 'Revised Romanization of Korean' 罗马化韩文-6ren

按照官方 'Revised Romanization of Korean' 罗马化韩文

转载作者：行者123 更新时间：2023-12-04 07:34:31

24

4

我希望将韩文地名罗马化。函数 stringi::stri_trans_general 支持韩文罗马化，但显然不符合广泛应用和官方的 Revised Romanization of Korean 方案。
下面的代码揭示了一些潜在的转换问题:

library(stringi)
Sys.setlocale(category="LC_ALL", locale="Korean")

#Read hangul "서울특별시 종로구 사직동" pasted in win10 notepad file because directly pasting in console doesn't work
x <- readLines("hangul.txt", encoding="UTF-8")

#Try the two different tranform identifiers I have found in stri_trans_list for hangul-to-latin
stri_trans_general(x, "Hangul-Latin")
[1] "seoulteugbyeolsi jonglogu sajigdong"
stri_trans_general(x, "Hang-Lat")
[1] "seoulteugbyeolsi jonglogu sajigdong"

根据韩国的修改过的Romanization，输出应为“seoulteu ķ byeolsi麻将 Ñ OGU佐治 ķ洞”而不是“seoulteu ģ byeolsi麻将大号 OGU佐治 ģ洞”(我的大写表示强调)。如何在 R 中使用 stringi 或其他方式实现所需的罗马化？

最佳答案

手册上说stri_trans_general使用ICU图书馆做音译，ICU手册说它使用“韩国文化和旅游部音译与可逆性第8条变体”。我不知道这与您想要的方案有何不同，但在 stringi 的最新开发版本 1.6.2.9004 中是可能的。修改音译。
要获得此版本，请使用

remotes::install_github("gagolews/stringi")

这将需要编译，因此您可能需要安装一些额外的工具才能使用它。运行需要一段时间...
拥有后，您可以执行以下操作(来自 stri_trans_general 的修订帮助页面):

x <- "\uC11C\uC6B8\uD2B9\uBCC4\uC2DC\u0020\uC885\uB85C\uAD6C\u0020\uC0AC\uC9C1\uB3D9"
stringi::stri_trans_general(x, "Hangul-Latin")
## [1] "seoulteugbyeolsi jonglogu sajigdong"
# Deviate from the ICU rules of Romanisation of Korean,
# see https://en.wikipedia.org/wiki/%E3%84%B1
id <- "
    :: NFD;
    \u11A8 > k;
    \u11AE > t;
    \u11B8 > p;
    \u1105 > r;
    :: Hangul-Latin;
"
stringi::stri_trans_general(x, id, rules=TRUE)
## [1] "seoulteukbyeolsi jongrogu sajikdong"

关于按照官方 'Revised Romanization of Korean' 罗马化韩文，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/67801061/

24

4

0

文章推荐： c# - 如何在c#中根据日期拆分字符串数据

文章推荐： sorting - 如何在 gnuplot 中对数据 block 进行排序？

文章推荐： Git Pull Request 没有变化但是 git diff show changes

按照官方 'Revised Romanization of Korean' 罗马化韩文
我希望将韩文地名罗马化。函数 stringi::stri_trans_general 支持韩文罗马化，但显然不符合广泛应用和官方的 Revised Romanization of Korean 方案。
java - 如何验证 "Hangul-Korean"文本？
我想在 java 中验证“Hangul-Korean”文本。我将在“String”中包含“Korean”文本并调用“matches()”来验证字符串。正则表达式是为了检测该文本是否为“Korean
Windows 输入法 : custom Korean virtual keyboard
我在使用韩语 Windows IME 时遇到问题。我正在为一款嵌入式软件设计虚拟(屏幕/软件)键盘。我依赖 Windows IME，它似乎适用于日语和中文。如果我使用的是物理键盘，它也可以完美地处理韩
python - rpy2 : Korean characters are not working on rpy2
python 代码: import rpy2.robjects as robjects rCommand='''gender <- c("남자", "남자", "남자", "여자", "여자", "여
php - 在 mysql/php 中选择 Chinese only, Japanese only 和 Korean only 记录
有没有办法在mysql中选择只有中文、只有日文、只有韩文的词？用英语可以通过以下方式完成: SELECT * FROM table WHERE field REGEXP '[a-zA-Z0-9]'

首页

博学

6Ren·AI

商城

按照官方 'Revised Romanization of Korean' 罗马化韩文