- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我希望将韩文地名罗马化。函数 stringi::stri_trans_general
支持韩文罗马化,但显然不符合广泛应用和官方的 Revised Romanization of Korean 方案。
下面的代码揭示了一些潜在的转换问题:
library(stringi)
Sys.setlocale(category="LC_ALL", locale="Korean")
#Read hangul "서울특별시 종로구 사직동" pasted in win10 notepad file because directly pasting in console doesn't work
x <- readLines("hangul.txt", encoding="UTF-8")
#Try the two different tranform identifiers I have found in stri_trans_list for hangul-to-latin
stri_trans_general(x, "Hangul-Latin")
[1] "seoulteugbyeolsi jonglogu sajigdong"
stri_trans_general(x, "Hang-Lat")
[1] "seoulteugbyeolsi jonglogu sajigdong"
根据韩国的修改过的Romanization,输出应为“seoulteu
ķ byeolsi麻将
Ñ OGU佐治
ķ洞”而不是“seoulteu
ģ byeolsi麻将
大号 OGU佐治
ģ洞”(我的大写表示强调)。如何在 R 中使用
stringi
或其他方式实现所需的罗马化?
最佳答案
手册上说stri_trans_general
使用ICU图书馆做音译,ICU手册说它使用“韩国文化和旅游部音译与可逆性第8条变体”。我不知道这与您想要的方案有何不同,但在 stringi
的最新开发版本 1.6.2.9004 中是可能的。修改音译。
要获得此版本,请使用
remotes::install_github("gagolews/stringi")
这将需要编译,因此您可能需要安装一些额外的工具才能使用它。运行需要一段时间...
stri_trans_general
的修订帮助页面):
x <- "\uC11C\uC6B8\uD2B9\uBCC4\uC2DC\u0020\uC885\uB85C\uAD6C\u0020\uC0AC\uC9C1\uB3D9"
stringi::stri_trans_general(x, "Hangul-Latin")
## [1] "seoulteugbyeolsi jonglogu sajigdong"
# Deviate from the ICU rules of Romanisation of Korean,
# see https://en.wikipedia.org/wiki/%E3%84%B1
id <- "
:: NFD;
\u11A8 > k;
\u11AE > t;
\u11B8 > p;
\u1105 > r;
:: Hangul-Latin;
"
stringi::stri_trans_general(x, id, rules=TRUE)
## [1] "seoulteukbyeolsi jongrogu sajikdong"
关于按照官方 'Revised Romanization of Korean' 罗马化韩文,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/67801061/
我希望将韩文地名罗马化。函数 stringi::stri_trans_general 支持韩文罗马化,但显然不符合广泛应用和官方的 Revised Romanization of Korean 方案。
我想在 java 中验证“Hangul-Korean”文本。 我将在“String”中包含“Korean”文本并调用“matches()”来验证字符串。 正则表达式是为了检测该文本是否为“Korean
我在使用韩语 Windows IME 时遇到问题。我正在为一款嵌入式软件设计虚拟(屏幕/软件)键盘。我依赖 Windows IME,它似乎适用于日语和中文。如果我使用的是物理键盘,它也可以完美地处理韩
python 代码: import rpy2.robjects as robjects rCommand='''gender <- c("남자", "남자", "남자", "여자", "여자", "여
有没有办法在mysql中选择只有中文、只有日文、只有韩文的词? 用英语可以通过以下方式完成: SELECT * FROM table WHERE field REGEXP '[a-zA-Z0-9]'
我是一名优秀的程序员,十分优秀!