gpt4 book ai didi

r - 在 R 中用变音符号制表字符

转载 作者:行者123 更新时间:2023-12-04 02:15:02 25 4
gpt4 key购买 nike

我正在尝试将字符串中出现的音素(字符)列成表格,但变音符号单独作为字符列出。理想情况下,我有一个国际音标词表,其中包含大量变音符号以及它们与基本字符的几种组合。我在这里给出了一个只有一个单词的 MWE,但单词列表和更多类型的组合也是如此。

> word <- "n̥ana" # word constituted by 4 phones: [n̥],[a],[n],[a]
> table(strsplit(word, ""))
̥ a n
1 2 2

但想要的结果是:
a n n̥
2 1 1

我怎样才能获得这种结果?

最佳答案

尝试

library(stringi)
table(stri_split_boundaries(word, type='character'))
#a n n̥
#2 1 1

或者
 table(strsplit(word, '(?<=\\P{Ll}|\\w)(?=\\w)', perl=TRUE))
#a n n̥
#2 1 1

关于r - 在 R 中用变音符号制表字符,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30551549/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com