gpt4 book ai didi

r - 在R中将特殊字母转换为英文字母

转载 作者:行者123 更新时间:2023-12-03 22:45:16 25 4
gpt4 key购买 nike

有没有办法将文本中的特殊字母转换为 R 中的英文字母?例如:

Æ -> AE
Ø -> O
Å -> A

编辑:我需要这个转换的原因是 R 看不到这两个词是一样的:
stringdist('oversættelse','oversaettelse')
[1] 2
grepl('oversættelse','oversaettelse')
FALSE

有些人只使用英文字符来写作,而有些人则不使用。为了比较一些文本,我需要将它们以“相同的格式”。

最佳答案

我最近遇到了一个非常相似的问题,有人指出问题 Unicode normalization (form C) in R : convert all characters with accents into their one-unicode-character form?

基本上,要点是对于许多这种特殊字符存在不止一种 unicode 表示 - 这会与文本比较混淆。建议的解决方案是使用 stringi包函数stri_trans_nfc - 它还有一个功能 stri_trans_general支持音译,这可能正是您所需要的。

关于r - 在R中将特殊字母转换为英文字母,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33911035/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com