gpt4 book ai didi

string - 在 R 中,如何用另一个字符串替换包含特定模式的字符串?

转载 作者:行者123 更新时间:2023-12-04 01:52:41 42 4
gpt4 key购买 nike

我正在从事一个涉及清理大学专业数据列表的项目。我发现很多拼写错误,所以我想使用函数 gsub()用正确的拼写替换拼写错误的。例如,假设“biolgy”在名为 Major 的专业列表中拼错了。如何让 R 检测拼写错误并将其替换为正确的拼写?我试过 gsub('biol', 'Biology', Major)但这仅替换了“biolgy”中的前四个字母。如果我这样做 gsub('biolgy', 'Biology', Major) ,它仅适用于这种情况,但这并不能检测到其他形式的“生物学”拼写错误。

谢谢!

最佳答案

你应该定义一些漂亮的正则表达式,或者使用 agrep来自 base包裹。 stringr package 是另一种选择,我知道人们使用它,但我非常喜欢正则表达式,所以它对我来说是禁忌。

不管怎样,agrep应该做的伎俩:

agrep("biol", "biology")
[1] 1
agrep("biolgy", "biology")
[1] 1

编辑:

您还应该使用 ignore.case = TRUE ,但准备好“手工”做一些簿记......

关于string - 在 R 中,如何用另一个字符串替换包含特定模式的字符串?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5302669/

42 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com