gpt4 book ai didi

regex - 查找以某个字母开头的所有单词

转载 作者:行者123 更新时间:2023-12-01 10:56:45 25 4
gpt4 key购买 nike

我对 R 和正则表达式都非常生疏。我尝试阅读 R 的正则表达式帮助文件,但它根本没有帮助!

我有一个包含 3 列的数据框:

  • 词汇表,即在语料库中找到的 500 个最常见单词的列表
  • 计数,单词出现的次数,以及
  • 概率,计数除以所有字数的总和

  • 该列表按从最常见到最不常见的顺序排列,因此不按字母顺序排列。

    我需要为以相同字母开头的所有单词拉出整行。 (我不需要遍历所有字母表,我只需要一个字母的结果。)

    我不只是问正则表达式,而是如何在 R 中编写它,以便我在新的数据框中获得结果。

    最佳答案

    您可以使用 grep :

    df <- data.frame(words=c("apple","orange","coconut","apricot"),var=1:4)
    df[grep("^a", df$words),]

    这将给出:
        words var
    1 apple 1
    4 apricot 4

    关于regex - 查找以某个字母开头的所有单词,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14685433/

    25 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com