gpt4 book ai didi

通过匹配字符串进行 R 频率计数

转载 作者:行者123 更新时间:2023-12-01 23:54:42 26 4
gpt4 key购买 nike

有人可以帮我解决这个问题吗?非常感谢!

我有一些这样的数据:

    A             B
fruit red apple
fruit green apple
fruit yellow apple
fruit kiwi
fruit golden kiwi
juice apple juice
juice orange juice

我想得到以下内容:

    A             B         freq
fruit apple 3
fruit kiwi 2
juice apple 1
juice orange 1

我可以提供一个字符串向量以在 B 中搜索(即我知道我想查找“apple”、“kiwi”和“orange”)。例如,如果“水果”中有“香蕉”,而我要搜索的项目列表中没有“香蕉”,则只需在结果中显示频率为 1 的“香蕉”即可。

最佳答案

table 单行计算具有特定值的观察次数:

library(stringr)
table(paste(df$A, str_extract(df$B, paste(lookingfor, collapse="|")), sep="."))
# fruit.apple fruit.kiwi juice.apple juice.orange
# 3 2 1 1

这里,paste(lookingfor, collapse="|") 生成一个正则表达式来寻找你所有的单词,str_extract 提取你要找的单词,外层pasteA 变量与提取的值组合在一起(用 . 分隔),table 计算计数每对。

关于通过匹配字符串进行 R 频率计数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24638742/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com