gpt4 book ai didi

r - 从字符串中提取 X% 的随机词

转载 作者:行者123 更新时间:2023-12-01 12:16:09 25 4
gpt4 key购买 nike

我有一列文字;我想从每个单元格中提取 20% 的随机单词。

示例数据:

text <- c("five1 five2 five3 five4 five5", "ten1 ten2 ten3 ten4 ten5 ten6 ten7 ten8 ten9 ten10", "fifteen1 fifteen2 fifteen3 fifteen4 fifteen5 fifteen6 fifteen7 fifteen8 fifteen9 fifteen10 fifteen11 fifteen12 fifteen13 fifteen14 fifteen15")
id <- c(1, 2, 3)
df <- data.frame(text, id)

这是最终结果的示例:

 df$text_20_random_percent <- c("five4", "ten7 ten2", "fifteen2 fifteen12 fifteen3")

我曾尝试使用 sample() 函数但没有成功。

最佳答案

一个选项是使用 strsplit 将字符串拆分为子字符串,通过指定 获取 split 单词的 sample size 作为 length 的 X% 并将其粘贴在一起

sapply(strsplit(as.character(df$text), " "), 
function(x) paste(sample(x, 0.2 * length(x)), collapse=' '))

关于r - 从字符串中提取 X% 的随机词,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48058062/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com