gpt4 book ai didi

R命令检查文件每一行中的所有大写序列

转载 作者:行者123 更新时间:2023-12-04 23:54:58 25 4
gpt4 key购买 nike

有一个 csv 数据文件,其中填充了大量原始数据,如下所示:

data.frame(
id=1:4,
data=c(
"it's a programming language",
"this data is JUNK",
"refer www.google.com",
"check for more information")
)

我需要处理这些数据,并检查每一行的 ALL CAPS 序列并用 0/1 条目填充新列。

输出文件如下:
id  data                         all_caps
1 it's a programming language 0
2 this data is JUNK 1
3 refer www.google.com 0
4 check for more information 0

如何用 R 实现这一目标?我一直在寻找这个一段时间,无法为每一行的处理找到任何富有成效的结果。

最佳答案

假设您的 data.frame 被称为 test :

test$all_caps <- grepl("[A-Z]{2,}",test$data)

id data all_caps
1 1 it's a programming language FALSE
2 2 this data is JUNK TRUE
3 3 refer www.google.com FALSE
4 4 check for more information FALSE

您可以通过调用 as.numeric 来生成 0 和 1。
test$all_caps <- as.numeric(grepl("[A-Z]{2,}",test$data))

id data all_caps
1 1 it's a programming language 0
2 2 this data is JUNK 1
3 3 refer www.google.com 0
4 4 check for more information 0

关于R命令检查文件每一行中的所有大写序列,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18179564/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com