gpt4 book ai didi

r - 如何提取特定字符串后跟任意数字?

转载 作者:行者123 更新时间:2023-12-03 09:00:24 25 4
gpt4 key购买 nike

我有一个小问题。我有这种格式的文本:

A.1 Goals

Section 1: Blah Blah Blah
Random sentence A. Random sentence.
Section 2: Blah Blah Blah
Random sentence A.
Random sentence.

A.2 description

我想获得以下输出:

A.1 Goals

Section 1: Blah Blah Blah

Section 2: Blah Blah Blah

A.2 description

基本上如何获取重复多次且后跟任何可能数字的任何字符串(相同字符串和不同数字的任何模式)

最佳答案

使用readLines读取后,我们可以使用grep。在这里,我们匹配字母(“A”后跟 . 后跟一个或多个数字 - \\d+)或 (|)(如果文本开头)包含“Section”(^Section),后跟一些字符(.*),如果有重复的单词,则后跟空格((\\w+\\s *)\\1 - \\1 是捕获组的反向引用)

out <- grep("(^A\\.\\d+)|(^Section.*\\b(\\w+\\s*)\\1)", lines, value = TRUE)
cat(out, sep= "\n\n")
#A.1 Goals

#Section 1: Blah Blah Blah

#Section 2: Blah Blah Blah

#A.2 description

数据

lines <- readLines("file.txt") #reading from the file

关于r - 如何提取特定字符串后跟任意数字?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50992601/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com