perl - 提取由预定义的多行字符序列包围的部分-6ren

perl - 提取由预定义的多行字符序列包围的部分

转载作者：行者123 更新时间：2023-12-02 05:39:53

24

4

希望AWK高手能解决我的问题。

我有一个这样的文件:

cat cat cat cat cat cat dog rat ate dog tit 
dog cat dog dog dog rat dog pat ate cat dog

我必须使用 AWK 来提取第一个 c 和 d 之间的模式。从第一个 c 开始计数应该保留在 c 和 d 的数量上，这样当计数匹配时，第一个 c 和匹配的部分之间的部分d 应该输出到一个文件中，其中包含匹配 d 的行号。

在这个特定的例子中，匹配发生在第七只狗身上，因此输出必须是:

cat cat cat cat cat cat dog rat ate dog tit 
dog cat dog dog dog rat d

匹配可以超过两行! 输出可以包含也可以不包含c和d。文本中存在各种字符，包括特殊字符!为了进行打印，计数必须匹配。

预先感谢您的回复。随时欢迎提出建议。

编辑:c 和 d 之间模式的捕获可以妥协，只要满足条件和导出行号 d 获得:)

最佳答案

一些提示，没有给出完整的解决方案:

默认情况下，awk 将每一行视为一条记录。默认的记录分隔符是 RS="\n" .

根据您的 awk 版本，您可以设置 RS ，记录分隔符，到匹配 c 的正则表达式或 d .然后，对于每条记录，您可以检查 RT变量，它将包含 c或 d ，取决于实际匹配的内容。从那里开始，使用在 c 上递增的变量, 在 d 上递减当它到达 0 时，您将能够找到匹配的结尾。

然后您可以使用一个包含到目前为止匹配项的变量，并继续连接 RT和新记录，直到你完成。

如果需要知道匹配结束的行号，可以设置RS匹配 c 的正则表达式, d ，和以前一样，但也增加了匹配 \n 的可能性.并通过维护另一个每次递增的计数器变量 RT告诉你\n已匹配，您将获得行号。

关于perl - 提取由预定义的多行字符序列包围的部分，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/11156743/

24

4

0

文章推荐： sql-server - SQL Server 中的 operator != 和 <> 有什么区别？

文章推荐： oracle - 在返回多行的 SQL Plus 中使用绑定(bind)变量？

文章推荐： c# - 如何在 Windows Phone 7/C# 中动态添加项目到列表框

文章推荐： magento - 在安装脚本中更改类别属性

html - 固定中心 div，由可变宽度 div 包围，由固定 Angular div 包围
我想在页面中放置这样一个栏: [ Angular -l][变量][装饰][变量][ Angular -r] “可变”间隔部分应该可以调整大小，但最终，周围的容器(包含所有这些)应该规定最大宽度，并且上
正则表达式识别数字，除非被 "[" "]"包围
我想写一个正则表达式，这样我只匹配没有用方括号括起来的第一个数字。例如asdadsas,*&(*&(*2asdasd*U(*&*()&(*3应该匹配 2(没有方括号) 和 asdadsas,*&(*
c++ - 链接提取和插入、包围
我尝试尝试这些 iostream 奇怪的行为。 int value = 2; cout > 2) > 的性质。在该语言从 C 发展的早期，这些运算符专门用作所谓的“位移位”运算符，其中 > 会将位向右
xcode - IBOutlet 变量名被 ( ` ) 包围？
这个问题在这里已经有了答案: How to use Objective-C classes with names which are keywords in Swift (1 个回答) 关闭 7 年
php - GET 参数意外被 %27 包围？
我看不到问题，我没有对参数进行编码，我只是将变量从一个页面传递到另一个页面。这是页面 A: if (isset($_SESSION['loggedIn'])==1){ ?> '">Edit 这
java - 为什么异常有时需要用 try/catch 包围？
我有一个静态工厂类，如果在调用之前没有进行初始化，它会抛出异常。我不明白为什么 Eclipse 对我大喊大叫，因为我在工厂中抛出了异常(它要求我在 try/catch 中包围抛出异常)，但在另一个类中
java - 我什么时候必须用 try/catch 包围？
我有一些代码: public static void a() throws NumberFormatException { return; } public stati
php - GET 参数意外被 %27 包围？
我看不到问题，我没有对参数进行编码，我只是将变量从一个页面传递到另一个页面。这是页面 A: if (isset($_SESSION['loggedIn'])==1){ ?> '">Edit 这
python - 正则表达式:提取一个长27个字符的子字符串，用“”包围
This question already has answers here: Using explicitly numbered repetition instead of question mar
php - 用
包围
在我的网站上，我有一些图像与其余内容存储在相同的 SQL 单元格中。当我加载包含图像的页面并且 PHP 回显“文章”单元格时，图像会自动包含在段落标签中，这不是我想要的。有什么办法可以防止这种情况发生
javascript - 为什么我返回的 JSON 响应被方括号 [] 包围？
我想弄清楚为什么我的 JSON 响应被方括号括起来。我正在使用 ASP.NET Web API 和 Angular。我在想这就是我的 Angular 代码没有打印到 HTML 的原因。 namespa
java - eclipse:用 if 包围 block
在eclipse中我们可以用try/catch包围一段代码。我想用 if 语句包围一段代码。有没有快捷键。选择代码块后按 Ctrl + 1 没有提示用 If 包围。最佳答案突出显示代码块，按 Al
json - Fiddler 包围 JSON 响应
我有一个用 Go 实现的 Web 服务，它从外部服务返回一个 JSON 结构。返回对象后，它看起来像这样: {"otherServiceInfoList":[],"action... 我的 Go 网络
css - 固定大小居中的 div 被扩展的 div 包围
我在一个网站上工作，客户想要类似这样的东西:http://www.csszengarden.com/?cssfile=202/202.css有几个叠加层附加到屏幕的边缘，而中心的文本以原始浏览器滚动条
react-native - 包围 react-native-vector-icons
我想圈出 react-native-vector 图标。我在样式中添加了一个边框半径，但它对所有设备都没有帮助，而且每个图标的行为都不同。 react 原生矢量图标的链接: https://
java - 如何用 xml 包装(包围)java 匹配器组？
使用文本节点的以下值... MatcH one MatcHer two MarcH three 如何使用 java matcher.find() 创建以下输出？ MatcH one MatcHer t
java - 添加 throws 声明或用 try catch 包围
我有一个读取文件的非常简单的程序。 eclipse 要求我添加 throws 声明或用 try catch 包围。哪一个是“合适的”。以及如果我已经在方法级别 try catch ，为什么还必须拥有其
css - 用 span 包围 div 中的所有内容 - 为什么？
在我们从“psd2html”服务获得的代码中，我看到围绕 div 标签的内容有很多跨度。我知道 span 和 div 之间的区别，但我不明白为什么代码看起来像这样: Forgot pass
javascript - 如何显示内联 "input"元素，被 div 包围
我有一个 HTML 代码，有 3 个输入字段:
如果没有被 #{.* 和 .*} 包围，则 Java RegEx 匹配
我正在尝试替换字符串中单词 true 的所有实例，例如在 "true && 0 || 1" 中. 这些字符串可能包含变量值，标记为#{varname} .我不想替换被 #{ 包围的实例和 } . 例子

首页

博学

6Ren·AI

商城

perl - 提取由预定义的多行字符序列包围的部分