perl - 提取由预定义的多行字符序列包围的部分-6ren

perl - 提取由预定义的多行字符序列包围的部分

转载作者：行者123 更新时间：2023-12-02 22:38:01

26

4

希望AWK高手能解决我的问题。

我有一个这样的文件:

cat cat cat cat cat cat dog rat ate dog tit 
dog cat dog dog dog rat dog pat ate cat dog

我必须使用 AWK 来提取第一个 c 和 d 之间的模式。从第一个 c 开始计数应该保留在 c 和 d 的数量上，这样当计数匹配时，第一个 c 和匹配的部分之间的部分d 应该输出到一个文件中，其中包含匹配 d 的行号。

在这个特定的例子中，匹配发生在第七只狗身上，因此输出必须是:

cat cat cat cat cat cat dog rat ate dog tit 
dog cat dog dog dog rat d

匹配可以超过两行! 输出可以包含也可以不包含c和d。文本中存在各种字符，包括特殊字符!为了进行打印，计数必须匹配。

预先感谢您的回复。随时欢迎提出建议。

编辑:c 和 d 之间模式的捕获可以妥协，只要满足条件和导出行号 d 获得:)

最佳答案

一些提示，没有给出完整的解决方案:

默认情况下，awk 将每一行视为一条记录。默认的记录分隔符是 RS="\n" .

根据您的 awk 版本，您可以设置 RS ，记录分隔符，到匹配 c 的正则表达式或 d .然后，对于每条记录，您可以检查 RT变量，它将包含 c或 d ，取决于实际匹配的内容。从那里开始，使用在 c 上递增的变量, 在 d 上递减当它到达 0 时，您将能够找到匹配的结尾。

然后您可以使用一个包含到目前为止匹配项的变量，并继续连接 RT和新记录，直到你完成。

如果需要知道匹配结束的行号，可以设置RS匹配 c 的正则表达式, d ，和以前一样，但也增加了匹配 \n 的可能性.并通过维护另一个每次递增的计数器变量 RT告诉你\n已匹配，您将获得行号。

关于perl - 提取由预定义的多行字符序列包围的部分，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/11156743/

26

4

0

文章推荐： sql-server - SQL Server 中的 operator != 和 <> 有什么区别？

文章推荐： oracle - 在返回多行的 SQL Plus 中使用绑定(bind)变量？

文章推荐： c# - 如何在 Windows Phone 7/C# 中动态添加项目到列表框

文章推荐： magento - 在安装脚本中更改类别属性

PHP:每周和每隔一周的计划(预定)
我对我接管的项目有疑问。我正在转换其他人编写的 MS Access 应用程序并将其转换为 MySQL/PHP Web 应用程序。其中大部分已经完成，但是，当涉及到此应用程序的调度部分时，我处于停滞状态
java - 预定 Spring 方法中的昂贵操作
我有一个带有 @Scheduled 注释的方法。此方法包含长时间运行、昂贵的操作。我担心当计划的方法开始运行时应用程序会变慢。有什么办法可以为预定方法分配优先级吗？在 Spring 中启动低优先级后台
javascript - 网站上自动/预定 JavaScript
我的大学有一个预订项目房间的网站；但除非你很幸运或者半夜醒着，否则要订到房间并不容易。因此，我编写了一个 JS 片段来填写所有必要的字段并提交表单。但是我如何自动化这个过程呢？我的目的基本上是加载
message-queue - 处理数百万条定时(预定)消息的解决方案？
我正在评估处理大量排队消息的可能解决方案，这些消息必须在特定日期和时间交付给工作人员。执行它们的结果主要是对存储数据的更新，它们最初可能是也可能不是由用户操作触发的。例如，想想你在一个假设的大型星际
java - Spring 预定 fixedRateString 作为 Duration
@Scheduled documentation here声明 fixedRateString值可以是 the delay in milliseconds as a String value, e.g
web-services - 优点和缺点 - 在同一台服务器上运行(预定)后台任务和 Web 请求处理
关闭。这个问题是opinion-based .它目前不接受答案。想改善这个问题吗？更新问题，以便可以通过 editing this post 用事实和引文回答问题. 4年前关闭。 Improve t
spring - Spring Boot Batch 中的 Hibernate_sequence 错误(预定)
我有一个有趣的情况。我解析了几个新闻发布网站，想通过调度程序将它们保存到数据库中。但是保存时出现错误。由于交易后写条件 described here . 我的模型类是 @Entity @Table(n
Java 并发实践 “Listing 7.9. Interrupting a task in a dedicated thread.” 。预定 taskThread.interrupt() 的目的是什么？
我正在阅读 Java Concurrency in Practice 并遇到以下代码片段。 public static void timedRun(final Runnable r,
azure - 预定 1 :1 copy of tables between Azure SQL databases using Data Factory without specifying table schema
使用 Azure 数据工厂，是否可以对驻留在 Azure SQL 数据库中的多个(不是全部)表中的所有行执行预定的 1:1 复制/克隆到另一个 Azure SQL 数据库(在本例中为 Azure SQ

首页

博学

6Ren·AI

商城

perl - 提取由预定义的多行字符序列包围的部分