gpt4 book ai didi

html - 文本管道 : extracting text between two tags

转载 作者:太空宇宙 更新时间:2023-11-04 14:22:35 24 4
gpt4 key购买 nike

我一辈子都想不出如何使用 TextPipe 完成这项任务。

任务:

提取(剪切)此 TEXT 包括开始和结束标记,并获得仅包含这些标记和中间文本的文件。

<div><div class="article">`TEXT`<span id="contentBottomLeft"></span>

我定义了一个带有结束和开始标记的限制过滤器,但下一步是什么?这个过滤器需要一个子过滤器,我不明白我接下来需要使用什么过滤器以及如何自定义它。我需要对数千个 HTML 文件重复这个提取过程。

非常感谢专门针对 TextPipe 的步骤,因为我自己并不是一个程序员。

最佳答案

使用 TextPipe 很容易,顺便说一下,这很棒。

添加 perl 搜索和替换模式过滤器,搜索文本为:

<div><div class="article">[^<]*<span id="contentBottomLeft"></span>
  • 在这里,TEXT 可以是除“<”之外的任何字符 - 这会使模式更快。<​​/li>

将替换文本设置为:

$0\r\n

然后,只需选中搜索/替换过滤器的“提取匹配项”选项即可。

最后,在输出过滤器中,使用“单个文件输出”作为目标文件名。

关于html - 文本管道 : extracting text between two tags,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8169984/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com