gpt4 book ai didi

regex - 将一组连续的正则表达式应用于多个文件(emacs)

转载 作者:行者123 更新时间:2023-12-05 01:24:16 25 4
gpt4 key购买 nike

我正在开发一个将几十个 html 文件转换为文本文件的项目,并编写了完成这项工作的替换正则表达式公式。问题是,如何连续应用所有六个,然后对目录中的几十个文件中的每一个都这样做?我已经附加了我的组织解释,其中包括正则表达式,但请记住,这些不是问题;他们做他们的工作(在翻译 ^J 等之后)。问题是如何以编程方式将所有六个应用程序应用于目录中的每个(HTML)文件?

* 1. Delete all until >General Conference<
\(.*^J\)*.*?General Conference
* 2. Delete all <p class="copyright"> and after
^.*<p class="copy\(.*^J\)*
* 3. Strip all tags
\(<.*?>\)*
* 4. Remove whitespace lines
^\s-*^J
* 5. Remove ugly numeric identifier
^\s-*[0-9].*^J
* 6. Remove amp
&amp; -> &

最佳答案

  • 用 Dired 打开目录:C-xC-ddirectoryRET
  • 标记要更改的文件,可以按 m ( dired-mark ) 单独标记每个文件,也可以在菜单栏中的“标记”菜单中使用其他某种机制,例如 *。 html RET ( dired-mark-extension ) 用 html 标记所有文件延期。
  • QregexRETRET ( dired-do-query-replace-regexp ) 将任何正则表达式示例替换为空。您可以为此使用 Ωmega 的正则表达式。
  • 然后,您可以使用 SPC 替换单个示例或所有示例,而无需使用 ! 询问更多问题。
  • 关于regex - 将一组连续的正则表达式应用于多个文件(emacs),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11592628/

    25 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com