gpt4 book ai didi

html - 使用 BASH 关闭 HTML 标记后截断注释

转载 作者:太空宇宙 更新时间:2023-11-04 09:53:02 25 4
gpt4 key购买 nike

我正在尝试弄清楚如何仅使用 bash 或通用 GNU 工具 在结束 HTML 标记后去除内容。例如,给定以下 HTML 模板,在不触及嵌入注释且不使用外部语言(如 Python)的情况下,删除尾随注释的有效方法是什么?

<!DOCTYPE html>
<html>
<head>
<title>Site | Page 1</title>
</head>
<body>

<!-- Don't delete me! -->

</body>
</html>

<!--
Man, I really wish to vanish!
-->

我唯一能想到的就是将整个文件读入内存并在那里进行处理,即使用正则表达式魔术获取结束 HTML 标记的位置,然后截断,然后写回磁盘。

最佳答案

sed :

sed -n '1,/<\/html>/p' some.html > truncated.html

示例:

% sed -n '1,/<\/html>/p' some.html
<!DOCTYPE html>
<html>
<head>
<title>Site | Page 1</title>
</head>
<body>

<!-- Don't delete me! -->

</body>
</html>

地点:

  • -n -- 抑制模式空间的自动打印
  • 1是第一行
  • 包含' </html> 的行'是最后一行
  • p打印这些行

关于html - 使用 BASH 关闭 HTML 标记后截断注释,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8886382/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com