gpt4 book ai didi

html - 如何在终端中解析html文本文件?

转载 作者:太空狗 更新时间:2023-10-29 11:49:18 28 4
gpt4 key购买 nike

我有一个文本文件,即使在删除所有 html 标签后仍然包含一些撇号和其他标点符号示例的 html 代码:

  It's  // It's 

我的问题是如何更改所有这些?

我在 linux 下使用 bash 脚本来获取 html 文件

最佳答案

或者,如果您有 lynx,请将其用作:

lynx -stdin -dump < file.html

上面的代码也会删除 HTML 标签,例如从 file.html

<i>It&#039;s</i>
&lt;<b>&amp;</b>&#62;

打印

   It's <&>

关于html - 如何在终端中解析html文本文件?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47612599/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com