gpt4 book ai didi

将HTML网页转换为Markdown格式的工具及方法

转载 作者:我是一只小鸟 更新时间:2023-06-17 22:31:16 26 4
gpt4 key购买 nike

保存博客文章

早期在markdown语法还没有推出来之前,编写blog是在网页上或olw写的,也就是文章是保存在对方的主机上.

最近计划把我在博客园的一些早期html文章转换成markdown的文件,因为md更好地保存,经过实践之后,我保留这两个工具.

PS. 也尝试过python的脚本版本,但运行时会有报错,就省心地选用了相对稳定的工具.

我尝试的几种脚本 放在 html2md ,本文提到的这两个工具是我推荐使用的.


最近更新

本文章写于2020年8月,但是最近2023年6月,我发现了一个更加好用的浏览器插件,支持把网页内容下载保存为markdown文件 。

edge扩展地址: MarkDownload - Markdown Web Clipper - Microsoft Edge Addons 。

那么现在我就直接使用edge的扩展,更加方便了.


html2md

地址: https://github.com/TruthHun/html2md 。

需要下载一个exe,在windows上使用,批量转换脚本如下:

                        
                          @echo on
for /r %%i in (*.html) do html2md.exe %%~pi%%~ni.html %%~pi%%~ni.md
pause

                        
                      

这个工具转换出来的html更加简洁,我目前是使用这个脚本进行转换 。


pandoc

pandoc文档: https://pandoc.org/installing.html 。

使用方法:

安装 pandoc,并配置环境变量,在dos下使用下列语句转换格式.

                        
                          pandoc text.html -o text.markdown

                        
                      

pandoc转换出来的html保留了原来的很多内容,比如一些特定的div #,比如这样子的 。

::: {.content} ::: {#outer_postBodyPS} ::: {#postBodyPS} 。


最后此篇关于将HTML网页转换为Markdown格式的工具及方法的文章就讲到这里了,如果你想了解更多关于将HTML网页转换为Markdown格式的工具及方法的内容请搜索CFSDN的文章或继续浏览相关文章,希望大家以后支持我的博客! 。

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com