gpt4 book ai didi

c++ - 如何在 Linux 中使用 C++ 库读取 html?

转载 作者:塔克拉玛干 更新时间:2023-11-03 00:30:06 24 4
gpt4 key购买 nike

是否有任何 C++ 库可用于在 Linux 中读取 HTML?

最佳答案

如果你有损坏的 HTML 需要修复,libcurl 是你的 friend + 整洁(HTML 整洁)。

编辑:这是完整的序列

HTML(在文件中)-> tidy(这将清理格式错误的 HTML)-> XSLT 转换(您需要提供一个 XSL 文件来将您的 HTML 转换为 Latex),并使用 libxml/libxsl(http://xmlsoft.org/) -> 然后使用 latex 处理 latex 文档(通过 fork out to latex 命令)或者如果你愿意,你可以下载 lyx 的源代码并看看他们是如何做到的(http://www .lyx.org/)。不幸的是,这个序列太复杂了,无法写成一个例子,我只能给你序列...

关于c++ - 如何在 Linux 中使用 C++ 库读取 html?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4025498/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com