gpt4 book ai didi

Linux 发行版 info/man/doc/etc 来源

转载 作者:塔克拉玛干 更新时间:2023-11-03 00:24:56 26 4
gpt4 key购买 nike

<分区>

我目前正在构建一个综合性的多发行版/项目/源代码/操作系统开源文档网站。

目前,由于从中获取内容所必需的转换过程,不是不尊重(手册页摇滚)而是标准手册页的神秘格式,我的文本量为 15GB,并且还在增长。

必须有更现代的源格式,我才能从中获取手册页内容。开发人员不会仍在为文档编写 50 年前的 *roff 格式文件,对吗?

我迫切需要尽可能多地删除手册页源,所以这是到目前为止的列表,如果任何为这些项目做出贡献的开发人员可以澄清手册页是原始编写的还是作为构建的一部分从另一种文本格式生成的这将是一个巨大的帮助过程。所以在列表上。

我希望不在使用古老的基于 *roff 的文档文件的地方:

  • FreeBSD
  • NetBSD
  • OpenBSD
  • Debian
  • Ubuntu
  • Gentoo
  • 架构
  • Slackware(实际上我可以使用更好的 slackware“docs”资源,与其他发行版相比,docs.slackware.com 有点“贫血”)
  • SUSE
  • 红帽企业 Linux

因此,作为一名花费大量时间处理基于操作系统的文档文件集中愚蠢的 groff -mandoc 'file' -T html 错误的程序员,我需要帮助并求助于 SO。

选项 1 是对文档内容解析友好得多的替代来源。

与运行相比,选项 2 是重新格式化手册页内容的更好方法

find . -type f -exec sh -c 'cd $(dirname "$0") && groff -mandoc "$0" -T html > "$0.html"' {} \;

find . -type f -exec sh -c 'cd $(dirname "$0") && man2html "$0" > "$0.html"' {} \;

并希望我不会在数千个文件中出现一个错误。所有这些也几乎放弃了 Unicode 多语言支持。

如果在 google 上搜索涉及“man”和“documentation”这两个词的技术内容不是几乎无用的尝试,我自己可能已经找到了解决方案,但它们就在这里。

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com