gpt4 book ai didi

xml - 从纯文本文件自动创建分章符和标题?

转载 作者:数据小太阳 更新时间:2023-10-29 02:36:23 24 4
gpt4 key购买 nike

我有一个大文件,它分为多个类别,每个类别名称下方都有一个下划线。该文件不断变化,共有 80 个类别。它是一个纯文本文件。我想使每个类别名称都是 epub 文件中的一个单独章节。我还想确保每一章的名称都是该章的标题。有没有办法使用 Calibre 自动执行此操作?也许一些正则表达式魔术?例如,我希望以下类别的章节标题为:水果、蔬菜、草药。我希望它被自动解析(一种方法可能涉及识别正则表达式中的下划线)。我该怎么做?

Fruit
________
Apples
Bananas

Vegetables
____________
Cucumbers
Zucchini

Herbs
_____
thyme
cayenne

最佳答案

所以你的文本文件基本上是一个差不多markdown文件(read more)。我会将其转换为 html用类似 pandoc 的东西( see here ,请注意 pandoc 支持一些扩展的 markdown 功能,并且功能非常强大(甚至可以生成 epub,但我还没有测试过))。

这样您的标题(带下划线的行)将被转换为 <h*>标签。

然后您可以使用例如 Calibre 的 ebook-convert CLI 工具(或 gui)将其转换为 mobiepub , 并指定分章符(感谢开发人员 Calibre has a really good documentation )。 (我刚刚注意到,Calibre/ebook-convert 可以将 markdown 直接转换为 epub/mobi!)

喜欢:

ebook-convert input.html output.epub --chapter 'YOUR XPATH TO DETECT CHAPTERS' --chapter-mark pagebreak

关于xml - 从纯文本文件自动创建分章符和标题?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13571699/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com