gpt4 book ai didi

c# - 如何以编程方式读取 .pdf 文件并将其转换为音频(.mp3 格式)?

转载 作者:塔克拉玛干 更新时间:2023-11-02 23:57:20 25 4
gpt4 key购买 nike

我想从我的 C# 应用程序中解析一个 PDF 文件并从中创建一个音频文件。我该怎么做?

我特别在寻找一个好的 pdf 到文本库或一种从文本中剥离 pdf 文件的方法。

最佳答案

你最好有一个 tagged PDF文档作为您的输入文档。这意味着文档包含标记文档逻辑结构的标签(通常 PDF 文档只包含视觉信息)。

然后可以将此 PDF 转换为 DAISY格式,这是数字有声书籍的标准,即存储书籍文本以及逻辑结构和导航功能的中间 XML 格式。

此 Daisy XML 格式可以是 converted to an audio format ,或者您可以使用 Daisy 阅读器(一种物理设备,例如 MP3 播放器)来听书。

Daisy 网站上有一个演示文稿,解释了该工具链的原理:

Accessible PDF to DAISY/NIMAS Conversion

关于c# - 如何以编程方式读取 .pdf 文件并将其转换为音频(.mp3 格式)?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/959683/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com