text-to-speech - 有没有办法将语音直接转换为 SSML？-6ren

text-to-speech - 有没有办法将语音直接转换为 SSML？

转载作者：行者123 更新时间：2023-12-03 15:52:06

正如人们能够使用各种语音到文本的“听写”工具将口语转换为相应的文本一样，我想知道是否有类似的工具可以将口语转换为相应的 SSML。也就是说，除了与说话者语音中存在的任何语调、韵律、停顿/停顿、屈折变化等相关联的相关 SSML 标签之外，它还将提供文本。

最佳答案

我致力于构建语音应用程序。在我最近从事的一个项目中，我们需要文本听起来完全正确，以及所有相关的语调、韵律、停顿/停顿、屈折等。
在广泛的研究中，我们发现使文本听起来像真人说话的唯一方法是使用 SSML(仍然不完美)或录制的 mp3。

如果你想让一个项目真正的人感觉，执行它的最好方法是利用一个人。我建议您录制 mp3(/由专业人士录制)，而不是尝试从语音中获取 SSML。

我们使用 SSML 的原因正是计算机无法理解人类语音的相关语调、韵律、停顿/停顿、变化等。

如果您的目标是获得 SSML，那么最好的方法是将文本转换为 SSML。为此，我建议在这里看一看:

W3C SSML

Google SSML

Amazon SSML

据我们所知，这是 2018 年 7 月中旬。
如果有人有更多信息，请添加到此答案中。

希望这有帮助:3

关于text-to-speech - 有没有办法将语音直接转换为 SSML？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/46108940/

文章推荐： spring - JPA 外键不是对象

文章推荐： scenekit - 如何为 SceneKit 预编译 PBR 着色器？

行者123

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

text-to-speech - 有没有办法将语音直接转换为 SSML？