gpt4 book ai didi

text-to-speech - 创建TTS包

转载 作者:行者123 更新时间:2023-12-04 08:26:24 25 4
gpt4 key购买 nike

如何创建TTS语音包?

我有一个小型应用程序,可将文本转换为语音,现在我正在使用Microsoft内置的tts程序包来进行文本语音转换,但是,我想让专业的语音艺术家创建一个新的文本来语音转换语音包。问题是,我不知道如何创建该语音包(TTS)

最佳答案

为文本语音转换引擎创建新语音是一个复杂的过程。这不仅仅是让语音艺术家录制音频并从中简单地创建声音的问题。有很多工作要做(将音频分割成音素;构建语音数据;构建字典;正确设置韵律和音频合并/合成规则)。

对于Microsoft Text-to-Speech引擎之类的语音引擎,您还面临语音格式专有的问题,因此您无法以该格式创建新的语音。您还受到引擎功能的限制。

您目前最好的选择是:


切换到使用eSpeak文本语音转换引擎并使用espeakedit来创建自己的声音(请与开发人员联系以寻求帮助)–该引擎使用一种合成方法,使其听起来与Microsoft类似,而Stephen Hawking的声音使用,但是它们非常清晰,而且发音总体上还不错;
使用像Cepstral这样使用语音录音的其他文本语音转换引擎(这些声音听起来更像人类,但是我发现韵律不是很好,破坏了最终的音频);
使用Cepstral的服务来创建满足您需求的语音(这可能很昂贵)。


我正在研究使用来自librivox.org的音频数据来生成文本到语音的声音。不过,距离我可能要运转的任何东西大概还有3-4年的时间。

关于text-to-speech - 创建TTS包,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3164614/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com