gpt4 book ai didi

text-to-speech - 在同一个 SSML 中混合语言

转载 作者:行者123 更新时间:2023-12-05 06:41:41 26 4
gpt4 key购买 nike

如果我将这一小段 SSML 发送到语音处理器,我会得到两个声音

<speak version='1.0' xml:lang='es-ES'>
<voice xml:lang='es-ES' xml:gender='Male' name='Microsoft Server Speech Text to Speech Voice (es-ES, Pablo, Apollo)'>
<p>
<s>Hola </s>
<s xml:lang='en'>Hello</s>
<s>¿Cómo estas?.</s>
</p>
</voice>
</speak>

一个男人说西类牙语,一个女人说英语。这是 Project Oxford Text to Speech 引擎的限制吗?换句话说,我希望同一个声音会说多种语言,但事实并非如此。

最佳答案

引用SSML spec ,

Specifying xml:lang does not imply a change in voice, though this may indeed occur. When a given voice is unable to speak content in the indicated language, a new voice may be selected by the processor.

虽然当前的回退行为还有待改进,但建议创建多个语音节点并在切换语言时更明确地选择语音。

关于text-to-speech - 在同一个 SSML 中混合语言,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39733805/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com