gpt4 book ai didi

Azure TTS 神经语音音频文件以 1 字节大小异常创建

转载 作者:行者123 更新时间:2023-12-03 02:29:30 27 4
gpt4 key购买 nike

Azure TTS 标准语音音频文件正常生成。然而,对于神经语音,生成的音频文件异常,大小为1字节。代码如下。

C#代码

public static async Task SynthesizeAudioAsync()
{
var config = SpeechConfig.FromSubscription("xxxxxxxxxKey", "xxxxxxxRegion");
using var synthesizer = new SpeechSynthesizer(config, null);

var ssml = File.ReadAllText("C:/ssml.xml");
var result = await synthesizer.SpeakSsmlAsync(ssml);

​ using var stream = AudioDataStream.FromResult(result);
await stream.SaveToWaveFileAsync("C:/file.wav");
}

ssml.xml - 下面的文件设置为标准语音,工作正常。

<speak version="1.0" xmlns="https://www.w3.org/2001/10/synthesis" xml:lang="en-US">
<voice name="en-GB-George-Apollo">
When you're on the motorway, it's a good idea to use a sat-nav.
</voice>
</speak>

ssml.xml - 但是,以下神经语音文件集不起作用,并且会创建一个空的声音源文件。

<speak version="1.0" xmlns="https://www.w3.org/2001/10/synthesis" xml:lang="en-US">
<voice name="en-US-AriaNeural">
When you're on the motorway, it's a good idea to use a sat-nav.
</voice>
</speak>

最佳答案

查看您所描述的由于某些问题而导致的行为,语音服务未返回任何音频字节。

我最后检查了 SSML 文件,它工作完全正常,即 SSML 没有问题。

作为解决方案的下一步,我建议您添加错误处理代码,以便更好地了解错误并采取相应的操作:

    var config = SpeechConfig.FromSubscription("xxxxxxxxxKey", "xxxxxxxRegion");
using var synthesizer = new SpeechSynthesizer(config, null);

var ssml = File.ReadAllText("C:/ssml.xml");
var result = await synthesizer.SpeakSsmlAsync(ssml);
if (result.Reason == ResultReason.Canceled)
{
var cancellation = SpeechSynthesisCancellationDetails.FromResult(result);
Console.WriteLine($"CANCELED: Reason={cancellation.Reason}");
if (result.Reason == ResultReason.SynthesizingAudioCompleted)
{
Console.WriteLine ("No error ")
using var stream = AudioDataStream.FromResult(result);
await stream.SaveToWaveFileAsync("C:/file.wav");

}

else if (cancellation.Reason == CancellationReason.Error)
{
{
Console.WriteLine($"CANCELED: ErrorCode={cancellation.ErrorCode}");
Console.WriteLine($"CANCELED: ErrorDetails=[{cancellation.ErrorDetails}]");

}
}

上述修改将在控制台应用程序上提供友好的错误消息。

注意:如果您不使用控制台应用程序,则必须修改代码。

示例输出:

这只是一个示例输出。您可能看到的错误会有所不同。 enter image description here

关于Azure TTS 神经语音音频文件以 1 字节大小异常创建,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/65732626/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com