gpt4 book ai didi

iphone - 如何使用 withVoice : argument in FliteController class? 放慢声音

转载 作者:太空狗 更新时间:2023-10-30 03:52:14 25 4
gpt4 key购买 nike

我正在使用 OpenEars FliteController 类将文本转换为语音。

我正在使用的方法:

[self.fliteController 说:@“我希望我的应用大声说出这句话。” withVoice:@"cmu_us_awb8k"];

可以在 withVoice: 之后输入的参数选项如下:

cmu_us_awb8k
cmu_us_rms8k
cmu_us_slt8k
cmu_time_awb
cmu_us_awb
cmu_us_kal
cmu_us_kal16
cmu_us_rms
cmu_us_slt

我用 withVoice 尝试了所有这些参数:

但是,我的客户对这些声音并不满意。他告诉我这些都很快。因此,我需要一种使用 withVoice: 参数来减慢语音速度的方法。我该怎么做?还有其他语音可用吗?

最佳答案

从 .911 版开始,速度/音调/方差转换现在是 OpenEars 的一项功能。您可以按如下方式使用它:

使用 FliteController 的以下属性更改语音的速度、音调和可变性:

duration_stretch // Duration of speech
target_mean // Average pitch of speech
target_stddev // Variance

例如,就在发送此消息之前:

[self.fliteController 说:@“我希望我的应用大声说出这句话。” withVoice:@"cmu_us_awb8k"];

您可以对 self.fliteController 进行以下设置:

self.fliteController.duration_stretch = 1.5; // Slow down the speed a bit
self.fliteController.target_mean = 1.2; // Raise the pitch
self.fliteController.target_stddev = 1.5; // Increase the variance

1.0 是默认值,0.0 是最小值,2.0 可能是最大有用值(尽管您可以高于 2.0,但它可能不是有用值)。

duration_stretch 为 .5 的速度是 1.0 的两倍,duration_stretch 为 2.0 的速度是 1.0 的一半。 2.0 的 target_mean 或 target_stddev 将使平均音调频率加倍或使方差加倍,而 0.5 将使它们减半。

您不必设置或覆盖这些设置——如果您不使用它们,它们将被设置为语音的默认值。如果您想在覆盖它们后将它们恢复为默认值,只需将它们全部设置为 1.0:

self.fliteController.duration_stretch = 1.0; // Reset the speed
self.fliteController.target_mean = 1.0; // Reset the pitch
self.fliteController.target_stddev = 1.0; // Reset the variance

关于iphone - 如何使用 withVoice : argument in FliteController class? 放慢声音,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6227034/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com