gpt4 book ai didi

embedded - 小型嵌入式合成语音库/建议

转载 作者:行者123 更新时间:2023-12-04 09:04:00 33 4
gpt4 key购买 nike

对于代码大小比语音质量更重要的 PIC 和/或 ARM 嵌入式系统,是否有任何易于使用的免费或廉价的语音合成库?现在似乎 1 meg 的封装被认为是“紧凑的”,但很多微 Controller 都比它小。早在 1980 年代,Apple 就聘请了一家承包商来生产 Macintalk,它在 7.16MHz 68000 上运行的 26K 封装中提供合理质量的语音,而一个名为 SAM 的程序可以生成不太好但仍然可用的语音,使用在 1MHz 6502 上运行的 16K 封装。SpeakJet 在某种类型的 PIC 上运行语音合成算法。

我可能不会特别需要发表演讲,但希望能够说出由许多预设词组成的信息。显然,可以简单地预先记录所有消息,但使用词汇表,例如100 个单词,我认为存储 16K 的代码加上 1K 的语音字符串会比存储 100 个单词的音频更紧凑。

或者,如果我想存储 100 个单词的音频,生成一组自然流动的单词的最佳方法是什么?在老式的语音合成器上,任何给定的词都可以用三种方式发音:中性屈折、下降屈折(好像后面跟着句号)或上升屈折(后面跟一个问号)。具有中性变化的单词可以以任何顺序拼接在一起,听起来不错。不过,我发现的文本到波形工具似乎喜欢添加更精细的屈折细节,如果将单词切开并重新排序,这些细节听起来会“关闭”。是否有任何工具可以用来产生可以很好地连接和拼接的波浪?如果我确实使用这样的工具,那么哪种音频格式最适合存储波以便在小型微 Controller 上进行有效解码?

最佳答案

上次我这样做时,我能够添加硬件,如:http://www.sparkfun.com/products/9578。您的环境中可能存在专利责任,就像我遇到的那样,强制使用商业软件堆栈或 OTS 芯片。

否则,我用过 http://www.speech.cs.cmu.edu/flite/对于更宽松的项目,它运行良好。

关于embedded - 小型嵌入式合成语音库/建议,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8618477/

33 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com