audio - 高质量，情感，流畅和可变的文本到语音引擎？-6ren

audio - 高质量，情感，流畅和可变的文本到语音引擎？

转载作者：行者123 更新时间：2023-12-04 01:12:57

27

4

在查看了一些服务/工具之后，我得出了一个结论。大多数 Text-to-Speech 工具的技术含量太高、太机械化——换句话说，就是质量差的 c 语音。
是的，最重要的是，看起来它们带有“硬编码”语音模板，因此缩短了品种/定制。有些工具允许您设置阅读速度和音高，但这还不够。
我对情感方面背后问题的猜测——很难从纯文本中判断情感，如果只是一两句话就更难了。另外，好的 ol' PC 是一台机器——机器没有情感，但那是另一回事。
最困扰我的是，质量。例如，有一些工具可以用来切断单词的顶点，从而产生这些技术性的声音。感觉句子结构有问题。是的，当人们正在研究这些工具时，我想知道，是什么让他们无法再努力改进这些工具……切断顶点，这可不是小事!另外，必须记住，一个好的、高质量的文本到语音转换软件是值得的，嗯……很多!因此产生了一个非常有利可图的产品。
哦，在流利的情况下，我隐藏了问题，感叹等。 (可能这些不适用于流利程度，但我不是英语母语，如果是这种情况请见谅。)
我研究过的工具列表:
相当令人印象深刻，但仍有改进空间(++)
- Loquendo :缺乏声音多样性，有一些小的顶点/流利问题(取决于句子)，太多的咳嗽和例子中的借口!
- Nuance Vocalizer : 虽然仍然缺乏多样性，但提供的一些声音是值得的。

也可以合作以获得更多资源，然后开发不同但几乎相同的产品(--)
- eSpeak :那里最好的机器人之一，因此程序标志(？!)
- Natural Reader (dumb autoplay!!) : 嗯，它有一些流利，但仍然有技术的感觉。
- iSpeech : 用英文将声音设置为日语时，笑得很开心。我敢打赌日本人对此不是很高兴。
- Cepstral + Enhanced Voices ...加上增强的声音会产生很好的糟糕结果，因此，除了大约 5 个声音之外，没有任何增强。
- AT&T : 流利度不错，但句子结尾和机器人太多有问题!
- LumenVox TTS : 看起来像是来自有很多语音工具的背景，但仍然会产生机器人声音。
- 还有一些...

如果我错过了值得一看的东西，请分享。 可以是免费的、商业的、 super 昂贵的……只要它有效，我就感兴趣!
还有问题(-s)..

您认为这些声音的质量、流畅度和多样性背后的主要问题是什么？ 由于情感方面很难判断，我不介意你跳过它，但如果你有一个或两个想法，我不介意你分享你的想法

How is text transformed into speech? 比如，这些工具背后使用了哪些算法？也许一两个新的理论会派上用场。

这些实际上是不同的引擎/驱动程序还是同一驱动程序/引擎的不同语音模式？

是我一个人，还是first之一之间的质量？多年来，Text2Speech 工具没有太大(或根本没有)变化？ 并且不得不承认，这个老式的 Apple 工具比 2000 年以上的一些工具提供了更好的结果，至少在将视频与我所研究的内容进行比较时。)

最佳答案

我不知道您是否正在寻找一个开放的解决方案，但如果您有 Mac，您应该查看 OS X advanced speech markup和“Repeat After Me”短语构建工具。它真的很强大。 Mac OS X 10.5 及更高版本中内置的 Alex 语音比其他语音更高级。

在 Mac 上，突出显示以下文本，按住 Control 单击，然后转到语音 > 开始朗读:

You talkin' to me
[[inpt PHON]] [[slnc 500]] [[rate -30]]
+yUW _1tAOl=kIHn ~AX [[pbas +3]]+mIY?

http://www.mattmontag.com/personal/mac-os-x-speech-synthesis-markup

关于audio - 高质量，情感，流畅和可变的文本到语音引擎？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/6400302/

27

4

0

文章推荐： Rscript - 摆脱 "WARNING: ignoring environment value of R_HOME"

文章推荐： sql/spark-sql : if statement syntax in a query

f# - 类型定义中的“可变”
为什么禁用类型像 type t = A of int | B of string * mutable int 虽然允许此类类型: type t = A of int | B of string * i
Python 可变 NamedTuple
我正在寻找一种类似结构的数据结构，我可以从中创建多个实例并具有某种类型提示而不是不可变的。所以我有这样的东西: class ConnectionConfig(NamedTuple): nam
Swift:间接访问/可变
我需要转到引用的结构: class SearchKnot { var isWord : Bool = false var text : String = "" var to
javascript - 可变/词法环境
如sec 10.4.3中所述当控制进入执行时，执行以下步骤功能对象F（调用者）中包含的功能代码的上下文提供thisArg，而调用方提供argumentsList：如
iphone - 使用事件指示器和标签显示警报(可变)
i make a game that start display Activity indicator And activity indicator bottom display UiLable wi
Scala - 可变(var)方法参数引用
编辑:我在这里不断获得支持。只是为了记录，我认为这不再重要。自从我发布它以来我就不再需要它了。我想在 Scala 中执行以下操作... def save(srcPath: String, destP
hash - 可变 HashMap 键是一种危险的做法吗？
使用可变对象作为 Hashmap 键是一种不好的做法吗？当您尝试使用已修改足以更改其哈希码的键从 HashMap 中检索值时，会发生什么？例如，给定 class Key { int a; /
kotlin - Kotlin(可变)列表
如果您在Kotlin中访问List类型的Java值，则将获得(Mutable)List!类型。例如。: Java代码: public class Example { public stati
python - 可变 str 类扩展
我编写了 str 类(内置)的以下扩展，以便执行以下操作:假设我有字符串 "Ciao" ，通过做"Ciao" - "a"我想要的结果是字符串 "Cio" 。这是执行此操作的代码，并且运行良好: cla
hash - 可变 HashMap 键是一种危险的做法吗？
使用可变对象作为 Hashmap 键是一种不好的做法吗？当您尝试使用已修改足以更改其哈希码的键从 HashMap 中检索值时，会发生什么？例如，给定 class Key { int a; /
SQL 数据库规范化和外键实践(可变/空白键？)
我正在为我的公司设计一个数据库来管理商业贷款。每笔贷款都可以有担保人，可以是个人或公司，在借款业务失败时作为财务支持。我有 3 个表:Loan、Person 和 Company，它们存储明显的信息。
c# - 可变 F# 记录的二进制序列化
我使用二进制序列化从 C# 类中保存 F# 记录。一切正常: F#: type GameState = { LevelStatus : LevelStatus
java - 对齐系统输出中的双(可变)列
import javax.swing.JOptionPane; public class HW { public static void main(String[] args) { Strin
c++ - 可变 FlatBuffers ，性能损失？
使用 flatbuffer mutable 有多少性能损失？是否“正确”使用 FlatBuffers 来拥有一个应该可编辑的对象/结构(即游戏状态) 在我的示例中，我现在有以下类: class Ga
c++ - 可变 lambda 是否有自己的捕获值拷贝？
std::function create_function (args...) { int x = initial_value (args...); return [x] () mut
C++ - 如何在字符串中查找(可变)字符？
我需要在 for 循环中找到用户输入的字符。我通常会这样做如果(句子[i] == 'e') 但是因为在这里，'e' 将是一个单字母字符变量，我不知道如何获取要比较的值。我不能只输入 if (sent
rust - 可变 Vector 中引用的生命周期
我有一个这样的算法: let seed: Foo = ... let mut stack: Vec = Vec::new(); stack.push(&seed); while let Some(ne
for-loop - 如何循环特定(可变)次数？
这个问题可能看起来非常基础，但我很难弄清楚如何做。我有一个整数，我需要使用 for 循环来循环整数次。首先，我尝试了—— fn main() { let number = 10; // An
rust - 如何解构元组以使绑定(bind)可变？
如果我有以下结构: struct MyStruct { tuple: (i32, i32) }; 以及以下函数: // This will not compile fn function(&mut s
mysql - 可变 SQL 列默认值
我希望在每个 session 的基础上指定列的默认值。下面的脚本不起作用，但描述了我想如何使用它。我目前使用的是 MySQL 5.5.28，但如果需要可以升级。 CREATE TABLE my_tbl

首页

博学

6Ren·AI

商城

audio - 高质量，情感，流畅和可变的文本到语音引擎？