- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
是否有可能以编程方式采集某人的语音样本并产生可用于创建合成语音的独特音调/属性?
例如,A 记录自己。该语音样本会产生独特的音调,并被转化为合成语音。这使得人们可以在文本转语音软件中使用这种合成语音,编写他们想要的任何文本,并以 A 的声音朗读。
以今天的条件来看这可能吗?我知道有些公司专业做这件事,但一般来说,一个软件可以做到这一点吗?
最佳答案
使用说话人适应方法,您可以通过相对较少的训练样本获得一些结果,但您仍然应该拥有该人的数百个句子 - 最好带有音标。
我们曾经将其作为一个小型实验室练习,让学生录制自己的声音并使用 HTS 训练语音模型 ( http://hts.sp.nitech.ac.jp/ )。使用 HTS 的“最简单”方法是从此页面下载“依赖于说话者的训练演示”,并用您自己的录音(相同句子!)替换训练语音样本。不过,我们用我们自己的包对另一种语言进行了此操作。
我认为 MaryTTS ( http://mary.dfki.de/ ) 有一些更方便的工具来协助完成此过程,但我从未使用过。
但是 - 对于高质量的声音,您应该有数千个录制的句子。
关于voice - 语音合成 - 创建自定义语音,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/22944177/
Closed. This question does not meet Stack Overflow guidelines。它当前不接受答案。 想改善这个问题吗?更新问题,以使溢出。 3年前关闭。 o
首先,C++ 不是我的语言(我是 java 程序员)。 我看过 Microsoft SAPI 5.1 的示例,我需要一种方法来打印机器中所有可用的语音。我看过 Object token SAPI,我有
这是一个听起来很愚蠢的问题,但我试图在常见问题解答和论坛中寻找答案,但没有找到答案。 就像您可以在移动浏览器的超链接中使用 tel: 一样,您可以设置一个链接以使用 Skype 的软件开始通话: Ca
我在我的应用程序中使用Agora Voice Unity SDK进行语音呼叫。我面临着一个问题,当我离开iPhone的频道时。我的按钮卡丁声停止工作。。通过调查,我发现“AVAudioSession”
我刚刚构建了一个在谷歌助手上运行的语音对话应用程序。但是,我无法弄清楚如何录制此应用程序的演示以与其他人分享。我正在使用 iPhone 和 Mac。视频录制部分工作正常,但我无法录制语音对话。 我尝试
我完全不知所措。当我打电话时: var a = VoiceCommandDefinitionManager.InstalledCommandDefinitions; 或 await Windows.A
我最近使用说话人识别库 - ALIZE 进行编程。但是我有一些关于如何安装和执行演示的问题。有人可以帮我看看我的安装和执行顺序有什么问题。 我使用 Mac OS 系统: 1、下载lib ALIZE和L
我正在尝试使用Pocketsphinx(。进行简单的语音到文本映射。语法非常简单,例如: public = (Matt, Anna, Tom, Christine)+ (One | Two | Th
我正在尝试创建一个 Google 操作,但出现此错误: Your sample invocations are structured incorrectly. Make sure they all i
我需要做些类似的事情:例如获取我的声音片段,然后从中提取声音打印,然后使用它生成具有“MY”音调的声音 暗示,想法或做类似事情的事情会很有帮助 最佳答案 尝试使用Audacity 关于voice-re
已结束。此问题正在寻求书籍、工具、软件库等的推荐。它不满足Stack Overflow guidelines 。目前不接受答案。 我们不允许提出寻求书籍、工具、软件库等推荐的问题。您可以编辑问题,以便
关闭。这个问题需要多问focused 。目前不接受答案。 想要改进此问题吗?更新问题,使其仅关注一个问题 editing this post . 已关闭 1 年前。 Improve this ques
我在 Google API for speech recognition 上取得了优异的成绩自然对话,但是对于 Youtube 视频或电影中的声音识别很差或不存在。 在 iPhone 4 上用西类牙语
我已经创建了一个语音控制的 android 应用程序。我提供了将语言环境更改为日语的选项,英语是默认语言。 日语 TTS 非常好用。但是当语音识别出现时,日语单词被识别为英语单词,因此与英语单词进行匹
语音转子选项之一是打字模式。 当打字模式为标准时,您触摸一个键即可听到该键的作用,您必须双击它才能真正使用它。 当输入模式为盲打时,键盘的行为几乎就像没有打开旁白一样。 有没有办法知道“键入模式”何时
我在 Galaxy S4 中使用 Android 5.0。当我双击主页按钮时,S 语音打开。我想让代码打开它。我使用了下面的代码,但代码只打开谷歌语音。如何在没有任何配置的情况下打开 S Voice?
是否有一种方法(最好向后兼容 Mac OS X 10.3)来判断“系统偏好设置”中的“Voice Over”是否已激活? 最佳答案 这似乎存储在通用访问的首选项文件中。应用程序标识符是“com.app
当我在iOS Voice Over模式下单击时,它将读取标记的元素,但是我想知道标记点x和y,是否有任何API可以获取? 最佳答案 您无法从VoiceOver获得此信息。 API不支持它。您能获得的最
有没有办法阻止 VoiceOver/TalkBack 使用 javascript/CSS 从文本输入中读取 readOnly 属性? 我不希望在 VO 上读取此只读属性。 最佳答案 如果您不希望声明
[可能重复]但我没有在下面找到问题的答案。 是否可以将语音识别作为服务运行?我想实现这样的事情:虽然我的电话通过语音识别处于 sleep 模式,但我需要调用一个号码。除了语音识别,还有什么传感器可以检
我是一名优秀的程序员,十分优秀!