api - 将语音分解为音素的API/根据语音样本合成新语音？-6ren

api - 将语音分解为音素的API/根据语音样本合成新语音？

转载作者：行者123 更新时间：2023-12-03 13:56:39

28

4

您知道那些技术极客会录制某人声音的电影，而他们的软件将这些声音分解为音素吗？然后，他们可以使用哪一个键入任何短语，并使其看起来好像目标在说这句话？

该软件是否存在于API版本中？我什至不知道谷歌怎么办。

最佳答案

没有这样的软件。将任意语音转换为其组成的音素只是部分解决的问题:speech-to-text软件仍然不完善，text-to-speech也是如此。

想法是重现目标语音的timbre。即使您能够完美地分割音频，对音素重新排序也会产生带有不自然节奏和语调的音频，更不用说剪接人工产物了。到那时，您将进入平滑，时间缩放和音高校正，所有这些在理论上都是可能的并且易于理解，但是在现实世界的数据上运行不佳，尤其是当所涉及的音频样本短至单个音素，以及需要保留音色的时间。

这些问题在语音方面由于基于重音和周围音素的声音变化而变得更加复杂。为了忠实地产生低质量的音频近似值，您需要详细了解目标的语言，口音和语音模式。

此外，您的最终问题是allophonic之一，当涉及到他们认识的人的声音时，人们并不容易愚弄。即使有大量的输入数据，充其量也只能得到一个简短的低质量样本，不足以进行对话。

因此，虽然有可能，但是很困难。即使它存在，也不一定总是足够好。

关于api - 将语音分解为音素的API/根据语音样本合成新语音？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/7019999/

28

4

0

文章推荐： version-control - 是否有任何svn责任等同于clearcase？

文章推荐： cygwin - Cygwin不提供“更多”命令吗？

oop - 合成不是“合成”
组成：一个类可以将其他类的对象作为成员进行引用。这称为合成，有时也称为具有关系。由Deitel P.J.，Deitel H.M. -Java如何编程第9版。在本主题中讨论了这种观点： Prefer
C#合成-我不确信我完全了解如何实现此目标
好的，最近我开始关注类，继承，接口(interface)以及它们之间如何交互。在此期间，我在各种论坛/博客/视频上发现了对继承的普遍不屑一顾，并且青睐作曲。好吧，酷一些新东西要学习。通过使用this
sql - 访问select语句中的上一个“合成”列
如果我有这样的选择语句 SELECT t.time, AS ticks, as num FROM MyTable t; 我可以使用第2列中的计算值作为第3列中计算的基础吗？
VIM + 合成 : how to disable the checker?
我正在使用为我的 HTML 文件启用的 Syntastic。由于我有一个非常大的文件，并且启用了“validator w3”检查器，因此在保存文件时 GVIM 或 VIM 变得非常慢 (:w)。是否
c# - 预乘 alpha 合成
我正在尝试实现预乘 alpha 混合。在这个页面上:What Is Color Blending? ，他们确实解释了标准的 alpha 混合，但没有解释预乘值。 Alpha 混合:(源 × Blend
c++ - Qt + 无框窗口 + 合成
我正在尝试打开几个无框架的弹出窗口(顶级)。我可以通过以下方式实现这一目标: window.setWindowFlags(Qt.FramelessWindowHint | Qt.Dialog) 但问题
java - 合成 lambda 类的神奇类卸载？
我们通常知道一个类cannot be unloaded来自 ClassLoader，但 lambda 的合成类似乎可以。证明: public class Play { static Stri
c - 使用相位累加器的 FM 合成
我正在尝试使用 C 中的相位累加器实现带反馈的 FM 合成运算符。在 Tomisawa 的 original patent 中，进入加法器的相位累加器对负索引和正索引进行计数，从 -pi 正弦波相位的
HTML5 Canvas 合成(源代码)
我正在尝试使用 Canvas 在 HTML5 中重新创建翻页类型的动画。动画基于 this page 的想法.但这并不重要。我遇到的问题是使用“source-in”复合操作没有给我预期的结果，我想澄清
android - 合成 Material 3 中的分隔符
我想在顶栏下方添加一个水平分隔线，如下所示: 我使用的是 Material 3，但无法解析分隔线。这是我的依赖项: dependencies { implementation 'androi
android - 合成 Material 3 中的分隔符
我想在顶栏下方添加一个水平分隔线，如下所示: 我使用的是 Material 3，但无法解析分隔线。这是我的依赖项: dependencies { implementation 'androi
java - 合成 LaF JLabel 禁用颜色
使用 Synth LaF，我无法将 JLabel 的前景颜色设置为“禁用”状态。有人成功做到这一点吗？这是 LaF.xml 文件中标签的样式定义。
python - OpenCV 合成 2 张不同大小的图像
我需要对 2 个大小不同的图像进行 alpha 混合。我已经设法通过将大小调整为相同大小来将它们组合起来，因此我已经得到了部分逻辑: import cv2 as cv def combine_two_
javascript - 合成:如何根据单选按钮中的选定选项动态更改 Canvas 新绘图？
我有一个 related question几个月前关于通过合成 (HTML5 Canvas) 为 Canvas 着色。当我再次遇到它时，我确实以某种方式理解了它是如何工作的。但我今天的问题是，是否可以
c# - 如何合成两个图像(使用 Source In 合成)？
我需要执行 Source In composition在 2 张图片上。例如这张图片: 和蒙版图像(用黑色透明和黑白测试): 应该产生结果: 我正在尝试使用 ImageSharp 来做到这一点: i
Objective-C:id，访问实例属性，合成？
我是 Objective-C 的新手，我想知道是否有一种简单的方法可以将 id 设置为对象实例(具有合成属性)，并直接获取/设置这些属性，例如: id myID = myInstance; myID.
android - 合成 Android fragment backstack
我有一个使用 fragment 来更改 View 而不是启动新 Activity 的 Activity 。假设我有 3 个 fragment A、B 和 C。当应用程序启动时，默认 fragment
适配器或 ViewHolder 中的 Kotlin 合成
我是 kotlin 的新手。我发现并尝试在我的 Activity 类中使用合成方法而不是烦人的方法 findViewById，但我发现“如果我们想在 View 上调用合成属性(有用在适配器类中)，我们
opengl - 如何使用 OpenGL 正确处理 alpha 合成
我正在使用 glBlendFunc(GL_SRC_ALPHA, GL_ONE_MINUS_SRC_ALPHA)对于文档所说的 alpha 组合(实际上在 Direct3D 文档中也说了同样的事情)。
iphone - (iphone)快速 UIImage 合成(合并)？
我正在使用下面的代码来合并两个 UIImage，不知道是否有更快的方法。 - (UIImage*) combineImage: (UIImage*) aImage { UIGraphicsB

首页

博学

6Ren·AI

商城

api - 将语音分解为音素的API/根据语音样本合成新语音？