comparison - 如何比较单词的发音？-6ren

comparison - 如何比较单词的发音？

转载作者：行者123 更新时间：2023-12-04 15:36:49

28

4

这是我的一个个人项目，我不知道从哪里开始，因为它远远超出了我的舒适区。

我知道有一些语言学习软件可以让用户记录他或她的声音并将发音与该语言的母语者进行比较。

我的问题是，如何实现这一目标？

我的意思是，如何比较用户和母语者的发音？

最佳答案

如果您正在寻找相对简单的东西，您可以简单地计算录音的 MFCC (http://en.wikipedia.org/wiki/Mel-frequency_cepstrum)，然后查看一些简单的东西，例如录音和母语者发音的单词的平均系数。 MFCC 将音频转换成一个空间，其中欧氏距离与感知差异更紧密地对应。

当然，有几个可能的问题:

对齐两个录音，使系数匹配。要解决此问题，您可以查看系数的最大互相关，而不是简单的相关，因此您将免费获得自动“最佳对齐”。此外，您可能需要剪掉录音的结尾，因此录音中只保留单词的实际发音。

MFCC 映射到感知空间，但可能无法很好地对应口音不准确。您也许可以尝试通过将其与“理想”发音进行比较，而不是将其与几种不同类型的错误发音的平均值进行比较，并查看它最接近哪个模型来解决此问题。

即使是好的重音词也与理想的词平均有一定的“距离”。您必须考虑到这一点，并将输入的距离与“相对”良好距离进行比较。

相关性可能不是比较两种声音的相对相似性的最佳方式。尝试许多不同的指标......尝试不同的 L^p 规范:(http://en.wikipedia.org/wiki/Lp_space)，或者尝试以不同的方式权衡不同的 MFCC(如果我记得，即使在采用 MFCC 之后，尽管它们都应该具有相同的感知“权重”，但中间的那些对于我们如何感知声音仍然比高或低的更重要。)

可能在声音的某些部分，发音对口音的质量更重要。也许瞬时检测可以找到这些位置并将它们标记为更重要的位置会更好。如果你有一大堆“好发音”和“坏发音”的例子，你可能会自动提取这些位置。

同样，最后，您要知道这些选项的哪种组合最有效的唯一方法是通过测试。

关于comparison - 如何比较单词的发音？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/6318168/

28

4

0

文章推荐： lapack - 寻找 LAPACK/BLAS 错误代码列表

文章推荐： python - 在 django 中安装此库 "pip install bcrypt"时出错

文章推荐： SQL 插入多行，一列始终相同，一列不同

.net - 需要库来比较语音轨道(发音)
有两个语音样本(在wav或mp3中)。需要比较两者并设置比较系数。需要训练像Rosetta Stone这样的发音。 .net更喜欢libs。最佳答案从.NET Framework中的System
audio - 如何在在线词典中实现音频(发音)功能？
It's difficult to tell what is being asked here. This question is ambiguous, vague, incomplete, over
ios - 如何更改我的应用程序的 VoiceOver 发音？
当 VoiceOver 打开时，我想控制我的应用程序的发音方式。例如，如果我的应用名为“BLOT”，目前发音为“BLAUGHT”——我想要的发音是“BLOAT”。我这可能吗？我进行了研究，发现有一些方
css - “sass”和“ssss”说话/发音
scss基本上是sass功能的改进实现。我的工作区使用.scss文件。什么是正确的或通用的方式来指代scss时说？我们刚刚把这些文件称为“sass”文件。在只使用scss而不使用sass文件的环境中，
maven - 我可以在 Gradle 中使用 Maven 插件(发音)吗？
我有一个名为 enunciate 的 maven 插件，它可以生成很好的 API 文档。我宁愿使用 Gradle 作为我的构建工具，但它似乎在这方面受到限制，或者我只是不知道如何使用它。我想知道是否

首页

博学

6Ren·AI

商城

comparison - 如何比较单词的发音？