gpt4 book ai didi

nlp - 如何计算音频文件中的口语音节数?

转载 作者:行者123 更新时间:2023-12-02 23:19:46 27 4
gpt4 key购买 nike

我有很多音频文件,音频干净,只有普通话语音。我需要估计每个文件中有多少个音节。有适用于 OS X、Windows 或 Linux 的工具可以估计这些吗?

sample01.wav 15
sample02.wav 8
sample03.wav 5
sample04.wav 1
sample05.wav 18

由于文件较多,首选命令行或批处理软件,例如:

$ application sample01.wav
15
  • 使用语音转文本,然后计算出现的字符数的解决方案比较适合。

最佳答案

语音自动分割是一个活跃的科学领域,这意味着没有完美的方法。

2009 年,de Jong 和 Wempe 提出了一种使用 Praat 自动检测人类语音信号中的音节的方法。 。该方法与人为分割相媲美,并已在许多第三方科学研究中得到采用。您可以在他们的科学文章 ( pdf ) 中找到该方法的详细描述,以及对先前提出的方法的历史观点。 Praat 脚本本身和一些教程可以在专用网站 ( www - speechrate ) 上找到。

您可能还对 Harma 开发的另一种分割算法感兴趣已在 Matlab 中实现 ( Harma Syllable Segmentation )

关于nlp - 如何计算音频文件中的口语音节数?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/19727261/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com