gpt4 book ai didi

tensorflow - 使用 Tensorflow 进行 IPA(国际音标)转录

转载 作者:行者123 更新时间:2023-12-03 09:06:52 27 4
gpt4 key购买 nike

我正在考虑设计一个软件平台,以帮助语言学家和人类学家研究以前未研究过的语言。统计数据显示,大约有 1,000 种语言从未被各自语言群体之外的人研究过。

我的目标是利用 TensorFlow 创建一个平台,让语言学家能够更有效地研究和记录这些语言,并帮助他们为那些还没有书面系统的语言创建书面系统。他们目前完成此类任务的方法有三部分:1) 录制母语人士用该语言交谈的内容,2) 收听该录音并尝试将其转录成国际音标,3) 从语音学出发,分析音位和语言的音位学,最终为说话者创建一个书面系统。

我提议的平台会将研究时间从至少一年缩短到最多六个月。在开始之前,我有一些问题......

训练 TensorFlow 将实时音频转录为 IPA 需要什么?这已经完成了吗?如果是这样,我将如何利用该项目以前的解决方案?使用 TensorFlow 可以实现这样的项目吗?如果没有,您建议使用什么来代替?

对于这个问题的严重性,我深表歉意。我在机器学习领域没有太多经验,因为我刚刚开始这个项目的研究过程。如有任何帮助,我们将不胜感激!

最佳答案

我想我会首先回答这个问题。由于问题非常笼统,所以我的回答也必须非常笼统。

  1. 需要什么。至少您必须拥有大量预先转录的数据。理想情况下,大量口语音频映射到拼音字母中的字符,因此系统可以学习单个字符的声音,而不是整个转录单词的声音。如果这样的数据集不存在,则可以使用粒度较小的数据集,将单个单词映射到其转录。然后你需要一个模型,即以代码实现的实际神经网络架构。最后,您需要一些计算资源。这不是你可以随意训练的东西,你要么必须在基于云的机器学习框架(如 Google Cloud ML)上花费一些时间,要么构建一个相当昂贵的机器在家训练。

  2. 这已经完成了吗?我不知道。我不这么认为。已经发表的论文报告了语音转录训练系统取得了不同程度的成功。例如,http://deeplearning.stanford.edu/lexfree/lexfree.pdf看来,由于您想要转录的字母表是专门为捕获单词的发音方式而设计的,而不仅仅是写下单词,因此您可能会在训练这样的模型时取得更大的成功。

  3. 使用 TensorFlow 可以吗?是的,很有可能。 TensorFlow 非常适合实现大多数现代深度学习架构。除非您最终为此目的设计了一些非常奇怪且非常原创的模型,否则 TensorFlow 应该可以正常工作。

编辑:经过第 1 部分的思考,您必须使用一个数据集将口语单词映射到其转录,因为我预计相同的声音单独发音时会有所不同用于单词中。

关于tensorflow - 使用 Tensorflow 进行 IPA(国际音标)转录,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46694770/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com