gpt4 book ai didi

python-3.x - 使用python索引音频以获取每个单词的时间戳

转载 作者:行者123 更新时间:2023-12-03 02:31:49 25 4
gpt4 key购买 nike

我有一个音频文件,我想获取每个单词的时间戳。我想知道在每个时间段所说的话。

(例如,如果音频文件说“我是医生”,我想知道在哪个瞬间说出“我”,说出“上午”,依此类推)

我想使用python做到这一点。
我尝试了以下代码。

from SimpleAudioIndexer import SimpleAudioIndexer as sai
indexer = sai(mode="ibm", src_dir="D:/Codes/Python/audio recognition",
username_ibm="", password_ibm="")
indexer.index_audio(basename = "target.wav")
indexer.save_indexed_audio("{}/indexed_audio".format(indexer.src_dir))
indexer.load_indexed_audio("{}/indexed_audio.txt".format(indexer.src_dir))
print(indexer.get_timestamps())

但是我遇到以下错误。
Traceback (most recent call last):
File "D:\Codes\Python\audio recognition\rec.py", line 5, in <module>
indexer.index_audio(basename = "target.wav")
File "C:\Users\Awais\AppData\Roaming\Python\Python37\site-
packages\SimpleAudioIndexer\__init__.py", line 1108, in index_audio
self._index_audio_ibm(*args, **kwargs)
File "C:\Users\Awais\AppData\Roaming\Python\Python37\site-
packages\SimpleAudioIndexer\__init__.py", line 928, in _index_audio_ibm
replace_already_indexed=replace_already_indexed)
File "C:\Users\Awais\AppData\Roaming\Python\Python37\site-
packages\SimpleAudioIndexer\__init__.py", line 730, in _prepare_audio
self._filtering_step(basename)
File "C:\Users\Awais\AppData\Roaming\Python\Python37\site-
packages\SimpleAudioIndexer\__init__.py", line 638, in _filtering_step
universal_newlines=True).communicate()
File "C:\Program Files (x86)\Microsoft Visual
Studio\Shared\Python37_64\lib\subprocess.py", line 800, in __init__
restore_signals, start_new_session)
File "C:\Program Files (x86)\Microsoft Visual
Studio\Shared\Python37_64\lib\subprocess.py", line 1207, in _execute_child
startupinfo)
FileNotFoundError: [WinError 2] The system cannot find the file specified

最佳答案

从我的代码/错误中可以看出,您正在运行Windows,但是在src_dir字符串中使用正斜杠“/”。由于Windows在浏览文件夹时使用反斜杠“\”,因此无法使用。如:
C:\ Windows

尽管许多基于Unix的系统都使用正斜杠,如下所示:
/ home /阿瓦斯

在您的代码中,您应该尝试将“/”更改为“\”,看看是否有区别。

如果您打算同时在Windows和Unix系统上使用此程序,则应使用python3的“pathlib”来确保目录路径在任何一个OS上都能工作。这是一个链接,您可以使用它来了解有关在python3中处理路径的更多信息:

https://medium.com/@ageitgey/python-3-quick-tip-the-easy-way-to-deal-with-file-paths-on-windows-mac-and-linux-11a072b58d5f

关于python-3.x - 使用python索引音频以获取每个单词的时间戳,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/61941378/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com