gpt4 book ai didi

python - Python-语音识别时间偏移

转载 作者:行者123 更新时间:2023-11-28 19:12:10 26 4
gpt4 key购买 nike

我正在尝试使用python进行语音识别。除此之外,我还需要得到每个单词的开始和结束时间。
我宁愿使用一个能处理这个问题的免费图书馆。我听说Sphinx能够做到这一点,但我找不到任何例子(不管怎样,对于python)。
如果有任何帮助或建议,我将不胜感激。

最佳答案

像这样的:

from os import environ, path

from pocketsphinx.pocketsphinx import *
from sphinxbase.sphinxbase import *

MODELDIR = "../../../model"
DATADIR = "../../../test/data"

config = Decoder.default_config()
config.set_string('-hmm', path.join(MODELDIR, 'en-us/en-us'))
config.set_string('-lm', path.join(MODELDIR, 'en-us/en-us.lm.bin'))
config.set_string('-dict', path.join(MODELDIR, 'en-us/cmudict-en-us.dict'))
config.set_string('-logfn', '/dev/null')
decoder = Decoder(config)

stream = open(path.join(DATADIR, 'goforward.raw'), 'rb')

in_speech_bf = False
decoder.start_utt()
while True:
buf = stream.read(1024)
if buf:
decoder.process_raw(buf, False, False)
if decoder.get_in_speech() != in_speech_bf:
in_speech_bf = decoder.get_in_speech()
if not in_speech_bf:
decoder.end_utt()
print ('Result:', decoder.hyp().hypstr)
print ([(seg.word, seg.prob, seg.start_frame, seg.end_frame) for seg in decoder.seg()])
decoder.start_utt()
else:
break
decoder.end_utt()

更多示例 here

关于python - Python-语音识别时间偏移,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38642310/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com