gpt4 book ai didi

python - 使用 pygsr 进行语音识别时出错

转载 作者:太空宇宙 更新时间:2023-11-03 18:35:09 25 4
gpt4 key购买 nike

我正在尝试使用语音识别来搜索我正在从事的项目。目前,我只专注于让语音识别正常工作,并且我正在使用 pygsr 来做到这一点。我在 here earlier 上找到了一篇关于 pygsr 的帖子但我目前正在努力让它发挥作用。这是我正在使用的代码:

from pygsr import Pygsr

speech = Pygsr()
speech.record(3)
phrase, complete_response =speech.speech_to_text('en_US')
print phrase

在花了一段时间在 OS X 上安装这个库之后,我终于让它真正可以工作了。它检测到该库并看似工作,但随后我会收到此错误:

Traceback (most recent call last):
File "<stdin>", line 1, in <module>
File "<string>", line 4, in <module>
File "/System/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/pygsr/__init__.py", line 33, in record
data = stream.read(self.chunk)
File "/Library/Python/2.7/site-packages/pyaudio.py", line 605, in read
return pa.read_stream(self._stream, num_frames)
IOError: [Errno Input overflowed] -9981

我不知道这是否是由于我做错了什么,或者我是否无法在 OS X 上使用 pygsr。如果没有办法让它工作,有没有人对语音识别库有任何建议适用于使用 Python 2.7 的 OS X?

最佳答案

您可以测试运行此脚本的 pyaudio 是否正常工作:

import pyaudio
import wave

CHUNK = 1024
FORMAT = pyaudio.paInt16
CHANNELS = 2
RATE = 44100
RECORD_SECONDS = 5
WAVE_OUTPUT_FILENAME = "output.wav"

p = pyaudio.PyAudio()

stream = p.open(format=FORMAT,
channels=CHANNELS,
rate=RATE,
input=True,
frames_per_buffer=CHUNK)

print("* recording")

frames = []

for i in range(0, int(RATE / CHUNK * RECORD_SECONDS)):
data = stream.read(CHUNK)
frames.append(data)

print("* done recording")

stream.stop_stream()
stream.close()
p.terminate()

wf = wave.open(WAVE_OUTPUT_FILENAME, 'wb')
wf.setnchannels(CHANNELS)
wf.setsampwidth(p.get_sample_size(FORMAT))
wf.setframerate(RATE)
wf.writeframes(b''.join(frames))
wf.close()

我收到许多报告称 pygsr macOS 无法工作,但我无法修复它,因为我无法在 Mac 上测试它。

关于python - 使用 pygsr 进行语音识别时出错,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21730667/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com