gpt4 book ai didi

numpy - 我可以从 python SpeechRecognition 中的 numpy 数组进行识别吗?

转载 作者:行者123 更新时间:2023-12-03 01:17:43 25 4
gpt4 key购买 nike

我正在记录一个 numpy 数组 dt然后通过这样的代码将其写入 .wav:

dt = np.int16(dt/np.max(np.abs(dt)) * 32767)
scipy.io.wavfile.write("tmp.wav", samplerate, dt)

之后我阅读并通过代码识别
import speech_recognition as sr
r = sr.Recognizer()
with sr.AudioFile("tmp.wav") as source:
audio_text = r.listen(source)
return r.recognize_google(audio_text, language = lang)

我可以在不使用 wav 的情况下从 numpy 数组中进行识别吗?因为它需要额外的时间

最佳答案

假设这是您正在使用的模块,并且根据 its documentation ,您可以将任何类似文件的对象传递给 AudioFile() 。类文件对象是支持读写操作的对象。

您应该能够将 wav 文件的字节表示粘贴到支持这些操作的 io.BytesIO 对象中,并将其传递到您的语音识别模块中。 scipy.io.wavfile.write() 支持写入此类文件类对象。

我没有包或任何 WAV 文件来测试它,但如果这样的东西有效,请告诉我:

wav_bytes = io.BytesIO()
scipy.io.wavfile.write(wav_bytes, samplerate, dt)
with sr.AudioFile(wav_bytes) as source:
...

关于numpy - 我可以从 python SpeechRecognition 中的 numpy 数组进行识别吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/61961587/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com