gpt4 book ai didi

audio - 音频文件未使用Google Speech分析

转载 作者:行者123 更新时间:2023-12-02 22:54:15 24 4
gpt4 key购买 nike

这个问题是对previous question的跟进。

下面的代码片段几乎可以正常工作...它可以正常运行,但会返回Noneresults_list值。这意味着它正在访问文件(我认为),但无法从其中提取任何内容。

我有一个文件sample.wav,在此处公开存在:https://storage.googleapis.com/speech_proj_files/sample.wav

我正在尝试通过指定source_uri='gs://speech_proj_files/sample.wav'来访问它。

我不明白为什么这行不通。我认为这不是权限问题。我的 session 实例良好。代码会拖一秒钟,但始终没有结果。我该如何调试呢?任何建议深表感谢。

from google.cloud import speech
speech_client = speech.Client()

audio_sample = speech_client.sample(
content=None,
source_uri='gs://speech_proj_files/sample.wav',
encoding='LINEAR16',
sample_rate_hertz= 44100)
results_list = audio_sample.async_recognize(language_code='en-US')

最佳答案

啊,那是我最后一个问题的错。那是async_recognize命令,而不是sync_recognize命令。

该库具有三个识别命令。 sync_recognize读取整个文件并返回结果。那可能就是您想要的那个。删除字母“a”,然后重试。

这是执行此操作的示例Python程序:https://github.com/GoogleCloudPlatform/python-docs-samples/blob/master/speech/cloud-client/transcribe.py

仅供引用,以下是其他类型的摘要:
async_recognize开始长时间运行的服务器端操作,以转换整个文件。您可以进一步调用服务器以查看它是否已使用operation.poll()方法完成,完成后可以通过operation.results获得结果。

第三种是streaming_recognize,它在处理结果时不断向您发送结果。这对于需要立即获得某些结果的长文件或连续上传实时音频非常有用。

关于audio - 音频文件未使用Google Speech分析,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43555694/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com