gpt4 book ai didi

python - 在 google cloud speech api 中使用增强模型

转载 作者:太空宇宙 更新时间:2023-11-04 02:27:18 25 4
gpt4 key购买 nike

我正在尝试使用 Google Speech API 上的增强模型,例如:

gcs_uri="gs://mybucket/averylongaudiofile.ogg"

client = speech.SpeechClient()

audio = types.RecognitionAudio(uri=gcs_uri)
config = types.RecognitionConfig(
encoding=enums.RecognitionConfig.AudioEncoding.OGG_OPUS,
language_code='en-US',
sample_rate_hertz=48000,
use_enhanced=True,
model='phone_call',
enable_word_time_offsets=True,
enable_automatic_punctuation=True)

operation = client.long_running_recognize(config, audio)

我在项目的“Cloud Speech API”设置中启用了数据记录,以便能够使用增强模型

当我运行它时,它会抛出以下错误:

Traceback (most recent call last):   File "./transcribe.py", line 126, in <module>
enable_automatic_punctuation=True) ValueError: Protocol message RecognitionConfig has no "use_enhanced" field.

有什么建议吗?

最佳答案

您可以在 v1p1beta1 package 的 RecognitionConfig 类型中使用“use_enhanced” .

为了能够运行您的示例,您只需修改您拥有的导入,如下所示:

import google.cloud.speech_v1p1beta1 as speech
gcs_uri="gs://mybucket/averylongaudiofile.ogg"

client = speech.SpeechClient()
audio = speech.types.RecognitionAudio(uri=gcs_uri)
config = speech.types.RecognitionConfig(
encoding=speech.enums.RecognitionConfig.AudioEncoding.OGG_OPUS,
language_code='en-US',
sample_rate_hertz=48000,
use_enhanced=True,
model='phone_call',
enable_word_time_offsets=True,
enable_automatic_punctuation=True)
operation = client.long_running_recognize(config, audio)

关于python - 在 google cloud speech api 中使用增强模型,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50076467/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com