gpt4 book ai didi

python - 在 Python 中转录音频文件

转载 作者:行者123 更新时间:2023-12-01 08:20:10 25 4
gpt4 key购买 nike

我正在尝试转录一个有点大的音频文件。其属性如下。

Size : 278.3 MB
Duration : 52 minutes
Format : WAV

Folwoing 是我用来将其转换为 60 秒持续时间的代码。您能否建议立即转录此文件?

import speech_recognition as sr

r = sr.Recognizer()
with sr.AudioFile('sampleMp3.WAV') as source:
audio = r.record(source, duration=60)

command = r.recognize_google(audio)

text_file = open("Output.txt", "w")
text_file.write(command)
text_file.close()

最佳答案

speech_recognition python 包只是一个包装器,它甚至不提供基本功能。

如果您想使用 Google Speech API(付费),您可以执行以下操作:

https://github.com/GoogleCloudPlatform/python-docs-samples/blob/master/speech/cloud-client/transcribe_async.py

如果你想考虑Bing,它也提供了类似的API,参见How can I transcribe a speech file with the Bing Speech API in Python?

对于免费替代方案,请考虑 https://github.com/alumae/kaldi-offline-transcriber

关于python - 在 Python 中转录音频文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54698862/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com