gpt4 book ai didi

azure - Azure 转录 JSON 文件的 VTT 输出

转载 作者:行者123 更新时间:2023-12-03 06:42:58 31 4
gpt4 key购买 nike

我抬头发现了这个 - https://learn.microsoft.com/en-us/azure/cognitive-services/speech-service/captioning-concepts?pivots=programming-language-javascript

在标题输出格式部分,它显示 -

The Speech service supports output formats such as SRT (SubRip Text) and WebVTT (Web Video Text Tracks).

但是 API 引用中没有设置输出格式的选项 - https://eastus.dev.cognitive.microsoft.com/docs/services/speech-to-text-api-v3-0/operations/CreateTranscription

我使用 Create Transcription API 发送视频/音频文件 > 30 分钟,Azure 提供 JSON 格式的转录结果,如下所示 -

https://spsvcprodeus.blob.core.windows.net/bestor-c6e3ae79-1b48-41bf-92ff-940bea3e5c2d/TranscriptionData/1a7f53a1-b254-4edc-a03a-20aa926423b7_0_0.json?sv=2021-08-06&st=2022-11-09T19%3A05%3A26Z&se=2022-11-10T07%3A10%3A26Z&sr=b&sp=rl&sig=4g80znxLM%2FVhCJI7iJLNETGd%2B%2B442eubSOQikjQpvZU%3D

我计划编写一个脚本来将转录 JSON 转换为 VTT,但如果该脚本已经存在或者我可以请求作为输出格式,那将会非常有帮助。

最佳答案

需要检索语音 key 才能使其工作。在 Azure 门户中创建语音服务并获取支持的 Python 代码以将语音转换为文本。

enter image description here

enter image description here

获取语音转文本的 python 代码 ( captioning )。

设置环境:

setx SPEECH_KEY your-key

根据演讲创建标题

转到代码可用的同一目录。

pip install azure-cognitiveservices-speech

运行应用程序:

python captioning.py --input title.this.mp4 --format any --output title.output.txt --srt --realTime --threshold 5 --delay 0 --profanity mask --phrases "Contoso ;杰西;雷哈恩”

检查 SRT 格式 -> Link

enter image description here

我们对 Azure 中的每项服务都有持续时间限制。使用 link 检查配额和支持.

关于azure - Azure 转录 JSON 文件的 VTT 输出,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/74383455/

31 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com