gpt4 book ai didi

speech-to-text - 使用 Microsoft Azure (REST API) 进行批量转录

转载 作者:行者123 更新时间:2023-12-04 14:38:15 27 4
gpt4 key购买 nike

我想使用 Microsoft 的 REST API 转录更长的音频文件(至少 5 分钟)。有很多不同的产品和名称,例如语音服务 API 或 Bing 语音 API。到目前为止,我尝试过的所有 REST API 都不支持转录更长的音频文件。

文档说明有一个完全适用于这种情况的 REST API:
https://docs.microsoft.com/en-us/azure/cognitive-services/speech-service/batch-transcription

此服务的端点是什么?

最佳答案

GitHub 上有一个示例:https://github.com/PanosPeriorellis/Speech_Service-BatchTranscriptionAPI
端点是 CRIS 的端点,如以下代码所示:

private const string HostName = "cris.ai";
// ...
var client = CrisClient.CreateApiV2Client(SubscriptionKey, HostName, Port);
然后我在文档中发现 API 在 Swagger 上公开(链接可见 here ),因此更容易探索可用的方法(从 2.0beta 切换到 2.0 顶部):
  • 西欧:https://westeurope.cris.ai/swagger/ui/index
  • 美国西部:https://westus.cris.ai/swagger/ui/index

  • 所以要创建一个新的转录,路径是: /api/speechtotext/v2.0/transcriptions ,使用 POST 方法调用,所以完整的端点是:
  • 西欧:https://westeurope.cris.ai/api/speechtotext/v2.0/transcriptions
  • 美国西部:https://westus.cris.ai/api/speechtotext/v2.0/transcriptions

  • 请注意,使用转录所需的订阅 key 级别必须是 Standard级别定价 S0 ,不是 Free一。

    关于speech-to-text - 使用 Microsoft Azure (REST API) 进行批量转录,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52932413/

    27 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com