gpt4 book ai didi

azure - Bing 语音识别 API 输出 - 数字与文本

转载 作者:行者123 更新时间:2023-12-02 07:12:07 27 4
gpt4 key购买 nike

我发现一些奇怪的行为,语音识别 API 有时会返回单词,有时会返回数字。例如,给定音频输入“十五美元七美分”,它有时会返回“十五美元七美分”,而其他则返回“$15.07”。有没有办法确保其中一个被退回?或者,我是否需要自己解析单词并将其转换为数字。

谢谢!

最佳答案

我刚刚研究了类似的问题,发现 BingSTT API 在不同的字段中返回两个版本。只需使用此处的示例代码尝试您的示例:https://github.com/Microsoft/Cognitive-Speech-STT-JavaScript并得到了这样的回应:

[{
"lexical": "fifteen dollars and seven cents",
"display": "$15.07.",
"inverseNormalization": null,
"maskedInverseNormalization": null,
"transcript": "$15.07.",
"confidence": 0.9474185
}]

所以我想你可以选择使用哪个字段,词汇还是显示。希望这会有所帮助。

关于azure - Bing 语音识别 API 输出 - 数字与文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39374890/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com