gpt4 book ai didi

speech-to-text - IBM Speech to Text 字母数字字符串识别?

转载 作者:行者123 更新时间:2023-12-04 06:47:37 27 4
gpt4 key购买 nike

在尝试让 Speech to Text(IBM 语音网关 IVR 应用程序)识别字母数字字符串时,我想知道我是否可以创建一个自定义语法或实体来限制 STT 仅识别单个字母和数字,不包括完全的话。例如,这是一个典型的字符串:20Y0H8C。沃森带着文字和数字回来,比如“二”而不是“2”。数字字符串工作正常。我意识到字母识别在典型的 ASR 中存在问题,但我希望 Watson 能够胜任这项任务。我注意到没有字母数字字符的系统实体。非常感谢任何建议。

最佳答案

在这种情况下,将smart_formatting设置为true

smart_formatting 参数将日期、时间、数字和数字序列、电话号码、货币值和互联网地址转换为识别请求的最终抄本中更常规的表示形式。转换使转录本更具可读性,并可以更好地对转录结果进行后处理。您将参数设置为 true 以启用智能格式化,如下例所示;默认为false,不进行智能格式化。

检查:

curl -X POST -u {username}:{password}
--header "Content-Type: audio/flac"
--data-binary @{path}audio-file.flac
"https://stream.watsonplatform.net/speech-to-text/api/v1/recognize?smart_formatting=true"

结果:

语音:数量是一百万一百零一个

结果:数量为1000101

查看IBM官方documentation .

注意:智能格式化功能目前是测试版功能,仅适用于美国英语。

关于speech-to-text - IBM Speech to Text 字母数字字符串识别?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44547537/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com