- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
Microsoft.Speech SDK 有一个 DTMFRecognitionEngine类,我想对此进行试验 - 我们需要检测 WAV 文件中的 DTMF 音调(我知道还有其他方法可以做到这一点,但我正在评估所有可能的方法)。
关于如何实际使用该类的文档并不清楚:它的配套类 SpeechRecognitionEngine
有大量示例和非常清晰的方法,如 SetInputToWaveFile
。 DTMFRecognitionEngine
没有任何此类方法。
有人可以提供有关如何在我自己的代码中使用此组件的见解吗?
编辑: 似乎没有任何方法可以将此类用于...好吧,真的。我正在寻找一个库,它可以让我检测音频文件中 DTMF 数字的位置和持续时间。我看过 TapiEx ,但他们不回复电子邮件。如果有人有任何其他建议,将不胜感激...
最佳答案
这似乎是不可能的。我什至获得了 DtmfRecognitionEngine 的私有(private) _engine,它是 SpeechRecognitionEngine 的包装器,并在没有运气的情况下调用它的 SetInputToWaveFile。显然,将音调输入 DtmfRecognitionEngine 的唯一方法是调用 AddTone()。我已经包含了一个示例语法文件和一些您可以使用的源代码。有趣的是,如果您取消注释 dre.AddTone(),您会看到 sre 的事件和 dre 的事件都被触发了。
将调用切换到 sre.RecognizeAsync() 没有帮助。
看起来您需要一个不同的库...
PinGrammar.xml
<?xml version="1.0"?>
<grammar mode="dtmf" version="1.0"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="http://www.w3.org/2001/06/grammar
http://www.w3.org/TR/speech-grammar/grammar.xsd"
xmlns="http://www.w3.org/2001/06/grammar"
root="pin">
<rule id="digit">
<one-of>
<item> 0 </item>
<item> 1 </item>
<item> 2 </item>
<item> 3 </item>
<item> 4 </item>
<item> 5 </item>
<item> 6 </item>
<item> 7 </item>
<item> 8 </item>
<item> 9 </item>
</one-of>
</rule>
<rule id="pin" scope="public">
<one-of>
<item>
<item repeat="4">
<ruleref uri="#digit"/>
</item>
#
</item>
<item>
* 9
</item>
</one-of>
</rule>
</grammar>
来源:
using Microsoft.Speech.Recognition;
using System.Reflection;
namespace DTMF_Recognition
{
class Program
{
static void Main(string[] args)
{
Grammar grammar = null;
grammar = new Grammar("PinGrammar.xml");
DtmfRecognitionEngine dre = new DtmfRecognitionEngine();
dre.DtmfRecognized += dre_DtmfRecognized;
FieldInfo field = typeof(DtmfRecognitionEngine).GetField("_engine", BindingFlags.NonPublic | BindingFlags.GetField | BindingFlags.Instance);
var wrapper = field.GetValue(dre);
FieldInfo engineField = wrapper.GetType().GetField("_engine", BindingFlags.NonPublic | BindingFlags.GetField | BindingFlags.Instance);
SpeechRecognitionEngine sre = (SpeechRecognitionEngine)engineField.GetValue(wrapper);
dre.DtmfHypothesized += dre_DtmfHypothesized;
dre.DtmfRecognitionRejected += dre_DtmfRecognitionRejected;
dre.RecognizeCompleted += dre_RecognizeCompleted;
dre.LoadGrammar(grammar);
//dre.AddTone(DtmfTone.One);
//dre.AddTone(DtmfTone.Two);
//dre.AddTone(DtmfTone.Three);
//dre.AddTone(DtmfTone.Four);
//dre.AddTone(DtmfTone.Hash);
sre.SetInputToWaveFile(@"C:\Users\Clay Ver Valen\Desktop\3.wav");
sre.SpeechHypothesized += sre_SpeechHypothesized;
sre.SpeechDetected += sre_SpeechDetected;
sre.SpeechRecognitionRejected += sre_SpeechRecognitionRejected;
dre.RecognizeAsync();
System.Threading.Thread.Sleep(30000);
}
static void sre_SpeechRecognitionRejected(object sender, SpeechRecognitionRejectedEventArgs e)
{
int i = 1;
}
static void sre_SpeechHypothesized(object sender, SpeechHypothesizedEventArgs e)
{
int i = 1;
}
static void sre_SpeechDetected(object sender, SpeechDetectedEventArgs e)
{
int i = 1;
}
static void dre_DtmfRecognitionRejected(object sender, DtmfRecognitionRejectedEventArgs e)
{
int i = 1;
}
static void dre_DtmfHypothesized(object sender, DtmfHypothesizedEventArgs e)
{
int i = 1;
}
static void dre_RecognizeCompleted(object sender, DtmfRecognizeCompletedEventArgs e)
{
int i = 1;
}
static void dre_DtmfRecognized(object sender, DtmfRecognizedEventArgs e)
{
int i = 1;
}
}
}
关于c# - 如何在 Microsoft.Speech 中使用 DTMFRecognitionEngine 类,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33858663/
我正在尝试将 Outlook API 与我的 React 应用程序集成。当我尝试使用 microsoft-graph-client 实现身份验证时,遇到以下错误。 'ImplicitMSALAuthe
我正在尝试使用 Microsoft Graph Beta API 在 Microsoft Teams 中创建 channel 。在文档中,它说 channel 实体具有属性 IsFavoriteByD
我的目标很简单。我想使用图形 API 将自动聊天消息发送到 MS Teams channel 。 这似乎是图形 API 的测试版功能,仅在 Microsoft.Graph.Beta 中可用。 我已经阅
通过委派权限获取 Teams channel 消息时(用户是团队成员): https://graph.microsoft.com/beta/teams/ {team_id}/channels/{cha
我正在使用带有 OData 端点的 Web API 和 Entity Framework 创建一个 RESTful 服务。 Microsoft.AspNet.WebApi.OData 和 Micros
我可以通过对标题和作者姓名的评估查询(以及解释查询)获得良好的结果。 但是如果我想通过 DOI 查找论文怎么办? 我可以通过扩展元数据描述(在现有搜索的属性中)获取条目的DOI信息,但是由于扩展元数据
我正在尝试通过displayName查询用户,但是在同时使用C#SDK和Graph Explorer发送请求时,我无法转义单引号。 更新:在示例中不清楚,我遇到麻烦的搜索词是I' 查询示例: http
我在使用 Microsoft fakes 的解决方案中有一个单元测试项目,当我构建它时出现以下错误。它提示无法加载的 DLL 在磁盘上。我已经打开了 Fusion 日志记录,这表明绑定(bind)成功
我想创建一个应用程序,当用户在 MS Teams 中接到电话时会收到通知。我的意思是我想在来电事件上订阅一些东西,然后根据来电信息做一些事情。这可能吗?到目前为止,我在 SDK 中没有看到任何事件。
如果我开发一个网站,它是否会以相同的方式在 IE11、Chrome、Firefox 和 edge 上运行,还是我们需要专门为 IE11 编写代码?我没有 Windows 8,因此无法在边缘浏览器上测试
我几个月前为某些收件箱创建了一些订阅,系统成功收到了有关收到电子邮件的通知,订阅也定期更新以增加到期日期。这是我的订阅列表: https://graph.microsoft.com/v1.0/subs
如果我开发一个网站,它是否会以相同的方式在 IE11、Chrome、Firefox 和 edge 上运行,还是我们需要专门为 IE11 编写代码?我没有 Windows 8,因此无法在边缘浏览器上测试
如果 Edge 在某些机器上发生崩溃,我们需要检查日志以了解发生了什么情况。 最佳答案 Microsoft Edge 实际上是一个 Windows 进程,因此您应该能够在事件查看器中查看日志。此外,您
我已经将一些测试用例与项目中的单元测试相关联。该项目已构建并复制到共享上的放置位置。当我去运行这些测试时,由于作为这些测试的一部分包含的非托管 DLL 的 System.DllNotFoundExce
我对 asp.net 核心标识中的三个包感到困惑。我不知道彼此之间有什么区别。还有哪些是我们应该使用的? 我在 GitHub 上找到了这个链接,但我没有找到。 Difference between M
在我的 Windows 类库(由 MVC 网站使用)中,我安装了 NugetPackage Microsoft.SqlServer.Types (Spatial)。 现在,我正在使用 ado.net
我有一个简单的 web 应用程序,我在 Teams 中显示为一个应用程序。我已经在 App Studio 中进行了设置,一切都按我的预期工作,一切都很好。它正在显示我的网络应用程序,这就是我想要的。
有什么不同?它们都是业务管理解决方案。他们做的一样吗?一些不同的版本?他们使用同一个平台吗? 动态 Assets 净值 Microsoft Dynamics NAV 2009 is a compreh
如何制定包含非英语字符(例如日耳曼语Umlauts)的Microsoft Graph /myOrganization/users OData查询? 例子: 我的租户中有一个名为“ThomasMülle
我想创建一个类似于乐队附带的星巴克应用程序的应用程序。我想显示条形码。我可以在云端或本地设备上将条形码生成为 JPG 图像,但我需要能够在乐队的屏幕上显示它们。到目前为止,我还没有找到使用 Band
我是一名优秀的程序员,十分优秀!