- iOS/Objective-C 元类和类别
- objective-c - -1001 错误,当 NSURLSession 通过 httpproxy 和/etc/hosts
- java - 使用网络类获取 url 地址
- ios - 推送通知中不播放声音
我正在开发一个语音消息应用程序,我需要比较两种语音,例如,
最佳答案
既然你表示这是出于安全目的,我想首先分享一些关于语音生物测量的内容:-)
对某人进行身份验证的问题在于,您需要确保他确实在那里说出了记录的内容……这与仅比较语音特征的复杂程度完全不同。
从样本中提取语音特征并随后计算新样本与第一个样本之间的距离的算法很容易被攻击者制作的录音所欺骗。
由于在您的情况下有一个人类收件人,因此创建由随机对话中切碎的单词或句子组成的消息实际上非常困难且耗时。但也不是完全不可能...
有为音乐行业创建的非常好的发声软件,例如获取一些语音音频输入并使其听起来(语调和时间明智)像第二个音频样本(欺诈者制作的指南)。 SynchroArts 的 Vocalign Pro 这样做是为了帮助获得完美的背景声轨。您可以使用其他语音编辑软件进一步手动调整音频,并达到接收者不会立即检测到的可接受的质量水平。
根据攻击者希望您的用户说什么,如果他拥有他想要的所有录音 Material ,过程的复杂性可能从一个小时到一天不等……
要对抗这种类型的攻击,您需要检测已编辑的音频样本。数字版会留下不自然的痕迹。例如。在声音周围的背景噪音中。
AFAICT,只有最好的商业软件才能达到这种级别的安全检查,但我不知道他们在检测此类编辑方面走了多远。
从纯粹的安全角度来看,您还需要确保设备没有受到损害。所以这些语音验证检查应该发生在服务器端,而不是在手机本身。
请注意,这些是一般性考虑,这完全取决于您的用例实际需要什么样的安全措施。我的汽车警报器当然不是牢不可破的,但它有助于提高标准,因此可能会窃取它的攻击者更少......
另一件需要考虑的事情是,根据定义,生物测定是一个统计过程,它会产生一定比例的假阳性和假阴性。通过更改接受阈值,您将能够以提高另一个为代价降低其中一个。
选择合适的阈值将需要您拥有相当数量的测试数据。说至少 200 个扬声器的 1 分钟录音以开始获取图片。
我认为您还需要考虑的另一件事是人声的固有可变性。人们可能生病了,这在某些情况下可能会使声音无法辨认。情绪状态也可能起作用:悲伤或愤怒会产生不同的声音......
最后但并非最不重要的是,周围的噪音可能会造成问题。假设用户在家中注册,然后在繁忙的城市环境中外出时录制消息,系统可能无法确保实际上是同一个人说话。信噪比肯定会成为您的主要问题之一。小提示:根据话筒到嘴巴的距离,比例会有很大的不同。与用户在录制消息时看着屏幕相比,当用户像在常规电话交谈中那样将手机靠近脸部时,您将获得更好的结果。
语音可变性和信噪比可能是假阴性结果背后的主要原因。
希望您现在对等待您的挑战有了更好的理解,我可以开始分享一些关于开源和商业图书馆的建议。
AFAIK,没有包含欺诈者检测的开源库......
您可能需要查看 Nuance Communication 以获取最新技术。还有很多其他供应商,只需与谷歌核实,我只提到 Nuance 是因为它的声誉。
有一个名为 Alize(用 C++ 编写,在 LGPL 许可下)的 OSS 库,它使用称为 MFCC(梅尔频率倒谱系数)的算法。众所周知,MFCC 会带来出色的结果。预计会有一个陡峭的学习曲线,因为该软件面向愿意改进该主题最新技术的研究人员,并且使用的词汇非常具体。
我编写了一个名为 Recognito(Java、Apache 2.0)的 OSS 库,面向普通开发人员,因此您应该能够在几分钟内对其进行测试。这个库还很年轻,在改进算法之前,我首先关注它的 API。我目前使用的算法称为线性预测编码 (LPC),并且已知会带来良好的结果(而且我确实有很好的结果,前提是录音产生相同的质量水平 :-))。我目前正在发布一个新版本,包括匹配结果中的似然系数。 MFCC 实现在路线图上。
有很多javadoc,代码应该非常简单......
https://github.com/amaurycrickx/recognito
Recognito 依赖于 javax.sound 包来处理音频文件。您可能想查看这篇文章,了解在 Android 中使用它需要什么:Voice matching in android
鉴于很多人都需要 android 的东西,我会在不久的将来做一些事情,而不是说应该如何修改 lib :-)
HTH
关于android - 比较android中的两种声音,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23422939/
我最近在/ drawable中添加了一些.gifs,以便可以将它们与按钮一起使用。这个工作正常(没有错误)。现在,当我重建/运行我的应用程序时,出现以下错误: Error: Gradle: Execu
Android 中有返回内部存储数据路径的方法吗? 我有 2 部 Android 智能手机(Samsung s2 和 s7 edge),我在其中安装了一个应用程序。我想使用位于这条路径中的 sqlit
这个问题在这里已经有了答案: What's the difference between "?android:" and "@android:" in an android layout xml f
我只想知道 android 开发手机、android 普通手机和 android root 手机之间的实际区别。 我们不能从实体店或除 android marketplace 以外的其他地方购买开发手
自Gradle更新以来,我正在努力使这个项目达到标准。这是一个团队项目,它使用的是android-apt插件。我已经进行了必要的语法更改(编译->实现和apt->注释处理器),但是编译器仍在告诉我存在
我是android和kotlin的新手,所以请原谅要解决的一个非常简单的问题! 我已经使用导航体系结构组件创建了一个基本应用程序,使用了底部的导航栏和三个导航选项。每个导航选项都指向一个专用片段,该片
我目前正在使用 Facebook official SDK for Android . 我现在正在使用高级示例应用程序,但我不知道如何让它获取应用程序墙/流/状态而不是登录的用户。 这可能吗?在那种情
我在下载文件时遇到问题, 我可以在模拟器中下载文件,但无法在手机上使用。我已经定义了上网和写入 SD 卡的权限。 我在服务器上有一个 doc 文件,如果用户单击下载。它下载文件。这在模拟器中工作正常但
这个问题在这里已经有了答案: What is the difference between gravity and layout_gravity in Android? (22 个答案) 关闭 9
任何人都可以告诉我什么是 android 缓存和应用程序缓存,因为当我们谈论缓存清理应用程序时,它的作用是,缓存清理概念是清理应用程序缓存还是像内存管理一样主存储、RAM、缓存是不同的并且据我所知,缓
假设应用程序 Foo 和 Eggs 在同一台 Android 设备上。任一应用程序都可以获取设备上所有应用程序的列表。一个应用程序是否有可能知道另一个应用程序是否已经运行以及运行了多长时间? 最佳答案
我有点困惑,我只看到了从 android 到 pc 或者从 android 到 pc 的例子。我需要制作一个从两部手机 (android) 连接的 android 应用程序进行视频聊天。我在想,我知道
用于使用 Android 以编程方式锁定屏幕。我从 Stackoverflow 之前关于此的问题中得到了一些好主意,并且我做得很好,但是当我运行该代码时,没有异常和错误。而且,屏幕没有锁定。请在这段代
文档说: android:layout_alignParentStart If true, makes the start edge of this view match the start edge
我不知道这两个属性和高度之间的区别。 以一个TextView为例,如果我将它的layout_width设置为wrap_content,并将它的width设置为50 dip,会发生什么情况? 最佳答案
这两个属性有什么关系?如果我有 android:noHistory="true",那么有 android:finishOnTaskLaunch="true" 有什么意义吗? 最佳答案 假设您的应用中有
我是新手,正在尝试理解以下 XML 代码: 查看 developer.android.com 上的文档,它说“starStyle”是 R.attr 中的常量, public static final
在下面的代码中,为什么当我设置时单选按钮的外观会发生变化 android:layout_width="fill_parent" 和 android:width="fill_parent" 我说的是
很难说出这里要问什么。这个问题模棱两可、含糊不清、不完整、过于宽泛或夸夸其谈,无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开,visit the help center . 关闭 9
假设我有一个函数 fun myFunction(name:String, email:String){},当我调用这个函数时 myFunction('Ali', 'ali@test.com ') 如何
我是一名优秀的程序员,十分优秀!