- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
所以我正在尝试构建一个充当实时音频分析器的 Android 应用程序,作为涉及检测和过滤掉某些声音的项目的先驱。
所以我认为我已经掌握了离散傅立叶变换的基础知识,但是我不确定进行实时频率分析的最佳参数应该是什么。
我的印象是,在理想情况下(无限计算能力),我会从 AudioRecord 类获得的 44100 样本/秒 PCM 流中获取所有样本,并将它们放入 44100 元素 fifo“窗口” (用 0 填充到 2**16,也许是锥形函数?),每次有新样本进入时在窗口上运行 FFT。这会(我认为)给我 0 - ~22 KHz 的频谱更新 44100每秒次数。
这似乎不会发生在智能手机上。问题是,我不确定我应该减少哪些计算参数,以便使其在我的 Galaxy Nexus 上易于处理,同时仍尽可能保持质量。最终我想使用灵敏度更高的外部麦克风。
我认为这将涉及在进行 FFT 之间移动窗口不止一个样本,但我不知道在什么时候这对准确性/混叠/其他任何东西比仅在较小的窗口上进行 FFT 更有害,或者如果有是我忽略的第三个选项。
使用我从 libgdx 使用的 native 实现的 KissFFT,我似乎能够在每 44100 个样本中执行 30-42 个 44100 元素的 FFT,并且仍然可以响应(这意味着缓冲区从执行的线程中填充AudioRecord.read() 的填充速度并不快于执行 fft 的线程耗尽它的速度)。
所以我的问题是:
我很乐意展示我的任何代码,如果这有助于回答我的问题,但有很多代码,所以我想我会有选择地这样做,而不是全部发布。
最佳答案
if there is a third option I'm overlooking
是的:同时执行这两项操作,减少 FFT 大小并增加步长。在评论中,您指出您想要检测“用嘴吸 Nose /咀嚼”。因此,您要做的类似于语音识别的典型任务。在那里,您通常以 10ms 的步长提取特征向量(意味着每 441 个样本 Fs = 44.1kHz)并且要转换的信号窗口大约是步长大小的两倍,因此 20ms 产生 2^X FFT 1024 个样本的大小(确保您选择的 FFT 大小是 2 的幂,因为它更快)。
窗口大小的任何增加或步长的减少都会增加数据,但主要是增加冗余。
其他提示:
@SztupY 正确地指出您需要在 FFT 之前对信号进行“加窗”,通常使用 Hamming-wondow。 (但这不是“过滤”,它只是将每个样本值与相应的窗口值相乘,而不累加结果)。
原始 FFT 输出几乎不适合识别“用嘴吸 Nose /咀嚼”,经典识别器由处理 MFCC 序列及其增量的 HMM 或 ANN 组成。
Could the performance I'm currently getting just be the best I'm going to get? Or does it seem like I must be something stupid because much faster speeds are possible?
它接近最佳,但是您浪费了所有 CPU 能力来估计高度冗余的数据,没有给识别器留下任何 CPU 能力。
Is my approach to this at least fundamentally correct or am I barking entirely up the wrong tree?
考虑我的回答后,您可能会重新考虑您的方法。
关于android - 如何从 android 上的实时 FFT 获得最准确的音频数据?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15581237/
Closed. This question is opinion-based。它当前不接受答案。 想改善这个问题吗?更新问题,以便editing this post用事实和引用来回答。 2年前关闭。
我想显示我的网站上所有用户都在线(实时;就像任何聊天模块一样)。我正在使用下面提到的脚本来执行此操作。 HTML: Javascript: var doClose = false; documen
有什么方法可以知道 Algolia 何时成功处理了排队作业,或者与上次重新索引相比,Algolia 是否索引了新文档? 我们希望建立一个系统,每当新文档被索引时,浏览网站的用户都会收到实时更新警告,并
构建将在“桌面”而不是浏览器中运行的 Java 应用程序的推荐策略是什么。该应用程序的特点是: 1. Multiple application instances would be running o
这是场景: 我正在编写一个医疗相关程序,可以在没有连接的情况下使用。当采取某些措施时,程序会将时间写入CoreData记录。 这就是问题所在,如果他们的设备将时间设置为比实际时间早的时间。那将是一个大
我有: $(document).ready(function () { $(".div1, .div2, .div3, .div4, .div5").draggable();
我有以下 jquery 代码: $("a[id*='Add_']").live('click', function() { //Get parentID to add to. var
我有一个 jsp 文件,其中包含一个表单。提交表单会调用处理发送的数据的 servlet。我希望当我点击提交按钮时,一个文本区域被跨越并且应该实时显示我的应用程序的日志。我正在使用 Tomcat 7。
我编辑了我的问题,我在 Default.aspx 页面中有一个提交按钮和文本框。我打开两个窗口Default.aspx。我想在这个窗口中向文本框输入文本并按提交,其他窗口将实时更新文本框。 请帮助我!
我用 php 创建了一个小型 CMS,如果其他用户在线或离线,我想显示已登录的用户。 目前,我只创建一个查询请求,但这不会一直更新。我希望用户在发生某些事情时立即看到更改。我正在寻找一个类似于 fac
我有以下问题需要解决。我必须构建一个图形查看器来查看海量数据集。 我们有一些特定格式的文件,其中包含数百万条代表实验结果的记录。每条记录代表大图上的一个样本点。我见过的最大的文件有 4370 万条记录
我最近完成了申请,但遇到了一个大问题。我一次只需要允许 1 个用户访问它。每个用户每次都可以访问一个索引页面和“开始”按钮。当用户点击开始时,应用程序锁定,其他人需要等到用户完成。当用户关闭选项卡/浏
我是 Android 开发新手。我正在寻找任何将音高变换应用到输出声音(实时)的方法。但我找不到任何起点。 我找到了这个 topic但我仍然不知道如何应用它。 有什么建议吗? 最佳答案 一般来说,该算
背景 用户计算机上的桌面应用程序从调制解调器获取电话号码,并在接到电话后将其发送到 PHP 脚本。目前,我可以通过 PHP 在指定端口上接收数据/数据包。然后我有一个连接到 411 数据库并返回指定电
很抱歉提出抽象问题,但我正在寻找一些关于在循环中执行一些等效操作的应用程序类型的示例/建议/文章,并且循环的每次迭代都应该在特定时间部分公开其结果(例如, 10 秒)。 我的应用程序在外部 WCF 服
这个问题在这里已经有了答案: 关闭 10 年前。 Possible Duplicate: What specifically are wall-clock-time, user-cpu-time,
我最近遇到了一个叫做 LiveChart 的工具,决定试用一下。 不幸的是,我在弄清楚如何实时更新图表值时遇到了一些问题。我很确定有一种干净正确的方法可以做到这一点,但我找不到它。 我希望能够通过 p
我正在实现实时 flutter 库 https://pub.dartlang.org/packages/true_time 遇到错误 W/DiskCacheClient(26153): Cannot
我一直在使用 instagram 的实时推送 api ( http://instagram.com/developer/realtime/ ) 来获取特定位置的更新。我使用“半径”的最大可能值,即 5
关闭。这个问题不满足Stack Overflow guidelines .它目前不接受答案。 想改善这个问题吗?更新问题,使其成为 on-topic对于堆栈溢出。 7年前关闭。 Improve thi
我是一名优秀的程序员,十分优秀!