- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在尝试在 android 中为发布的项目制作一个解码器 https://github.com/rraval/pied-piper他们已经在 python 中创建了一个解码器,在 python 中使用 numpy 包非常容易,但在 Java 中我遇到了困难。在 python 中使用的步骤包括:
def dominant(frame_rate,chunk):
w=numpy.fft.fft(chunk)
numpy.fft.fftfreq(len(chunk))
peak_coeff = numpy.argmax(numpy.abs(w))
peak_freq = freqs[peak_coeff]
return abs(peak_freq * frame_rate) # in Hz
以上代码以 block [ ] 的形式返回音频数据的频率。
我正在尝试编写实现相同逻辑的 Android 代码。到目前为止,我的工作如下:
public class MicReadThread3 extends Thread {
static final int HANDSHAKE_START_HZ = 8192;
static final int HANDSHAKE_END_HZ = 8192 + 512;
static final int START_HZ = 1024;
static final int STEP_HZ = 256;
static final int BITS = 4;
static final int FEC_BYTES = 4;
static final int sample_size=8;
boolean callBack_done=false;
private static final int AUDIO_SOURCE = MediaRecorder.AudioSource.MIC;
private static final int SAMPLE_RATE = 44100; // Hz
private static final int ENCODING = AudioFormat.ENCODING_PCM_16BIT;
private static final int CHANNEL_MASK = AudioFormat.CHANNEL_IN_MONO;
private static final int BUFFER_SIZE = AudioRecord.getMinBufferSize(SAMPLE_RATE, CHANNEL_MASK, ENCODING);
private static final int blockSize=BUFFER_SIZE;
public MicReadThread3(){
setPriority(Thread.MAX_PRIORITY);
}
@Override
public void run(){
System.out.println("Buffer Size : "+BUFFER_SIZE);
AudioRecord audioRecord=null;
double dom;
byte[] buffer=new byte[blockSize];
short[] bufferShort =new short[blockSize];
audioRecord = new AudioRecord(AUDIO_SOURCE, SAMPLE_RATE, CHANNEL_MASK, ENCODING, BUFFER_SIZE);
audioRecord.startRecording();
while(true){
audioRecord.read(buffer, 0, blockSize);
dom = dominant(SAMPLE_RATE, buffer);
System.out.println("Dominant="+dom);
if(match(dom,HANDSHAKE_START_HZ)){
System.out.println("Found Handshake start freq :"+dom);
}
if(match(dom,HANDSHAKE_END_HZ)){
System.out.println("Found Handshake end freq :"+dom);
}
}
}
public boolean match(double freq1, double freq2) {
return Math.abs(freq1 - freq2) < 20;
}
public double dominant(int frame_rate, byte[] chunk){
int len=chunk.length;
double[] waveTransformReal=new double[len];
double[] waveTransformImg=new double[len];
for(int i=0;i<len;i++){
waveTransformReal[i]=chunk[i];
}
Fft.transform(waveTransformReal,waveTransformImg);
//Calculating abs
double[] abs=new double[len];
for(int i=0;i<len;i++) {
abs[i] = (Math.sqrt(waveTransformReal[i] * waveTransformReal[i] + waveTransformImg[i] * waveTransformImg[i]));
}
int maxIndex=0;
for(int i=0;i<len;i++) {
if (abs[i] > abs[maxIndex])
maxIndex = i;
}
//frame_rate is sampling freq and len is no. of datapoints
double dominantFrequency=(maxIndex*frame_rate)/len;
return dominantFrequency;
}
我用来获取 Fft 的类可以在下面给出的链接中找到: https://www.nayuki.io/res/free-small-fft-in-multiple-languages/Fft.java
如果它等于握手频率,我必须打印主频率。
但是当我打印这些值时,我得到的只是垃圾频率值,例如 1000,42050,2000,...
在 python 中,代码很好,但在 android 中,它变得越来越难...... 请帮忙,我的项目提交必须在下周完成。这只是我项目的一部分,我们因为这个问题而落后了!提前致谢。
最佳答案
我原来的回答太快了
double dominantFrequency=(maxIndex*frame_rate)/len;
引用您的评论,我再次查看了 github 代码与您发布的代码之间的差异:github 请求 8 位音频,这里是 ENCODING_PCM_16BIT。
因此 waveTransformReal[] 中的每个值都只是部分值,因为它取自 chunk[] 字节数据,其中 2 个字节构成完整值。作为快速测试,请尝试使用 ENCODING_PCM_8BIT 并查看您是否获得正确的结果。
关于java - Android 中音频信号的 FFT 解码器,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43410827/
FFT 库(例如 FFTW 或 numpy.fft)通常提供两个函数 fft() 和 ifft()(及其用于实值输入的特殊版本)。这些功能似乎被定义为 ifft(fft(X)) == X 和 fft(
如果我有一个特定大小 M(2 的幂)的 FFT 实现,我如何计算一组大小 P=k*M 的 FFT,其中 k 也是 2 的幂? #define M 256 #define P 1024 comple
下午好! 我正在尝试基于我已有的简单递归 FFT 实现来开发 NTT 算法。 考虑以下代码(coefficients'的长度,让它为m,是2的精确幂): /// /// Calculates the
我正在分析时间序列数据,并希望提取 5 个主要频率分量并将其用作训练机器学习模型的特征。我的数据集是 921 x 10080 。每行是一个时间序列,总共有 921 个。 在探索可能的方法时,我遇到了各
我找不到任何官方文档来证明 scipy.fft 实际上是 numpy.fft.fftpack.fft 的链接。这是显示链接的 iPython session : In [1]: import scip
文档说 np.fft.fft 这样做: Compute the one-dimensional discrete Fourier Transform. 和 np.fft.rfft 这样做: Compu
近一个月来,我一直在与一个非常奇怪的错误作斗争。问你们是我最后的希望。我用 C 编写了一个程序,它集成了 2d Cahn–Hilliard equation在傅里叶(或倒数)空间中使用隐式欧拉 (IE
我一直在制作一个例程,使用 NumPy/Scipy 测量两个光谱之间的相位差。 我已经有了Matlab写的例程,所以我基本上是用NumPy重新实现了函数和相应的单元测试。但是,我发现单元测试失败了,因
我正在研究使用 Renderscript 对大型复杂输入数组执行 FFT。 FFT 是相当标准的,因为它涉及三个循环,但内部循环执行 FFT 中的蝶形运算。因为每个蝴蝶使用数组的不同部分,所以没有明显
我需要通过修改 FFT 结果来均衡音乐样本。 我知道如何获得每个输出虚数的频率,问题是修改这个值以获得“均衡器效果”。 我需要知道如何缩放这个值。 条目大小为 4096 个样本,采样率为 44100
我将在 kiss-fft 之前制定几个计划同时(平行),我可以这样做吗,或者换句话说,kiss-fft 线程安全吗? 谢谢 最佳答案 自述文件: No static data is used. Th
要在频域中插入信号,可以在时域中填充零并执行 FFT。 假设给定向量 X 中的元素数为 N 并且 Y 与 X 相同但在一侧用 N 零填充。然后下面给出相同的结果。 $$\hat{x}(k)=\sum_
我通过相关了解了 DFT 的工作原理,并将其用作理解 FFT 结果的基础。如果我有一个以 44.1kHz 采样的离散信号,那么这意味着如果我要获取 1 秒的数据,我将有 44,100 个样本。为了对其
有人知道 Mayer FFT 的实现吗(我不必花很多时间研究代码)? 我正在尝试执行卷积,ifft 似乎产生了我称之为“镜像”的输出。换句话说,我的内核+信号长度被限制为 N/2 并且占据 n=0..
有人知道 Mayer FFT 的实现吗(我不必花很多时间研究代码)? 我正在尝试执行卷积,ifft 似乎产生了我称之为“镜像”的输出。换句话说,我的内核+信号长度被限制为 N/2 并且占据 n=0..
我有以下代码...请注意#生成正弦曲线下的两行。一个使用比另一个更高的 2pi 精度值,但它们仍然应该给出几乎相同的结果。 import numpy as np import matplotlib.p
我正在努力确保 FFTW 做我认为它应该做的事情,但我遇到了问题。我正在使用 OpenCV 的 cv::Mat。我制作了一个测试程序,给定一个 Mat f,计算 ifft(fft(f)) 并将结果与
我是从事电信项目的计算机程序员。 在我们的项目中,我必须将一系列复数更改为它们的傅立叶变换。因此我需要一个高效的 FFT 代码来满足 C89 标准。 我正在使用以下代码,它运行良好: shor
我目前正在尝试了解 numpy 的 fft 函数。为此,我测试了以下假设: 我有两个函数,f(x) = x^2 和 g(x) = f'(x) = 2*x。根据傅立叶变换定律和 wolfram alph
我一直在使用 FFT,目前正在尝试使用 FFT 从文件中获取声音波形(最终对其进行修改),然后将修改后的波形输出回文件。我得到了声波的 FFT,然后对其使用了反 FFT 函数,但输出文件听起来一点也不
我是一名优秀的程序员,十分优秀!