java - Android 中音频信号的 FFT 解码器-6ren

java - Android 中音频信号的 FFT 解码器

转载作者：行者123 更新时间：2023-11-30 00:35:56

26

4

我正在尝试在 android 中为发布的项目制作一个解码器 https://github.com/rraval/pied-piper他们已经在 python 中创建了一个解码器，在 python 中使用 numpy 包非常容易，但在 Java 中我遇到了困难。在 python 中使用的步骤包括:

def dominant(frame_rate,chunk):
  w=numpy.fft.fft(chunk)
  numpy.fft.fftfreq(len(chunk))
  peak_coeff = numpy.argmax(numpy.abs(w))
  peak_freq = freqs[peak_coeff]
  return abs(peak_freq * frame_rate) # in Hz

以上代码以 block [ ] 的形式返回音频数据的频率。

我正在尝试编写实现相同逻辑的 Android 代码。到目前为止，我的工作如下:

public class MicReadThread3 extends Thread {

static final int HANDSHAKE_START_HZ = 8192;
static final int HANDSHAKE_END_HZ = 8192 + 512;
static final int START_HZ = 1024;
static final int STEP_HZ = 256;
static final int BITS = 4;
static final int FEC_BYTES = 4;
static final int sample_size=8;
boolean callBack_done=false;

private static final int AUDIO_SOURCE = MediaRecorder.AudioSource.MIC;
private static final int SAMPLE_RATE = 44100; // Hz
private static final int ENCODING = AudioFormat.ENCODING_PCM_16BIT;
private static final int CHANNEL_MASK = AudioFormat.CHANNEL_IN_MONO;
private static final int BUFFER_SIZE = AudioRecord.getMinBufferSize(SAMPLE_RATE, CHANNEL_MASK, ENCODING);
private static final int blockSize=BUFFER_SIZE;



public MicReadThread3(){
    setPriority(Thread.MAX_PRIORITY);
}

@Override
public void run(){

    System.out.println("Buffer Size : "+BUFFER_SIZE);
    AudioRecord audioRecord=null;
    double dom;
    byte[] buffer=new byte[blockSize];
    short[] bufferShort =new short[blockSize];
    audioRecord = new AudioRecord(AUDIO_SOURCE, SAMPLE_RATE, CHANNEL_MASK, ENCODING, BUFFER_SIZE);
    audioRecord.startRecording();
    while(true){
        audioRecord.read(buffer, 0, blockSize);
        dom = dominant(SAMPLE_RATE, buffer);
        System.out.println("Dominant="+dom);
        if(match(dom,HANDSHAKE_START_HZ)){
            System.out.println("Found Handshake start freq :"+dom);
        }

        if(match(dom,HANDSHAKE_END_HZ)){
            System.out.println("Found Handshake end freq :"+dom);
        }
    }

}

public boolean match(double freq1, double freq2) {
    return Math.abs(freq1 - freq2) < 20;
}

public double dominant(int frame_rate, byte[] chunk){
    int len=chunk.length;
    double[] waveTransformReal=new double[len];
    double[] waveTransformImg=new double[len];
    for(int i=0;i<len;i++){
        waveTransformReal[i]=chunk[i];
    }

    Fft.transform(waveTransformReal,waveTransformImg);

    //Calculating abs
    double[] abs=new double[len];

    for(int i=0;i<len;i++) {
        abs[i] = (Math.sqrt(waveTransformReal[i] * waveTransformReal[i] + waveTransformImg[i] * waveTransformImg[i]));

    }
    int maxIndex=0;
    for(int i=0;i<len;i++) {
        if (abs[i] > abs[maxIndex])
            maxIndex = i;
    }
    //frame_rate is sampling freq and len is no. of datapoints
    double dominantFrequency=(maxIndex*frame_rate)/len;
    return dominantFrequency;
}

我用来获取 Fft 的类可以在下面给出的链接中找到: https://www.nayuki.io/res/free-small-fft-in-multiple-languages/Fft.java

如果它等于握手频率，我必须打印主频率。

但是当我打印这些值时，我得到的只是垃圾频率值，例如 1000,42050,2000,...

在 python 中，代码很好，但在 android 中，它变得越来越难...... 请帮忙，我的项目提交必须在下周完成。这只是我项目的一部分，我们因为这个问题而落后了!提前致谢。

最佳答案

我原来的回答太快了

    double dominantFrequency=(maxIndex*frame_rate)/len;

引用您的评论，我再次查看了 github 代码与您发布的代码之间的差异:github 请求 8 位音频，这里是 ENCODING_PCM_16BIT。

因此 waveTransformReal[] 中的每个值都只是部分值，因为它取自 chunk[] 字节数据，其中 2 个字节构成完整值。作为快速测试，请尝试使用 ENCODING_PCM_8BIT 并查看您是否获得正确的结果。

关于java - Android 中音频信号的 FFT 解码器，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/43410827/

26

4

0

文章推荐： php - 选择在另一个表中没有关系的行

文章推荐： c++ - 将字符串转换为字节(无符号字符)数组 cpp

fft - FFT 和逆 FFT 之间有什么实际区别吗？
FFT 库(例如 FFTW 或 numpy.fft)通常提供两个函数 fft() 和 ifft()(及其用于实值输入的特殊版本)。这些功能似乎被定义为 ifft(fft(X)) == X 和 fft(
fft - 如何使用较小的 FFT 计算较大的 FFT？
如果我有一个特定大小 M(2 的幂)的 FFT 实现，我如何计算一组大小 P=k*M 的 FFT，其中 k 也是 2 的幂？ #define M 256 #define P 1024 comple
fft - 从复数 FFT 到有限场 FFT 的转换
下午好! 我正在尝试基于我已有的简单递归 FFT 实现来开发 NTT 算法。考虑以下代码(coefficients'的长度，让它为m，是2的精确幂): /// /// Calculates the
python - numpy.fft.fft 和 numpy.fft.fftfreq 有什么区别
我正在分析时间序列数据，并希望提取 5 个主要频率分量并将其用作训练机器学习模型的特征。我的数据集是 921 x 10080 。每行是一个时间序列，总共有 921 个。在探索可能的方法时，我遇到了各
python - scipy.fft 链接到 numpy.fft.fftpack.fft 的事实是否记录在任何地方？
我找不到任何官方文档来证明 scipy.fft 实际上是 numpy.fft.fftpack.fft 的链接。这是显示链接的 iPython session : In [1]: import scip
python - numpy.fft.fft 和 numpy.fft.rfft 有什么区别？
文档说 np.fft.fft 这样做: Compute the one-dimensional discrete Fourier Transform. 和 np.fft.rfft 这样做: Compu
c - 为什么 (A+B) 的 FFT 不同于 FFT(A) + FFT(B)？
近一个月来，我一直在与一个非常奇怪的错误作斗争。问你们是我最后的希望。我用 C 编写了一个程序，它集成了 2d Cahn–Hilliard equation在傅里叶(或倒数)空间中使用隐式欧拉 (IE
matlab - 来自 Matlab fft 和 Scipy fft 的 FFT 结果略有不同
我一直在制作一个例程，使用 NumPy/Scipy 测量两个光谱之间的相位差。我已经有了Matlab写的例程，所以我基本上是用NumPy重新实现了函数和相应的单元测试。但是，我发现单元测试失败了，因
fft - 关于如何使用渲染脚本实现 fft 的指南
我正在研究使用 Renderscript 对大型复杂输入数组执行 FFT。 FFT 是相当标准的，因为它涉及三个循环，但内部循环执行 FFT 中的蝶形运算。因为每个蝴蝶使用数组的不同部分，所以没有明显
fft - 如何修改 FFT 结果以均衡音乐样本
我需要通过修改 FFT 结果来均衡音乐样本。我知道如何获得每个输出虚数的频率，问题是修改这个值以获得“均衡器效果”。我需要知道如何缩放这个值。条目大小为 4096 个样本，采样率为 44100
fft - 亲吻 FFT 线程安全
我将在 kiss-fft 之前制定几个计划同时(平行)，我可以这样做吗，或者换句话说，kiss-fft 线程安全吗？谢谢最佳答案自述文件: No static data is used. Th
fft - 使用 FFTW 的零填充 FFT
要在频域中插入信号，可以在时域中填充零并执行 FFT。假设给定向量 X 中的元素数为 N 并且 Y 与 X 相同但在一侧用 N 零填充。然后下面给出相同的结果。 $$\hat{x}(k)=\sum_
fft - STFT 澄清(实时输入的 FFT)
我通过相关了解了 DFT 的工作原理，并将其用作理解 FFT 结果的基础。如果我有一个以 44.1kHz 采样的离散信号，那么这意味着如果我要获取 1 秒的数据，我将有 44,100 个样本。为了对其
fft - Ron Mayer FFT 卷积算法
有人知道 Mayer FFT 的实现吗(我不必花很多时间研究代码)？我正在尝试执行卷积，ifft 似乎产生了我称之为“镜像”的输出。换句话说，我的内核+信号长度被限制为 N/2 并且占据 n=0..
fft - Ron Mayer FFT 卷积算法
有人知道 Mayer FFT 的实现吗(我不必花很多时间研究代码)？我正在尝试执行卷积，ifft 似乎产生了我称之为“镜像”的输出。换句话说，我的内核+信号长度被限制为 N/2 并且占据 n=0..
python - numpy.fft.fft 与高精度数字的意外行为
我有以下代码...请注意#生成正弦曲线下的两行。一个使用比另一个更高的 2pi 精度值，但它们仍然应该给出几乎相同的结果。 import numpy as np import matplotlib.p
c++ - fft 的逆 fft 不返回预期数据
我正在努力确保 FFTW 做我认为它应该做的事情，但我遇到了问题。我正在使用 OpenCV 的 cv::Mat。我制作了一个测试程序，给定一个 Mat f，计算 ifft(fft(f)) 并将结果与
c - FFT 和 FFT 的逆
我是从事电信项目的计算机程序员。在我们的项目中，我必须将一系列复数更改为它们的傅立叶变换。因此我需要一个高效的 FFT 代码来满足 C89 标准。我正在使用以下代码，它运行良好: shor
python - numpy.fft.fft 是如何工作的？
我目前正在尝试了解 numpy 的 fft 函数。为此，我测试了以下假设: 我有两个函数，f(x) = x^2 和 g(x) = f'(x) = 2*x。根据傅立叶变换定律和 wolfram alph
Python NumPy - FFT 和逆 FFT？
我一直在使用 FFT，目前正在尝试使用 FFT 从文件中获取声音波形(最终对其进行修改)，然后将修改后的波形输出回文件。我得到了声波的 FFT，然后对其使用了反 FFT 函数，但输出文件听起来一点也不

首页

博学

6Ren·AI

商城

java - Android 中音频信号的 FFT 解码器