gpt4 book ai didi

java - 从麦克风录制的声音的音量

转载 作者:行者123 更新时间:2023-11-29 09:00:47 25 4
gpt4 key购买 nike

我正在尝试编写一个在用户说话时使用react的小程序。比如让一个圆圈变大或类似的东西。

我正在使用此代码来访问麦克风,但如何让它仅在用户讲话时使用react?例如当录制的音量大于某个数量时。

    TargetDataLine line = null;
AudioFormat format = new AudioFormat(16000, 16, 1, true, true);
DataLine.Info info = new DataLine.Info(TargetDataLine.class, format);

if(! AudioSystem.isLineSupported(info)){
System.out.println("Line is not supported");
}

try{
line = (TargetDataLine) AudioSystem.getLine(info);
line.open();
}catch(LineUnavailableException e){
System.out.println("Failed to get line");
System.exit(-1);
}

ByteArrayOutputStream out = new ByteArrayOutputStream();
int numBytesRead;
byte[] data = new byte[line.getBufferSize() / 5];

// Begin audio capture.
line.start();

int i = 0;

// Here, stopped is a global boolean set by another thread.
while (i<100) {
// Read the next chunk of data from the TargetDataLine.
numBytesRead = line.read(data, 0, data.length);
// Save this chunk of data.
out.write(data, 0, numBytesRead);
i++;
System.out.println(i);
}

最佳答案

在最后一个 while 循环中,您将声音数据收集到一个名为“data”的缓冲区变量中。您需要做的是获取这些字节并将它们组装成可用的 DSP 值。这样做的代码取决于格式。最常见的是 16 位编码、立体声、little-endian。在这种情况下,您必须将字节对组装成值,其中第一个字节是低位,第二个字节是高位。有几篇关于这个主题的帖子详细介绍了如何处理这个问题。

值的范围从 -32768 到 32767(我是从内存中写的,可能不对,但它是一个短的范围)。很难说您希望阈值在哪里,因为音量不仅取决于绝对值(越大声音越大),还取决于花在较大值上的时间。 “安静”的声音可能具有非常大的瞬变值。此外,数字与分贝没有直接对应关系,需要一个换算公式。

因此,有几个问题需要处理,但如果您只是进入 while 循环并解码“数据”,您可能能够快速获得一些“足够好”的东西。

关于java - 从麦克风录制的声音的音量,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/17646085/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com