java - 在每个 RTP 数据包中捕获 8kHz、16 位线性样本和 4 帧 20ms 音频-6ren

java - 在每个 RTP 数据包中捕获 8kHz、16 位线性样本和 4 帧 20ms 音频

转载作者：塔克拉玛干更新时间：2023-11-02 19:57:45

我需要编写简单的 Java 客户端程序来捕获实时音频流。

要求

RTP 音频数据包。
8kHz、16 位线性样本(线性 PCM)。
将在每个 RTP 数据包中发送 4 帧 20ms 音频。

经过一些搜索，我在互联网上找到了示例代码来捕获音频，但它会播放哔声。

代码

import java.io.ByteArrayInputStream;
import java.net.DatagramPacket;
import java.net.DatagramSocket;
import javax.sound.sampled.AudioFormat;
import javax.sound.sampled.AudioInputStream;
import javax.sound.sampled.AudioSystem;
import javax.sound.sampled.DataLine;
import javax.sound.sampled.SourceDataLine;

public class Server {

    AudioInputStream audioInputStream;
    static AudioInputStream ais;
    static AudioFormat format;
    static boolean status = true;
    static int port = 31007;
    static int sampleRate = 44100;

    static DataLine.Info dataLineInfo;
    static SourceDataLine sourceDataLine;

    public static void main(String args[]) throws Exception 
    {
        System.out.println("Server started at port:"+port);

        @SuppressWarnings("resource")
        DatagramSocket serverSocket = new DatagramSocket(port);

        /**
         * Formula for lag = (byte_size/sample_rate)*2
         * Byte size 9728 will produce ~ 0.45 seconds of lag. Voice slightly broken.
         * Byte size 1400 will produce ~ 0.06 seconds of lag. Voice extremely broken.
         * Byte size 4000 will produce ~ 0.18 seconds of lag. Voice slightly more broken then 9728.
         */

        byte[] receiveData = new byte[4096];

        format = new AudioFormat(sampleRate, 16, 2, true, false);
        dataLineInfo = new DataLine.Info(SourceDataLine.class, format);
        sourceDataLine = (SourceDataLine) AudioSystem.getLine(dataLineInfo);
        sourceDataLine.open(format);
        sourceDataLine.start();

        //FloatControl volumeControl = (FloatControl) sourceDataLine.getControl(FloatControl.Type.MASTER_GAIN);
        //volumeControl.setValue(1.00f);

        DatagramPacket receivePacket = new DatagramPacket(receiveData, receiveData.length);

        ByteArrayInputStream baiss = new ByteArrayInputStream(receivePacket.getData());

        while (status == true) 
        {
            System.out.println("Reciving Packets");
            serverSocket.receive(receivePacket);
            ais = new AudioInputStream(baiss, format, receivePacket.getLength());
            toSpeaker(receivePacket.getData());
        }
        sourceDataLine.drain();
        sourceDataLine.close();
    }

    public static void toSpeaker(byte soundbytes[]) {
        try 
        {
            System.out.println("At the speaker");
            sourceDataLine.write(soundbytes, 0, soundbytes.length);
        } catch (Exception e) {
            System.out.println("Not working in speakers...");
            e.printStackTrace();
        }
    }
}

我想我找不到合适的格式来捕获以给定格式发送的数据包？

任何人都可以帮助我找到合适的AudioFormat 来捕获此音频流或任何指向相同的链接对我有帮助...谢谢...:)

回答

float sampleRate = 8000;
int sampleSizeInBits = 16;
int channels = 1;
boolean signed = true;
boolean bigEndian = true;
AudioFormat(sampleRate, sampleSizeInBits, channels, signed, bigEndian);

UDP + RTP 数据包格式

同时从数据中缓冲负 12 个字节，因为它包含 RTP header 信息。

receivePacket = new DatagramPacket(receiveData, receiveData.length);
byte[] packet = new byte[receivePacket.getLength() - 12];
serverSocket.receive(receivePacket);
packet = Arrays.copyOfRange(receivePacket.getData(), 12, receivePacket.getLength());

希望这对您将来有所帮助，或者如果不对，请随时纠正谢谢..

最佳答案

你可以试试这个基于数据报套接字的客户端和服务器的实现。它使用单声道 8000Hz 16bit 签名大端音频格式。服务器在端口号 9786 上运行，而客户端使用端口号 8786。我想代码很容易理解。

服务器:

import java.io.*;
import java.net.*;
import javax.sound.sampled.*;

public class Server {

ByteArrayOutputStream byteOutputStream;
AudioFormat adFormat;
TargetDataLine targetDataLine;
AudioInputStream InputStream;
SourceDataLine sourceLine;

private AudioFormat getAudioFormat() {
    float sampleRate = 8000.0F;
    int sampleSizeInBits = 16;
    int channels = 1;
    boolean signed = true;
    boolean bigEndian = true;
    return new AudioFormat(sampleRate, sampleSizeInBits, channels, signed, bigEndian);
}

public static void main(String args[]) {
    new Server().runVOIP();
}

public void runVOIP() {
    try {
        DatagramSocket serverSocket = new DatagramSocket(9786);
        byte[] receiveData = new byte[4096];
        while (true) {
            DatagramPacket receivePacket = new DatagramPacket(receiveData, receiveData.length);
            serverSocket.receive(receivePacket);
            System.out.println("RECEIVED: " + receivePacket.getAddress().getHostAddress() + " " + receivePacket.getPort());
            try {
                byte audioData[] = receivePacket.getData();
                InputStream byteInputStream = new ByteArrayInputStream(audioData);
                AudioFormat adFormat = getAudioFormat();
                InputStream = new AudioInputStream(byteInputStream, adFormat, audioData.length / adFormat.getFrameSize());
                DataLine.Info dataLineInfo = new DataLine.Info(SourceDataLine.class, adFormat);
                sourceLine = (SourceDataLine) AudioSystem.getLine(dataLineInfo);
                sourceLine.open(adFormat);
                sourceLine.start();
                Thread playThread = new Thread(new PlayThread());
                playThread.start();
            } catch (Exception e) {
                System.out.println(e);
                System.exit(0);
            }
        }
    } catch (Exception e) {
        e.printStackTrace();
    }
}

class PlayThread extends Thread {

    byte tempBuffer[] = new byte[4096];

    public void run() {
        try {
            int cnt;
            while ((cnt = InputStream.read(tempBuffer, 0, tempBuffer.length)) != -1) {
                if (cnt > 0) {
                    sourceLine.write(tempBuffer, 0, cnt);
                }
            }
        } catch (Exception e) {
            System.out.println(e);
            System.exit(0);
        }
    }
}
}

客户:

import java.io.*;
import java.net.*;
import javax.sound.sampled.*;

public class Client {

boolean stopaudioCapture = false;
ByteArrayOutputStream byteOutputStream;
AudioFormat adFormat;
TargetDataLine targetDataLine;
AudioInputStream InputStream;
SourceDataLine sourceLine;

public static void main(String args[]) {
    new Client();
}

public Client() {
    captureAudio();
}

private AudioFormat getAudioFormat() {
    float sampleRate = 8000.0F;
    int sampleSizeInBits = 16;
    int channels = 1;
    boolean signed = true;
    boolean bigEndian = true;
    return new AudioFormat(sampleRate, sampleSizeInBits, channels, signed, bigEndian);
}

private void captureAudio() {
    try {
        adFormat = getAudioFormat();
        DataLine.Info dataLineInfo = new DataLine.Info(TargetDataLine.class, adFormat);
        targetDataLine = (TargetDataLine) AudioSystem.getLine(dataLineInfo);
        targetDataLine.open(adFormat);
        targetDataLine.start();

        Thread captureThread = new Thread(new CaptureThread());
        captureThread.start();
    } catch (Exception e) {
        StackTraceElement stackEle[] = e.getStackTrace();
        for (StackTraceElement val : stackEle) {
            System.out.println(val);
        }
        System.exit(0);
    }
}

class CaptureThread extends Thread {

    byte tempBuffer[] = new byte[4096];

    @Override
    public void run() {
        stopaudioCapture = false;
        try {
            DatagramSocket clientSocket = new DatagramSocket(8786);
            InetAddress IPAddress = InetAddress.getByName("127.0.0.1");
            int cnt;
            while (!stopaudioCapture) {
                cnt = targetDataLine.read(tempBuffer, 0, tempBuffer.length);
                if (cnt > 0) {
                    DatagramPacket sendPacket = new DatagramPacket(tempBuffer, tempBuffer.length, IPAddress, 9786);
                    clientSocket.send(sendPacket);
                }
            }
        } catch (Exception e) {
            System.out.println("CaptureThread::run()" + e);
            System.exit(0);
        }
    }
}

}

关于java - 在每个 RTP 数据包中捕获 8kHz、16 位线性样本和 4 帧 20ms 音频，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/32368835/

文章推荐： ios - 当应用程序未运行 IOS 时播放警报声音

文章推荐： android - Nsd Manager Android 在 4.2.2 上崩溃

文章推荐： android:验证 Intent 发送者的身份

文章推荐： android - 报错android SurfaceFlinger

iphone - 产生8 kHz/12 kHz/15 kHz/17.4 kHz/22 kHz+iphone sdk的超声波
我想做fly应用喜欢this ,我知道我必须进行编码，使其产生超声波，使苍蝇远离一定距离。而且是人耳听不到的声音。我对 iPhone 中的超声波一无所知。谁能指导我。提前致谢。最佳答案下载超声
algorithm - 在 python 中将 Goertzel 算法扩展到 24 kHz、32 kHz 和 48 kHz
我正在学习实现 Goertzel 的算法来从录制的波形文件中检测 DTMF 音调。我从 here 中用 python 实现了一个.它支持以 8 kHz 和 16 kHz 采样的音频。我想扩展它以支持以
audio - 使用C中的libmad库将24 khz mp3音频转换为16 khz wav？
我正在用C编写一个小型应用程序，该应用程序从基于云的语音引擎接收mp3音频数据，并以16 khz采样率将其转换为pcm数据(wav格式)。我正在使用libmad解码mp3数据，但没有找到将其从24 k
ios - 使用iOS检测中等(17 kHz-20 kHz)音频频率
我想用我的iPhone检测视频中的音频频率。该音调的频率应在17 kHz到20 kHz之间，我发现了一个sample，但是当我在Mac上的模拟器上尝试使用它时，它可以工作，当我将其放在iPhone上以
iOS 将音频采样率从 16 kHz 转换为 8 kHz
我尝试将 PCM 音频从 16kHz 转换为 8kHz，只是采样率，没有格式变化，流程看起来很简单，但我一直通过调用 AudioConverterFillComplexBuffermBuffers[0
java - 在 44.1 kHz 接收器上播放 48 kHz PCM
我有一个 48 kHz PCM 流，并希望将其流式传输到 44.1 kHz 兼容播放器(Apple 的 AirPlay)。有人知道这是否“有效，因为一些字节会丢失”，或者我是否必须在之前进行转换/下
jquery - 录音，8或11 khz jQuery
我最近使用了jRecorder jQuery，但发现它以44 khz记录。我需要将创建的.wav文件转换为8或11 khz，或者找到一个要以44 khz录制的新插件。有谁知道一个好的插件，或者知道如
audio - 为什么Windows文件属性对于48 kHz，16位编码显示位速率:1152 kBit/s？
我有一个wav文件，每个音频编辑器都告诉我这是一个48kHz，16位的wav文件。但是，当我右键单击wav文件并打开Windows文件属性对话框时，看到“位速率:1152 kBit / s”。 “位
arduino - Arduino 可以在微秒内采样 1-4 kHz 的音频吗？
我刚刚连接了 electret microphone到 Arduino，我想在 1 kHz 的范围内进行采样和 4kHz。我知道这仅限于机器代码和 ADC ，所以我试图保留 sketch简单。是
Python - 加速度计以 1 kHz 速率读取和写入 CSV 文件
我正在尝试使用 MPU-6000 加速度计和 Raspberry Pi Zero W 来记录挡风玻璃中的振动数据。我对 Python 还很陌生，所以请耐心等待。我编写了一个 python2 脚本，用
android - 任何支持 48 kHz 的声学回声消除 (AEC) 库？
我正在开发一个以 48 kHz 采样率运行的 VoIP 应用程序。由于它使用内部使用 48 kHz 的 Opus 作为其编解码器，并且大多数当前的 Android 硬件本身以 48 kHz 运行，因此
windows - Windows XP 中的 100 kHz 定时器频率
关闭。这个问题需要更多focused .它目前不接受答案。想改进这个问题吗？更新问题，使其只关注一个问题 editing this post . 关闭 2 年前。 Improve this qu
python - 使用 Python 3 捕获 192 kHz 音频
我需要使用 Python 3 为一些生物声学实验捕获 192 kHz 音频。我有硬件、Sound Devices USBPre 2 声卡、具有高达 100 kHz 良好频率响应曲线的麦克风，并且我已启
linux - linux 内核的最大中断频率是 Hz、kHz、MHz 还是 GHz？
开始之前:是的，我知道答案是 architecture dependent - 我只对大致数字感兴趣，就数量级而言。 linux内核对中断频率有上限吗？背景:我想在 Linux 中连接相机模块。该模
Bash/ffmpeg : How to loop over all wave files that do not have 16bit and 44. 1 khz？
我有这个脚本，用于将目录中的所有 wav 文件转换为 44100 hz 的 16 位。但是，它也会转换已经具有这些属性的文件。如何过滤文件以便只转换需要转换的文件？我正在使用 ubuntu 开发 W
embedded - 以 44 kHz 的速率将 16 位数据记录到 SD 卡
我正在使用带有 microSD 卡的 STM32F4 微 Controller 。我正在通过 DMA 捕获模拟数据。我使用双缓冲区，一次获取 1280 (10*128 - 10 FFT) 个样本。当
audio - Javascript 中的 Web 音频 API 下采样 44.1 khz
我正在使用 RecorderJS 来录制来自用户的麦克风流。默认导出为 44.1 kHz、16 位的 WAV 文件。无论如何我可以将其降采样到 11kHz 或 16kHz 而不会听起来很奇怪吗？无论
ffmpeg - 使用 FFmpeg 和 DirectShow(dshow 输入)捕获 48 kHz 音频
我尝试在 FFmpeg 中捕获 48 kHz 的音频，代码如下: AVInputFormat* ifmt = av_find_input_format("dshow"); CHECK_POI
android - 解码音频文件并重新编码为所需的 PCM 格式 : 44, 100 kHz，2 channel ，16 位
我想将音频文件解码为原始 PCM 数据，以将其流式传输到本地网络中的播放设备。我使用新的 MediaExtractor和 MediaCodec API 级别 16 引入的类。该设备要求 PCM 数据为
c - 为什么 atmega16a 的 timer0 的频率是 46.86 kHz 而不是 12 MHz？
最近新买了一个USB示波器，想测avr timer0的频率。有一个 12 MHz 晶体振荡器连接到 atmega，timer0 设置为没有预分频器的快速 PWM 模式。这是代码: #include

塔克拉玛干

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

java - 在每个 RTP 数据包中捕获 8kHz、16 位线性样本和 4 帧 20ms 音频