android - 将录音编码和解码为 G711 ( PCMU

android - 将录音编码和解码为 G711 ( PCMU - uLaw) 格式

转载作者：塔克拉玛干更新时间：2023-11-02 18:50:48

当我们需要流式传输音频时，没有太多关于应用此编解码器的信息。在不应用编解码器的情况下，我的代码就像在两个设备之间建立通信的魅力一样工作，但我需要以该格式进行编码/解码，因为我需要使用服务器而不是在两个设备之间进行流式传输(我正在使用 2 个设备测试此代码)。

如果你们中的任何人能看到我的问题的关键在哪里，我正在寻找机会。我尝试了输入参数的不同配置。也许，我使用的编解码器是错误的(我从一个具有 Apache 许可证的项目中获取了它们。)

此值在记录器发送器中设置，就像在播放器接收器设备中一样:

private int port=50005;
private int sampleRate = 8000 ;//44100;
private int channelConfig = AudioFormat.CHANNEL_OUT_MONO;    
private int audioFormat = AudioFormat.ENCODING_PCM_16BIT;       
int minBufSize = AudioTrack.getMinBufferSize(sampleRate, channelConfig, audioFormat);

注意:播放器中的 CHANNEL_OUT_MONO 和录音器项中的 CHANNEL_IN_MONO。

这些是我的方法:

public void startStreamingEncoding() {

    Thread streamThread = new Thread(new Runnable() {

        @Override
        public void run() {
            try {

                android.os.Process.setThreadPriority(android.os.Process.THREAD_PRIORITY_URGENT_AUDIO);

                DatagramSocket socket = new DatagramSocket();

                short[] buffer = new short[minBufSize];

                DatagramPacket packet;

                final InetAddress destination = InetAddress.getByName(ip_receiver); 

                recorder = new AudioRecord(MediaRecorder.AudioSource.MIC,sampleRate,channelConfig,audioFormat,minBufSize*10);

                recorder.startRecording();

                /////Encoding:
                Encoder encoder = new G711UCodec();
                byte[] outBuffer = new byte[minBufSize];

                while(status == true) {

                    //reading data from MIC into buffer
                    minBufSize = recorder.read(buffer, 0, buffer.length);
                    //Encoding:
                    encoder.encode(buffer, minBufSize, outBuffer, 0);

                    //putting buffer in the packet
                    packet = new DatagramPacket (outBuffer, outBuffer.length, destination,port);

                    socket.send(packet);
                }

            } catch(UnknownHostException e) {
                Log.e("VS", "UnknownHostException");
            } catch (IOException e) {
                e.printStackTrace();
                Log.e("VS", "IOException");
            } 
        }

    });
    streamThread.start();
 }

以及播放和解码流的方法:

    public void playerAudioDecoding()
{
    Thread thrd = new Thread(new Runnable() {
        @Override
        public void run() 
        {
            android.os.Process.setThreadPriority(android.os.Process.THREAD_PRIORITY_URGENT_AUDIO);

            AudioTrack track = new AudioTrack(AudioManager.STREAM_MUSIC, 
                    sampleRate, AudioFormat.CHANNEL_CONFIGURATION_MONO, 
                    AudioFormat.ENCODING_PCM_16BIT, minBufSize, 
                    AudioTrack.MODE_STREAM);
            track.play();

            Decoder decoder = new G711UCodec();

            try
            {
                DatagramSocket sock = new DatagramSocket(port);
                byte[] buf = new byte[minBufSize];

                while(true)
                {
                    DatagramPacket pack = new DatagramPacket(buf, minBufSize);
                    sock.receive(pack);

                    //Decoding:
                    int size = pack.getData().length;
                    short[] shortArray = new short[size];

                    decoder.decode(shortArray, pack.getData(), minBufSize, 0);
                    byte[] array = MyShortToByte(shortArray);
                    track.write(array, 0, array.length);
                }
            }
            catch (SocketException se)
            {
                Log.e("Error", "SocketException: " + se.toString());
            }
            catch (IOException ie)
            {
                Log.e("Error", "IOException" + ie.toString());
            }
        } // end run
    });
    thrd.start();
}

这是我使用 Apache 许可证的编解码器类:

public class G711UCodec implements Encoder, Decoder {
// s00000001wxyz...s000wxyz
// s0000001wxyza...s001wxyz
// s000001wxyzab...s010wxyz
// s00001wxyzabc...s011wxyz
// s0001wxyzabcd...s100wxyz
// s001wxyzabcde...s101wxyz
// s01wxyzabcdef...s110wxyz
// s1wxyzabcdefg...s111wxyz

private static byte[] table13to8 = new byte[8192];
private static short[] table8to16 = new short[256];

static {
    // b13 --> b8
    for (int p = 1, q = 0; p <= 0x80; p <<= 1, q+=0x10) {
        for (int i = 0, j = (p << 4) - 0x10; i < 16; i++, j += p) {
            int v = (i + q) ^ 0x7F;
            byte value1 = (byte) v;
            byte value2 = (byte) (v + 128);
            for (int m = j, e = j + p; m < e; m++) {
                table13to8[m] = value1;
                table13to8[8191 - m] = value2;
            }
        }
    }

    // b8 --> b16
    for (int q = 0; q <= 7; q++) {
        for (int i = 0, m = (q << 4); i < 16; i++, m++) {
            int v = (((i + 0x10) << q) - 0x10) << 3;
            table8to16[m ^ 0x7F] = (short) v;
            table8to16[(m ^ 0x7F) + 128] = (short) (65536 - v);
        }
    }
}

public int decode(short[] b16, byte[] b8, int count, int offset) {
    for (int i = 0, j = offset; i < count; i++, j++) {
        b16[i] = table8to16[b8[j] & 0xFF];
    }
    return count;
}

public int encode(short[] b16, int count, byte[] b8, int offset) {

    for (int i = 0, j = offset; i < count; i++, j++) {
        b8[j] = table13to8[(b16[i] >> 4) & 0x1FFF];
    }
    return count;
}

public int getSampleCount(int frameSize) {
    return frameSize;
}

真的，我不知道发生了什么；如果我将 sampleRate 更改为 4000，我可以识别我的声音和一些单词，但有很多回声。我再说一遍，如果禁用编码/解码过程并在 PCM 中进行流式传输，质量会很棒。让我看看是否有人可以帮助我，在此先感谢您。

最佳答案

好吧，我终于自己解决了编码/解码音频的问题。上周这是一项烦人的任务。我的代码的主要问题是编码做得很好但解码不是所以我正在解决它并在其他资源的帮助下修改这些类并且我已经创建了我自己的编码/解码方法(并且这些正在工作就像一个魅力!!!)。

另一个重要的决定是改变编码格式。现在我使用的是 alaw，不再是 ulaw。我进行此更改的唯一原因是因为以编程方式实现 alaw 比 ulaw 更容易。

此外，我还必须经常使用缓冲区大小等参数。

我将提交我的代码，我希望你们中的某些人可以使用我的引用资料节省大量时间。

    private int port=50005;
private int sampleRate = 8000; //44100;
private int channelConfig = AudioFormat.CHANNEL_IN_MONO;    
private int audioFormat = AudioFormat.ENCODING_PCM_16BIT;       
int minBufSize = AudioRecord.getMinBufferSize(sampleRate, channelConfig, audioFormat);

public void startStreamingEncoding() {

    Thread streamThread = new Thread(new Runnable() {

        @Override
        public void run() {
            try {

                android.os.Process.setThreadPriority(android.os.Process.THREAD_PRIORITY_URGENT_AUDIO);

                DatagramSocket socket = new DatagramSocket();

                byte[] buffer = new byte[4096];

                DatagramPacket packet;

                final InetAddress destination = InetAddress.getByName(ip_receiver); 

                recorder = new AudioRecord(MediaRecorder.AudioSource.MIC,sampleRate,channelConfig,audioFormat, minBufSize * 10);

                recorder.startRecording();

                /////Encoding:
                CMG711 encoder = new CMG711();
                byte[] outBuffer = new byte[4096];

                int read, encoded;
                File sdCard = Environment.getExternalStorageDirectory();
                FileOutputStream out = new FileOutputStream( new File( sdCard ,"audio-bernard.raw" ));

                while(status == true) {

                    //reading data from MIC into buffer
                    read = recorder.read(buffer, 0, buffer.length);
                    Log.d(getTag(), "read: "+read );

                    //Encoding:
                    encoded = encoder.encode(buffer,0, read, outBuffer);                      

                    //putting buffer in the packet
                    packet = new DatagramPacket (outBuffer, encoded, destination,port);
                    out.write( outBuffer, 0, encoded );

                    socket.send(packet);
                }

            } catch(UnknownHostException e) {
                Log.e("VS", "UnknownHostException");
            } catch (IOException e) {
                e.printStackTrace();
                Log.e("VS", "IOException");
            } 
        }

    });
    streamThread.start();
 }

对于接收器和播放器类或方法:

private int port=50005;
private int sampleRate = 8000 ;//44100;
private int channelConfig = AudioFormat.CHANNEL_OUT_MONO;    
private int audioFormat = AudioFormat.ENCODING_PCM_16BIT;       
int minBufSize = AudioTrack.getMinBufferSize(sampleRate, channelConfig, audioFormat);


 public void playerAudioDecodingBernard()
    {
        Thread thrd = new Thread(new Runnable() {
            @Override
            public void run() 
            {
                android.os.Process.setThreadPriority(android.os.Process.THREAD_PRIORITY_URGENT_AUDIO);

                AudioTrack track = new AudioTrack(AudioManager.STREAM_MUSIC, 
                        sampleRate, AudioFormat.CHANNEL_OUT_MONO, 
                        AudioFormat.ENCODING_PCM_16BIT, minBufSize * 10, 
                        AudioTrack.MODE_STREAM);


                CMG711 decoder = new CMG711();

                try
                {
                    DatagramSocket sock = new DatagramSocket(port);
                    byte[] buf = new byte[4096];

                    int frame = 0;
                    while(true)
                    {
                        DatagramPacket pack = new DatagramPacket(buf, 4096);
                        sock.receive(pack);

                        //Decoding:                         
                        int size = pack.getLength();
                        //Log.d( "Player", "Player: "+ size +", "+pack.getLength() + ", "+pack.getOffset() );
                        byte[] byteArray = new byte[size*2];

                        decoder.decode(pack.getData(), 0, size, byteArray);
                        track.write(byteArray, 0, byteArray.length);

                        if( frame++ > 3 )
                            track.play();
                    }
                }
                catch (SocketException se)
                {
                    Log.e("Error", "SocketException: " + se.toString());
                }
                catch (IOException ie)
                {
                    Log.e("Error", "IOException" + ie.toString());
                }
            } // end run
        });
        thrd.start();
    }

这是 alaw 格式的编码/解码类:

public class CMG711
{
/** decompress table constants */
private static short aLawDecompressTable[] = new short[]
{ -5504, -5248, -6016, -5760, -4480, -4224, -4992, -4736, -7552, -7296, -8064, -7808, -6528, -6272, -7040, -6784, -2752, -2624, -3008, -2880, -2240, -2112, -2496, -2368, -3776, -3648, -4032, -3904, -3264, -3136, -3520, -3392, -22016, -20992, -24064, -23040, -17920, -16896, -19968, -18944, -30208, -29184, -32256, -31232, -26112, -25088, -28160, -27136, -11008, -10496, -12032, -11520, -8960, -8448, -9984, -9472, -15104, -14592, -16128, -15616, -13056, -12544, -14080, -13568, -344, -328, -376,
        -360, -280, -264, -312, -296, -472, -456, -504, -488, -408, -392, -440, -424, -88, -72, -120, -104, -24, -8, -56, -40, -216, -200, -248, -232, -152, -136, -184, -168, -1376, -1312, -1504, -1440, -1120, -1056, -1248, -1184, -1888, -1824, -2016, -1952, -1632, -1568, -1760, -1696, -688, -656, -752, -720, -560, -528, -624, -592, -944, -912, -1008, -976, -816, -784, -880, -848, 5504, 5248, 6016, 5760, 4480, 4224, 4992, 4736, 7552, 7296, 8064, 7808, 6528, 6272, 7040, 6784, 2752, 2624,
        3008, 2880, 2240, 2112, 2496, 2368, 3776, 3648, 4032, 3904, 3264, 3136, 3520, 3392, 22016, 20992, 24064, 23040, 17920, 16896, 19968, 18944, 30208, 29184, 32256, 31232, 26112, 25088, 28160, 27136, 11008, 10496, 12032, 11520, 8960, 8448, 9984, 9472, 15104, 14592, 16128, 15616, 13056, 12544, 14080, 13568, 344, 328, 376, 360, 280, 264, 312, 296, 472, 456, 504, 488, 408, 392, 440, 424, 88, 72, 120, 104, 24, 8, 56, 40, 216, 200, 248, 232, 152, 136, 184, 168, 1376, 1312, 1504, 1440, 1120,
        1056, 1248, 1184, 1888, 1824, 2016, 1952, 1632, 1568, 1760, 1696, 688, 656, 752, 720, 560, 528, 624, 592, 944, 912, 1008, 976, 816, 784, 880, 848 };

private final static int cClip = 32635;
private static byte aLawCompressTable[] = new byte[]
{ 1, 1, 2, 2, 3, 3, 3, 3, 4, 4, 4, 4, 4, 4, 4, 4, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 6, 6, 6, 6, 6, 6, 6, 6, 6, 6, 6, 6, 6, 6, 6, 6, 6, 6, 6, 6, 6, 6, 6, 6, 6, 6, 6, 6, 6, 6, 6, 6, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7 };

public int encode( byte[] src, int offset, int len, byte[] res )
{
    int j = offset;
    int count = len / 2;
    short sample = 0;

    for ( int i = 0; i < count; i++ )
    {
        sample = (short) ( ( ( src[j++] & 0xff ) | ( src[j++] ) << 8 ) );
        res[i] = linearToALawSample( sample );
    }
    return count;
}

private byte linearToALawSample( short sample )
{
    int sign;
    int exponent;
    int mantissa;
    int s;

    sign = ( ( ~sample ) >> 8 ) & 0x80;
    if ( !( sign == 0x80 ) )
    {
        sample = (short) -sample;
    }
    if ( sample > cClip )
    {
        sample = cClip;
    }
    if ( sample >= 256 )
    {
        exponent = (int) aLawCompressTable[( sample >> 8 ) & 0x7F];
        mantissa = ( sample >> ( exponent + 3 ) ) & 0x0F;
        s = ( exponent << 4 ) | mantissa;
    }
    else
    {
        s = sample >> 4;
    }
    s ^= ( sign ^ 0x55 );
    return (byte) s;
}

public void decode( byte[] src, int offset, int len, byte[] res )
{
    int j = 0;
    for ( int i = 0; i < len; i++ )
    {
        short s = aLawDecompressTable[src[i + offset] & 0xff];
        res[j++] = (byte) s;
        res[j++] = (byte) ( s >> 8 );
    }
}
}

希望对你们有用!无论如何，感谢您提供的帮助，特别感谢 bonnyz。

关于android - 将录音编码和解码为 G711 ( PCMU - uLaw) 格式，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/23273866/

文章推荐： android - 9 补丁图像阻止构建项目 android studio

文章推荐： Android 应用已发布，但未在 Google Play 中找到

文章推荐： android - Webview 文本选择不清除

文章推荐： android - 根据当前设置的主题获取属性颜色值

java - 以 Clojure 格式(java.util.Formatter)、cl 格式(Common Lisp 格式)以编程方式控制填充？
有没有办法使用 Clojure format(基于 java.util.Formatter)或 cl-format(基于 Common Lisp 的format) 以编程方式设置空格填充？如果您事先知
java - 在数据库和 postman 上无法看到实际上传的文件(.pdf 格式)格式？
我正在尝试创建一个用户实体以及数据/文件(pdf格式)。上传并保存到数据库很好，但是当我让用户进入 postman 时尝试发送获取请求方法，然后在数据字段中显示一些糟糕的数据，而且我无法在数据库中看到
java - 将字符串转换为 ASCII 格式，然后再转换为 HEX 格式
我必须将值为 {"STX","ETX"} 的普通字符串数组转换为十六进制值，并且我应该根据 http://www.asciitable.com/ 得到 {2,3} . 最佳答案听起来你想要一个 Ma
flutter - dartfmt vs dart 格式 vs flutter 格式
我想格式化我的代码，但不确定哪种格式类型最适合我的项目需要。我发现仅对于 dart 和 flutter 项目(我都有)，有不止一个选项可用于格式化编程语言/框架中预先构建的代码。 Dart : da
excel - 我的 excel 文件是德国(德语)格式，想更改为英语(英国)格式
我已经尝试了多个代码，例如这样 Sub DateFixer() Application.ScreenUpdating = False Application.Calculation =
java - 当我查询 SOLR 时，我希望输出为 csv 格式，但输出仍然为 javabin 格式
SolrQuery query = new SolrQuery(); query.setQuery("*:*"); query.add("wt","csv"); server.query(query)
c++ - 将 QString 日期(RFC 822 格式)转换为另一种基于文化的 QString 格式
我有一个包含多个字符串的数据库，我从查询中获取了这些记录，并且我在 QString 中收到了这种格式的数据: "Mon, 13 Nov 2017 09:48:45 +0000" 所以，我需要根据文化来
xml - 如何在未安装 Excel 的情况下将 DBGrid 导出为 OOXML 格式(Excel 2007/2010 格式)？
我有一个 Delphi 2007 DBGrid，我想让用户以更新的 Excel 格式 (OOXML) 保存它，但我的标准是用户不需要安装 Excel。有没有人知道任何已经这样做的组件？是的，我已经搜索
ruby-on-rails - 在 rails 3.1 中更改 View 格式(提供移动 html 格式，回退到普通 html)
我正在我们的普通 html 站点旁边创建一个移动站点。使用 rails 3.1。移动站点在子域 m.site.com 中访问。我已经定义了移动格式(Mime::Type.register_alias
xmlstarlet 格式
我正在尝试使用 xmlstarlet 格式化 xml 文件，但我不想创建新的 xml 文件。我试过了 xmlstarlet fo --inplace --indent-tab --omit-decl
Excel 格式
我在 A 列中有一个带有文本的电子表格。例如 A1=MY TEXT1 A2=MY TEXT2 A3=MY TEXT3 A4=MY TEXT4 A5=MY TEXT5 我想在文本的前后添加撇号结果是
解析haskell保留注释/格式
我想做一些源代码转换(自动导入列表清理)，我想保留注释和格式。我听说过一些关于解析器这样做的事情，我认为是 ghc 解析器。看起来我可以通过从文件中提取内容来使用 hs-src-exts Langu
用于使值相等的 Excel 格式
我在 Excel 中工作，我想根据另一张表中的列表找出一张表中是否有匹配项。我已将值粘贴到列表中，并希望从另一张表中返回它们的相应值。包含字母和数字的单元格可以正常工作(例如:D5765000)，但
django - DurationField 格式
我有一个 DurationField在我的模型中定义为 day0 = models.DurationField('Duration for Monday', default=datetime.time
wmi - PNPDeviceID 格式
我正在为我的应用程序开发 WMI 查询。它需要为给定的 VID/PID 找到分配的虚拟 COM 端口。使用 WMI Code Creator 我发现...... 命名空间:root\CIMV2 类:W
swift - NSTextList 格式
我试图弄清楚如何使用 NSTextList，但除了 this SO question 之外，在网上几乎没有找到有用的信息。和 the comment in this blog . 使用这个我已经能够创
Oracle last_ddl_time 格式
我要查询all_objects表在哪里last_ddl_time='01 jan 2010'但它拒绝日期格式... 任何机构给我查询的确切格式？最佳答案正如 AKF 所说，您应该使用 Trunc除
Java JEditorPane 格式
我试图在我的应用程序中实现聊天功能。我使用了 2 个 JEditorPane。一个用于保存聊天记录，另一个用于将聊天发送到前一个 JEditorPane。 JEditorPane 是 text/h
assembly - 玩具编译器的输出语言/格式
我在大学里修了一个编译器类(class)，内容非常丰富，很有趣，尽管也很多工作。既然给了我们要实现的语言规范，所以我学不到的一件事就是语言设计。我现在正在考虑创建一种有趣的简单玩具语言，以便我可以玩耍
gradle - Gradle异常的结构/格式
Closed. This question does not meet Stack Overflow guidelines。它当前不接受答案。想改善这个问题吗？更新问题，以便将其作为on-topic

塔克拉玛干

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

android - 将录音编码和解码为 G711 ( PCMU - uLaw) 格式