c# - 标准化音频，如何将 float 组转换为字节数组？-6ren

c# - 标准化音频，如何将 float 组转换为字节数组？

转载作者：行者123 更新时间：2023-11-30 13:12:17

24

4

大家好，我正在播放音频文件。我将其作为 byte[] 读取，然后我需要通过将值放入 [-1,1] 范围内来规范化音频。然后我想将每个浮点值放入一个 byte[i] 数组中，然后将那个 byte[] 放回正在播放的音频播放器中。

我已经试过了:

byte[] data = ar.ReadData();
byte[] temp=new byte[data.Length];
float biggest= 0; ;
for (int i = 0; i < data.Length; i++)
{
    if (data[i] > biggest)
    {
        biggest= data[i];
    }
}

这部分代码应该放在例如 0.43 int byte[] 中，如果可能的话我试过这个但它不起作用:

for (int i = 0; i < data.Length; i++)
{
    temp = BitConverter.GetBytes(data[i] * (1 / biggest));
}

最佳答案

在评论中，您说“我正在播放音频文件...我将其读取为 byte[]，然后我需要通过将值放入 [-1,1] 范围内来规范化音频，然后我需要把那个 byte[] 放回播放音频播放器"

我在这里做了一个很大的假设，但我猜测您从 ar.ReadData() 接收到的数据是 2 channel 16 位/44.1kHz PCM 数据的字节数组. (旁注:您使用的是 Alvas.Audio 库吗？)如果是这种情况，请按以下步骤操作。

背景

首先，介绍一下背景。 2 channel 、16 位 PCM 数据流如下所示:

   byte | 01 02 | 03 04 | 05 06 | 07 08 | 09 10 | 11 12 | ...
channel |  Left | Right | Left  | Right | Left |  Right | ...
  frame |     First     |    Second     |     Third     | ...
 sample | 1st L | 1st R | 2nd L | 2nd R | 3rd L | 3rd R | ... etc.

注意以下几点很重要:

由于音频数据是 16 位，来自单个 channel 的单个样本是 short(2 字节)，而不是 int(4 字节)，其中-32768 到 32767 范围内的值。
此数据在 little-endian 中表示，除非您的体系结构也是小端，否则您不能使用 .NET BitConverter转换类。
我们不必将数据拆分为每个 channel 的流，因为我们正在根据任一 channel 的单个最高值对两个 channel 进行归一化。
将浮点值转换为整数值会导致量化错误，因此您可能希望使用某种 dithering (这本身就是一个完整的主题)。

辅助函数

在我们进入实际的规范化之前，让我们通过编写一些辅助函数来从 byte[] 中获取 short 并副-相反:

short GetShortFromLittleEndianBytes(byte[] data, int startIndex)
{
    return (short)((data[startIndex + 1] << 8)
         | data[startIndex]);
}

byte[] GetLittleEndianBytesFromShort(short data)
{
    byte[] b = new byte[2];
    b[0] = (byte)data;
    b[1] = (byte)(data >> 8 & 0xFF);
    return b;
}

规范化

这里应该做一个重要的区分:audio normalization与statistical normalization不相同.在这里，我们将对音频数据执行峰值归一化，将信号放大一个常数，使其峰值位于上限。峰值标准化音频数据，我们首先找到最大值，从上限(对于 16 位 PCM 数据，这是 32767)减去它得到一个偏移量，然后每个值增加这个偏移量。

因此，为了标准化我们的音频数据，首先扫描它以找到峰值幅度:

byte[] input = ar.ReadData();  // the function you used above
float biggest = -32768F;
float sample;
for (int i = 0; i < input.Length; i += 2)
{
    sample = (float)GetShortFromLittleEndianBytes(input, i);
    if (sample > biggest) biggest = sample;
}

此时，biggest 包含音频数据中的最大值。现在要执行实际的归一化，我们从 32767 中减去 biggest 以获得一个值，该值对应于音频数据中最响亮样本的峰值偏移量。接下来，我们将此偏移量添加到每个音频样本，有效地增加每个样本的音量，直到我们最响亮的样本处于峰值。

float offset = 32767 - biggest;

float[] data = new float[input.length / 2];
for (int i = 0; i < input.Length; i += 2)
{
    data[i / 2] = (float)GetShortFromLittleEndianBytes(input, i) + offset;
}

最后一步是将样本从浮点值转换为整数值，并将它们存储为小端 shorts。

byte[] output = new byte[input.Length];
for (int i = 0; i < output.Length; i += 2)
{
    byte[] tmp = GetLittleEndianBytesFromShort(Convert.ToInt16(data[i / 2]));
    output[i] = tmp[0];
    output[i + 1] = tmp[1];
}

我们完成了!现在您可以将包含规范化 PCM 数据的 output 字节数组发送到您的音频播放器。

最后一点，请记住这段代码并不是最有效的；你可以组合这些循环中的几个，你可以使用 Buffer.BlockCopy() 进行数组复制，以及将你的 short 修改为 byte[] 辅助函数将字节数组作为参数并将值直接复制到数组中。我没有做任何这些，以便更容易看到发生了什么。

正如我之前提到的，您应该绝对阅读抖动，因为它会极大地提高音频输出的质量。

我自己一直在做一个音频项目，所以我通过反复试验弄清楚了所有这些；我希望它能对某个地方的人有所帮助。

关于c# - 标准化音频，如何将 float 组转换为字节数组？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/9805407/

24

4

0

文章推荐： c# - 如何在 Visual Studio 2010 中测试函数？

文章推荐： c# - 无法弄清楚异常消息

文章推荐： c# - 如何禁用 CheckedListBox 但启用滚动 winforms

文章推荐： c# - 基于列表定义模板创建列表

javascript - Web 音频/ radio 流客户端 : use Howler. js、 native 音频、其他库？
我一直在为实时流和静态文件(HTTP 上的 MP3)构建网络广播播放器。我选了Howler.js作为规范化 quirks 的后端的 HTML5 Audio (思考:自动播放、淡入/淡出、进度事件)。
vue实现移动端input上传视频、音频
vue移动端input上传视频、音频，供大家参考，具体内容如下 html部分 ?
PHP转换图像+音频=视频
关闭。这个问题需要更多 focused .它目前不接受答案。想改进这个问题？更新问题，使其仅关注一个问题 editing this post . 7年前关闭。 Improve this questi
iphone - 音频/视频编程
我想在我的程序中访问音频和视频。 MAC里面可以吗？我们的程序在 Windows 上运行，我使用 directshow 进行音频/视频编程。但我想在 MAC 中开发相同的东西。有没有像direct
iOS 音频/声音不会在后台模式处于事件状态时在后台播放
我的应用程序(使用 Flutter 制作，但这应该无关紧要)具有类似于计时器的功能，可以定期(10 秒到 3 分钟)发出滴答声。我在我的 Info.plist 中激活了背景模式 Audio、AirPl
javascript - 音频 JavaScript
我是 ionic 2 的初学者我使用了音频文件。 import { Component } from '@angular/core'; import {NavController, Alert
java - 插入声音/音频
我有一个包含ListView和图片的数据库，我想在每个语音数据中包含它们。我已经尝试过，但是有很多错误。以下是我的java和xml。数据库.java package com.example.data
php - 音频/音乐社交网站托管服务
我在zend framework 2上建立了一个音乐社交网络。您可以想象它与SoundCloud相同，用户上传歌曲，其他用户播放它们，这些是网站上的基本操作。我知道将要托管该页面的服务器将需要大量带
android - 音频-Android
我正在尝试在android应用中播放音频，但是在代码中AssetFileDescriptor asset1及其下一行存在错误。这是代码: MediaPlayer mp; @Override prote
wordpress - [音频] WordPress短代码中的网址错误
我对 WordPress Audio Shortcode有问题。我这样使用它: 但是在前面，在HTML代码中我得到了: document.createElement('audio');
matlab - 音频.wav文件的SNR和评估过滤技术的客观措施
我正在做一项关于降低噪音的滤波技术的实验。我在数据集中的样本是音频文件(.wav)，因此，我有:原始录制的音频文件，我将它们与噪声混合，因此变得混合(噪声信号)，我将这些噪声信号通过滤波算法传递，输出
audio - 音频/声音增强的神经网络
一个人会使用哪种类型的神经网络架构将声音映射到其他声音？神经网络擅长学习从序列到其他序列，因此声音增强/生成似乎是它们的一种非常流行的应用(但不幸的是，事实并非如此-我只能找到一个(相当古老的)洋红色
windows - 音频:如何设置默认麦克风的电平？
这个让我抓狂: 在专用于此声音播放/录制应用程序的 Vista+ 计算机上，我需要我的应用程序确保(默认)麦克风电平被推到最大。我该怎么做？我找到了 Core Audio lib ，找到了如何将 I
html - Chrome扩展程序和流式传输<音频>
{ "manifest_version": 2, "name": "Kitten Radio Extension", "description": "Listen while browsi
c# - 音频，FFT不起作用
class Main { WaveFileReader reader; short[] sample; Complex[] tmpComplexArray; publi
android - 音频，平衡2种来源的声音
我正在使用电话录音软件(android)，该软件可以记录2个人在电话中的通话。每个电话的输出是一个音频文件，其中包含来自 call 者和被 call 者的声音。但是，大多数情况下，运行此软件的电话发
javascript - 音频/语音比较和getUserMedia
我正在构建一个需要语音激活命令的Web应用程序。我正在使用getUserMedia作为音频输入。对于语音激活命令，该过程是用户将需要通过记录其语音来“校准”命令。例如，对于“停止”命令，用户将说出“
cordova - 在PouchDB中存储视频/音频
我正在开发一个Cordova应用程序，并将PouchDB用作数据库，当连接可用时，它将所有信息复制到CouchDB。我成功存储了简单的文本和图像。我一直在尝试存储视频和音频，但是没有运气。我存储
audio - 音频.MP3在Safari浏览器中不起作用
我正在开发web application，我必须在其中使用.MP3的地方使用播放声音，但是会发生问题。声音为play good in chrome, Firefox，但为safari its not
audio - 音频:软件中的位深度减少
如何减少音频文件的位深？是否忽略了MSB或LSB？两者混合吗？ (旁问:这叫什么？) 最佳答案 TL / DR:将音频曲线高度变量右移至较低位深度可以将音频视为幅度(Y轴)随时间(X轴)的模拟曲线。

首页

博学

6Ren·AI

商城

c# - 标准化音频，如何将 float 组转换为字节数组？

背景

辅助函数

规范化