c++ - 如何使用 Win32 消除 C++ 中原始音频信号中的随机不连续性？-6ren

c++ - 如何使用 Win32 消除 C++ 中原始音频信号中的随机不连续性？

转载作者：行者123 更新时间：2023-12-03 00:11:57

我想使用 Win32 在 C++ 中以小时间间隔将原始音频数据连续无缝地馈送到循环缓冲区中。 header.lpData WAVEHDR 的缓冲区包含原始音频数据并通过调用 waveInAddBuffer(wi, &header, sizeof(WAVEHDR));这个缓冲区会在很短的时间间隔内循环覆盖。下图显示了问题:
虽然缓冲区以小块重复被覆盖(从左到右，当前偏移由洋红色线显示，并且在洋红色线处具有不连续性的波中可见)，随机位置的波中存在额外的不连续性(黄色闪电) .几年前我用 Java 写过同样的东西，它可以完美地工作，音频输入没有中断。
是我做错了什么还是 Win32 音频库中的错误？

这是我的 C++ 代码的相关部分:

#define VC_EXTRALEAN
#pragma comment(lib,"winmm.lib")
#include <Windows.h>

const int sample_rate = 4*4096; // must be supported by microphone
const int sample_size = 4096; // must be a power of 2

const int buffer_size = 2*sample_size;
char* buffer = new char[buffer_size];
float* wave = new float[sample_size];
int offset = 0;

void convert(float* const wave, const char* const buffer, int offset) {
    const float scale = 4.0f/65536.0f;
    for(int i=0; i<sample_size; i++) {
        const uint p = (offset-1+sample_size-i)%(buffer_size/2);
        wave[i] = scale*(float)((buffer[2*p+1]<<8)|(buffer[2*p]&0xFF));
    }
}

int main() {
    for(uint i=0; i<buffer_size; i++) buffer[i] = 0;
    for(uint i=0; i<sample_size; i++) wave[i] = 0.0f;

    WAVEFORMATEX wfx = {};
    wfx.wFormatTag = WAVE_FORMAT_PCM;    // PCM is standard
    wfx.nChannels = 1;                   // 1 channel (mono)
    wfx.nSamplesPerSec = sample_rate;    // sample_rate
    wfx.wBitsPerSample = 16;             // 16 bit samples
    wfx.nBlockAlign = wfx.wBitsPerSample*wfx.nChannels/8;
    wfx.nAvgBytesPerSec = wfx.nBlockAlign*wfx.nSamplesPerSec*wfx.nChannels;
    wfx.cbSize = 0;
    HWAVEIN wi;                          // open recording device
    WAVEHDR header = {};                 // initialize header empty
    header.dwFlags = 0;                  // clear the 'done' flag
    header.dwBytesRecorded = 0;          // tell it no bytes have been recorded
    header.lpData = buffer;              // give it a pointer to our buffer
    header.dwBufferLength = buffer_size; // tell it the size of that buffer in bytes
    waveInOpen(&wi, WAVE_MAPPER, &wfx, NULL, NULL, CALLBACK_NULL|WAVE_FORMAT_DIRECT);
    waveInStart(wi); // start recording
    waveInPrepareHeader(wi, &header, sizeof(WAVEHDR)); // prepare header

    while(true) {
        waveInAddBuffer(wi, &header, sizeof(WAVEHDR)); // read in new audio data into buffer
        offset = header.dwBytesRecorded; // get offset of to which point the buffer is overwritten
    
        convert(wave, buffer, offset);
        // plot wave and offset

        sleep(1.0/120.0); // time in seconds
    }
    waveInUnprepareHeader(wi, &header, sizeof(WAVEHDR));
    waveInStop(wi); // once the user hits escape, stop recording, and clean up
    waveInClose(wi);
}

编辑:我尝试了@Adrian McCarthy 的解决方案，但它不像评论中指出的那样工作。修改后的代码是:

#define VC_EXTRALEAN
#pragma comment(lib,"winmm.lib")
#include <Windows.h>

const int sample_rate = 4*4096; // must be supported by microphone
const int sample_size = 4096; // must be a power of 2

const uint buffer_size = 2*sample_size/8; // make buffers 1/8 the size of the total wave buffer
char* buffer1 = new char[buffer_size];
char* buffer2 = new char[buffer_size];
float* wave = new float[sample_size];
int offset = 0;

void convert(float* const wave, const char* const buffer, int offset) {
    const float scale = 4.0f/65536.0f;
    for(int i=sample_size-1; i>=offset/2; i--) {
        wave[i] = wave[i-offset/2];
    }
    for(int i=0; i<offset/2; i++) {
        const uint p = offset/2-1-i;
        wave[i] = scale*(float)((buffer[2*p+1]<<8)|(buffer[2*p]&0xFF));
    }
}

int main() {
    for(uint i=0; i<buffer_size; i++) buffer1[i] = 0;
    for(uint i=0; i<buffer_size; i++) buffer2[i] = 0;
    for(uint i=0; i<sample_size; i++) wave[i] = 0.0f;

    WAVEFORMATEX wfx = {};
    wfx.wFormatTag = WAVE_FORMAT_PCM;    // PCM is standard
    wfx.nChannels = 1;                   // 1 channel (mono)
    wfx.nSamplesPerSec = sample_rate;    // sample_rate
    wfx.wBitsPerSample = 16;             // 16 bit samples
    wfx.nBlockAlign = wfx.wBitsPerSample*wfx.nChannels/8;
    wfx.nAvgBytesPerSec = wfx.nBlockAlign*wfx.nSamplesPerSec*wfx.nChannels;
    wfx.cbSize = 0;
    HWAVEIN wi;                             // open recording device
    WAVEHDR* pCurrent = new WAVEHDR();      // initialize header empty
    pCurrent->dwFlags = 0;                  // clear the 'done' flag
    pCurrent->dwBytesRecorded = 0;          // tell it no bytes have been recorded
    pCurrent->lpData = buffer1;             // give it a pointer to our buffer
    pCurrent->dwBufferLength = buffer_size; // tell it the size of that buffer in bytes
    WAVEHDR* pNext = new WAVEHDR();         // initialize header empty
    pNext->dwFlags = 0;                     // clear the 'done' flag
    pNext->dwBytesRecorded = 0;             // tell it no bytes have been recorded
    pNext->lpData = buffer2;                // give it a pointer to our buffer
    pNext->dwBufferLength = buffer_size;    // tell it the size of that buffer in bytes
    waveInOpen(&wi, WAVE_MAPPER, &wfx, NULL, NULL, CALLBACK_NULL|WAVE_FORMAT_DIRECT);
    waveInStart(wi); // start recording
    waveInPrepareHeader(wi, pCurrent, sizeof(WAVEHDR)); // prepare header
    waveInPrepareHeader(wi, pNext   , sizeof(WAVEHDR)); // prepare header

    while(true) {
        do {
            waveInAddBuffer(wi, pCurrent, sizeof(WAVEHDR));
            sleep(0.001);
        } while((pCurrent->dwFlags&WHDR_DONE)==0);
        pCurrent->dwFlags &= ~WHDR_DONE;
        swap(pCurrent, pNext);

        offset = pCurrent->dwBytesRecorded; // get offset of to which point the buffer is overwritten
    
        convert(wave, buffer1, offset);
        // plot wave and offset

        sleep(1.0/120.0); // time in seconds
    }
    waveInUnprepareHeader(wi, pCurrent, sizeof(WAVEHDR));
    waveInUnprepareHeader(wi, pNext   , sizeof(WAVEHDR));
    waveInStop(wi); // once the user hits escape, stop recording, and clean up
    waveInClose(wi);
}

结果:

最佳答案

问题:

您的线程正在与填充缓冲区并更新 header 中的字段的系统线程竞争。当您阅读 dwBytesRecorded字段，您可以获得小于缓冲区中实际字节数的值。填充缓冲区的线程偶尔会更新dwBytesRecorded ，但随着录制的继续，该数字将在一瞬间过时。这是乐观地假设在另一个线程可能正在写入的同时读取 DWORD 是安全的。

当您再次添加缓冲区时，音频系统认为这是一个新的缓冲区，一旦当前缓冲区已满，就会切换到该缓冲区。您正在传递相同的缓冲区，希望它会从头开始填充它。
但它也可能在头文件中使用 Reserved 字段并创建不一致的状态。

我不确定是哪个 sleep您正在使用的功能，但它们中的大多数不能/不等待精确的时间。 Win32 Sleep将至少等待指定的毫秒数，然后将线程标记为准备运行，但直到调度程序处理它才真正运行。实际上，这可能不是问题，因为您的缓冲区是 500 毫秒，这比 sleep 的不确定性大一个数量级。

实现这一点的典型方法是在两个(或更多)缓冲区之间进行 ping-pong。您添加两个非常短的缓冲区，并等待第一个获得 WHDR_DONE header 中设置的标志[见注]。然后在系统继续记录到第二个缓冲区的同时一次处理整个第一个缓冲区。处理完一个缓冲区后，重新添加它，然后等待另一个缓冲区准备好。

// Given two buffers `ping` and `pong` with corresponding WAVEHDRs
// `ping_header` and `pong_header`...
WAVEHDR *pCurrent = ping_header;
WAVEHDR *pNext = pong_header;
waveInAddBuffer(wi, pCurrent, sizeof(WAVEHDR));
waveInAddBuffer(wi, pNext, sizeof(WAVEHDR));

for (;;) {
  // wait for the current buffer to fill
  while ((pCurrent->dwFlags & WHDR_DONE) == 0) {}  // SEE NOTE

  // As recording continues with *pNext, process and draw
  // the data from pCurrent->lpData.

  // Now that we're done processing pCurrent, we can re-add it so
  // the system has a place to record when pNext is full.
  waveInAddBuffer(wi, pCurrent, sizeof(WAVEHDR));
  // What was next becomes current, and the new next is the old current.
  swap(pCurrent, pNext);
}

请注意，您的两个缓冲区可能非常短。我推荐 16-20 毫秒:大于 Windows 上默认的 15.6 毫秒计时器，但仍然在您尝试在每次循环迭代中处理多少数据的范围内。
这里繁忙的等待循环不是很好——它可以在不做有用工作的情况下将核心驱动到 100%。但是如果处理时间接近于记录下一个缓冲区所花费的时间，那么它就不会旋转太多。 (从技术上讲，当另一个线程可能正在更新它时，您仍然会遇到读取变量的相同数据争用问题，但我们只是在等待该位变高，因此在实践中可能没问题。)
Wave 音频 API 不是为超高速处理而设计的。它们适用于 Windows 程序。您应该处理 MM_WIM_DATA，而不是忙于等待标志。消息在窗口的窗口过程中，这将避免繁忙的等待和数据竞争，但会在每个缓冲区完成时增加一些消息传递开销。
2020-07-19
备注 :@ProjectPhysX 指出 WHDR_DONE 的繁忙等待循环在我的代码大纲中不起作用。编译器可以自由地假设该值永远不会改变，并且可能会优化代码以测试标志一次，然后永远旋转。这是允许的，因为我们的等待线程和设置标志的线程之间的数据竞争意味着代码具有“未定义的行为”。如果我们控制两个线程，我们可以使用任何类型的同步方案来消除数据竞争，这将起作用。但是我们无权访问音频系统中运行的线程。
波形音频 API 旨在通过向客户端发送窗口消息来通知客户端缓冲区完成时。这对于连续记录来说效果很好，但这意味着采用事件驱动的方法，并且消息传递的开销可能会限制程序处理样本的速度。 XAudio2 或 Windows Core Audio 中的任何一个都更适合高速音频工作。使用一对(或链)小缓冲区的想法非常普遍，类似于使用后台缓冲区或交换链的图形程序。

关于c++ - 如何使用 Win32 消除 C++ 中原始音频信号中的随机不连续性？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/62968248/

文章推荐： javascript - 使用 Jest+Enzyme API 模拟调用进行测试未运行

文章推荐： powershell - 计算Active Directory用户

winforms - 为什么我不能在基于 win 的项目应用程序中将现有的 win 表单设置为启动对象？
在项目属性窗口的应用程序选项卡和启动对象组合框中，我无法看到我的 win 表单以将其中一个设置为启动对象。它出什么问题了？最佳答案开通 Program.cs启动项目的文件(在解决方案中选择为启动
python - 数字游戏 : Can't Win: Won't print: You Win, 但结束脚本
我的问题是，当我得到正确的数字时，python 脚本结束，但不打印:你赢了! import random number = random.randint(1,100) # This part work
Java Win WX 和 Win Vista
我使用 Eclipse 开发了一个 Java 应用程序。我使用的电脑操作系统是Win Vista。我在 Win XP 计算机上使用此应用程序时遇到问题。我发现的问题是: 如果在我的代码中我使用以下几行
javascript - 如何让结果打印 "computer wins"或 "user wins"
显然，这将打印出石头/剪刀/布获胜或平局。实现“石头胜剪刀——计算机胜!”这样的结果的最佳方式是什么？等等？ var userChoice = prompt("Do you choose rock,
.net - .NET应用程序无法发送客户端证书-Win 7 vs Win XP？
我正在开发一个使用HttpWebRequest将请求发送到另一台服务器的ASP.NET Web应用程序。它通过HTTPS发送请求，并且远程服务器需要客户端证书。该请求在.NET应用程序中失败，显然无法
winapi - 使用 win API 从 Win XP 操作系统检索键盘布局的语言名称
我正在 WIn XP 上使用 VC6 开发应用程序。使用 GetKeyBoardLayoutList() 和 GetLocalInfo() API 从系统检索默认输入语言列表。代码如下。 `UINT
c# - 最大化的无边框应用程序隐藏在 Win 7 和 Win 8 中的任务栏后面
我在 WPF 中创建了一个无边框窗口。我已经编写了一个事件来最大化窗口，但是在最大化时，部分窗口有时会隐藏在任务栏后面，片刻之后会出现在任务栏顶部。如何确保窗口每次都保持在任务栏的顶部？以下是我实现
C# 代码。适用于 win xp 不适用于 win 7
我开始制作 3d 游戏。然后我停了一段时间并安装了win7。现在我想继续研究它只是为了发现代码卡住了!在 XP 上，我将 View 渲染到窗体上。并且游戏循环和所有游戏形式都在同一个线程上运行! 这在
C++ 代码在 Win 2000 中崩溃但在 Win xp 中不崩溃
main() { int *p; free(p); } 此代码在 Win 2K 中崩溃。但不知何故不会在 Win Xp 中崩溃!知道为什么吗？编辑:是的。这是一个错误，不应该被写入。更多
c++ - GetModuleFileName 在 Win 7/Win 10 上的不同行为
我在我的应用程序中使用 libeay32.dll/ssleay32.dll 库来支持 https。库在 Windows 7 上成功加载(不是通过我的应用程序，通过 Qt 库)，但是我在 Windows
Delphi TNetHTTPRequest/TNetHTTPClient 适用于 Win 10，但不适用于 Win 7
在源代码下方添加了新的详细信息。有一个问题是 Delphi，其中 Internet 代码可在 Win 10 上运行，但不能在 Win 7 上运行。我正在尝试将一个小项目连接到 haveibeenpw
perfmon - 无法将数据收集器模板导入 Win 2008 中的 Perfmon，但适用于 Win 7
我在 Win 7 上为 Perfmon 创建了 xml 模板。我能够导入它并运行它 - 一切正常。现在，当我将此 xml 复制到 Win 2008 R2 计算机并尝试将其导入到 perfmon 中时，
winforms - Winform App 不同的 Win 7 与 Win 8
我在使用标准数据驱动的 Winform 应用程序时遇到了一个有趣的问题。该应用程序最初是在 Windows 7 和 Visual Studio 2010 上开发的。然后我用 Windows 8 和
c# - 程序在 Win 7 上运行，但在 Win 8 上运行不了
我有一个在 Windows 7(64 位)上编写的程序，可以在我的计算机上正确编译和运行。但在其他计算机上(特别是在 Windows 8(64 位)上)该程序无法运行。当我尝试运行它时，它说我的程序
c# - 将现有的基于 Vb6.0 win 的应用程序转换为基于 c# win 的应用程序的最快方法是什么？
将现有的基于 Vb6.0 win 的应用程序转换为基于 c# win 的应用程序的最快方法是什么？最佳答案核心语言如此不同，我不得不说从头开始，只复制复杂的代码位。如果您从头开始，您将不必处理所有
css - Win 8, Win 8.1 + IE 11 固定定位错误
我正在处理 IE 11 在 Windows 8 和 Windows 8.1 上的奇怪行为。我正在固定定位元素内的元素位置。而且它变得很奇怪。当我用开发工具检查它时它在正确的位置，但在视觉上它完全在不同
java - Win x64 IDE 和 Java 上的 Win x32 项目
将使用 Java x32 在 eclipse x32 上创建的项目导入到使用 java x64 的 eclipse x64 上有哪些挑战？最佳答案 Java 是跨平台的，所以你应该不会有任何问题。
python - 有人可以解释这个说法吗？ lpadded = win//2 * [-1] + l + win//2 * [-1]
鉴于 l 是一个整数列表并且 win 是一个整数，下面的代码生成一个列表 lpadded: lpadded = win // 2 * [-1] + l + win // 2 * [-1] 在 lpad
c# - 如何以编程方式更改 Win 8.1 或 Win 10 UWP 应用程序的背景主题？
我有一个适用于 Windows Phone 8.1 的应用程序及其 UWP 版本。我想在 Windows 中更改应用程序的背景时动态更改它。用例是: 启动应用，背景主题为深色。按下手机上的主页按钮
c - 在 Win 10 而非 Win 7 中卸载 DLL 时调试崩溃
不完全确定我是否已经解决了这个问题，但这是我所看到的以及我认为正在发生的事情。我有一个主要用 C 编写的 Win32 程序，它加载一个 C++ DLL。该 DLL 通过 COM 对象将数据从 C 程

行者123

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

c++ - 如何使用 Win32 消除 C++ 中原始音频信号中的随机不连续性？