gpt4 book ai didi

c++ - Opus encode & decode 没有错误但不是相同的值

转载 作者:行者123 更新时间:2023-11-28 04:09:06 26 4
gpt4 key购买 nike

我必须使用 Opus Codec 在 C++ 中编码和解码音频数据,并且我必须封装函数。所以我尝试发送一个 float 数组来尝试对其进行编码,然后对 Opus 编码函数的结果进行解码。不幸的是,结果不一样,我得到的表不包含初始表中的任何值。

这是我的代码。

封装:

std::vector<float> codec::OpusPlugin::decode(packet_t &packet) {
std::vector<float> out(BUFFER_SIZE * NB_CHANNELS);
int ret = 0;

if (!this->decoder)
throw Exception("Can't decode since there is no decoder.");
ret = opus_decode_float(this->decoder, packet.data.data(), packet.size, reinterpret_cast<float*>(out.data()), FRAME_SIZE, 0);
if (ret < 0)
throw Exception("Error while decoding compressed data.");
return out;
}

// ENCODER

packet_t codec::OpusPlugin::encode(std::vector<float> to_encode) {
std::vector<unsigned char> data(BUFFER_SIZE * NB_CHANNELS * 2);
packet_t packet;
int ret = 0;

if (!this->encoder)
throw Exception("Can't encode since there is no decoder.");
ret = opus_encode_float(this->encoder, reinterpret_cast<float const*>(to_encode.data()), FRAME_SIZE, data.data(), data.size());
if (ret < 0)
throw Exception("Error while encoding data.");
packet.size = ret;
packet.data = data;
return packet;
}

还有函数的调用:

 packet_t packet;
std::vector<float> floats = {0.23, 0, -0.312, 0.401230, 0.1234, -0.1543};
packet = CodecPlugin->encode(floats);
std::cout << "packet size: " << packet.size << std::endl;
std::vector<float> output = CodecPlugin->decode(packet);
for (int i = 0; i < 10; i++) {
std::cout << output.data()[i] << " ";
}

这里是packet_t结构体,里面存放了encode的返回值和unsigned char数组(编码后的值)

typedef struct packet_s {
int size;
std::vector<unsigned char> data;
} packet_t;

程序的输出是*-1.44487E-15 9.3872E-16 -1.42993E-14 7.31834E-15 -5.09662E-14 1.53629E-14 -8.36825E-14 3.9531E-14 3.9531E-14 -8.72754E-14-8.72754E-14 1.04 1.079991E-13我在开头初始化的数组。

我看了很多次文档和代码示例,但我不知道我在哪里做错了。我希望你能帮助我。

谢谢:)

最佳答案

我们看不到您如何初始化编码器和解码器,因此我们不知道它们的采样率、复杂度或 channel 数。无论您如何初始化它们,您仍然会遇到以下问题:

First Opus 编码不支持任意帧大小,而是支持 2.5ms、5ms、10ms、20、40ms 或 60ms RFC 6716 - Definition of the Opus Audio Codec相关章节 2.1.4。此外,opus 仅支持 8kHz、12kHz、16kHz、24kHz 或 48kHz 采样率。无论您选择了哪一个,您的 10 元素数组都不符合任何受支持的帧大小。

其次,Opus 编解码器是一种有损音频编解码器。这意味着在对任何信号进行编码后,您将永远(可能除了某些边缘情况)无法在解码编码的 opus 帧后重建原始信号。测试编码器和解码器是否工作的最佳方法是使用真实的音频样本。 Opus 编码保留了音频文件的感知质量。因此,如果您尝试使用任意数据对其进行测试,即使您正确实现了编码和解码功能,也可能无法返回预期结果。

您可以轻松地做一个 2000Hz 的正弦函数(互联网上有多个示例)20ms。如果您想使用 8kHz,这意味着 160 个阵列元素以 8000Hz 的采样率。 2kHz 的正弦波在人类听觉范围内,因此编码器将保留它。然后将其解码回来,看看输入和输出数组的元素是否相似,因为我们已经确定它们不太可能相同。

我不擅长 C++,所以我无法通过代码示例帮助您,但无论使用何种语言,上述问题都是正确的。

关于c++ - Opus encode & decode 没有错误但不是相同的值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58204592/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com