- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
这是一个巧妙的问题,而不是“告诉我什么代码有效”,而是“我如何从逻辑上处理这种情况”的问题。
简而言之,我有通过 RTSP 从 IP 摄像机传来的视频和音频。
视频和音频通过单独的线程逐帧解码和记录到单个 mp4 容器中(如下所示)。
问题是视频和音频随着时间的推移变得越来越不同步,这是由于每个视频帧的 TimeSpan 结束时间和开始时间不够精确。
每个视频帧的持续时间应该是 1/framerate = 0.0333667000333667,但它使用(即使使用 FromTicks() 方法),第一帧的开始时间 = 0.0 和结束时间 0.0333667。
我可以从 29.97 开始调整视频解码器的帧率值(它从相机的设置声明的帧率中提取该值),导致视频先于音频,或滞后于音频——这只是让每个视频成为 mediaBuffer。与音频相比,StartTime 和 mediaBuffer.EndTime 要么太早要么太晚。
随着时间的推移,微小的小数截断最终会导致视频和音频不同步——录制的时间越长,两个音轨就越不同步。
我真的不明白为什么会这样,因为舍入误差在逻辑上不应该重要。
即使我只有 1 秒的精度,我也只会每秒写入一个视频帧,它在时间轴中的位置将大致在它应该在 +- 1 秒的位置,这应该使每个渐进帧同样的 +- 1 秒到它应该在的地方,而不是逐渐增加更多的错位。我在想象每一帧看起来像这样:
[<-------- -1 秒 --------> 预期的确切帧时间 <-------- +1s -------->]---------------------------------------------- -- 记录帧时间 ----------
我是不是漏掉了什么?
我不是在做“新帧开始时间 = 最后一帧结束时间,新帧结束时间 = 新帧开始时间 + 1/帧率”——我实际上是在做“新帧开始时间 = 帧索引 - 1”/framerate,新帧结束时间=帧索引/framerate”。
也就是说,我正在根据它们应该具有的预期时间(帧时间 = 帧位置/帧速率)计算帧开始和结束时间。
我的代码是这样的:
time expected ---------- 预计时间 ---------- 预计时间帧时间帧时间帧时间
我从数学上理解这个问题,我只是不明白为什么小数截断证明了这样一个问题,或者从逻辑上知道解决它的最佳解决方案是什么。
如果我实现“每 x 帧,使用”(1/帧率) + 一些数量“来弥补所有丢失的时间,是否有可能让帧匹配它们应该在的位置,或者只是结果在凌乱的视频中?
public void AudioDecoderThreadProc()
{
TimeSpan current = TimeSpan.FromSeconds(0.0);
while (IsRunning)
{
RTPFrame nextFrame = jitter.FindCompleteFrame();
if (nextFrame == null)
{
System.Threading.Thread.Sleep(20);
continue;
}
while (nextFrame.PacketCount > 0 && IsRunning)
{
RTPPacket p = nextFrame.GetNextPacket();
if (sub.ti.MediaCapability.Codec == Codec.G711A || sub.ti.MediaCapability.Codec == Codec.G711U)
{
MediaBuffer<byte> mediaBuffer = new MediaBuffer<byte>(p.DataPointer, 0, (int)p.DataSize);
mediaBuffer.StartTime = current;
mediaBuffer.EndTime = current.Add(TimeSpan.FromSeconds((p.DataSize) / (double)audioDecoder.SampleRate));
current = mediaBuffer.EndTime;
if (SaveToFile == true)
{
WriteMp4Data(mediaBuffer);
}
}
}
}
}
public void VideoDecoderThreadProc()
{
byte[] totalFrame = null;
TimeSpan current = TimeSpan.FromSeconds(0.0);
TimeSpan videoFrame = TimeSpan.FromTicks(3336670);
long frameIndex = 1;
while (IsRunning)
{
if (completedFrames.Count > 50)
{
System.Threading.Thread.Sleep(20);
continue;
}
RTPFrame nextFrame = jitter.FindCompleteFrame();
if (nextFrame == null)
{
System.Threading.Thread.Sleep(20);
continue;
}
if (nextFrame.HasSequenceGaps == true)
{
continue;
}
totalFrame = new byte[nextFrame.TotalPayloadSize * 2];
int offset = 0;
while (nextFrame.PacketCount > 0)
{
byte[] fragFrame = nextFrame.GetAssembledFrame();
if (fragFrame != null)
{
fragFrame.CopyTo(totalFrame, offset);
offset += fragFrame.Length;
}
}
MediaBuffer<byte> mediaBuffer = new MediaBuffer<byte>(
totalFrame,
0,
offset,
TimeSpan.FromTicks(Convert.ToInt64((frameIndex - 1) / mp4TrackInfo.Video.Framerate * 10000000)),
TimeSpan.FromTicks(Convert.ToInt64(frameIndex / mp4TrackInfo.Video.Framerate * 10000000)));
if (SaveToFile == true)
{
WriteMp4Data(mediaBuffer);
}
lock (completedFrames)
{
completedFrames.Add(mediaBuffer);
}
frameIndex++;
}
}
最佳答案
您应该注意以下几点:
不正确的手动帧时间戳。手动计算帧持续时间而不是让驱动程序/卡/任何给你帧时间的东西通常是个坏主意。由于可变比特率、内部计算机时序等原因,您自己标记帧几乎总是会导致漂移。
精度漂移。在处理以毫秒为单位的帧时间戳时,我遇到了漂移,但我的源时间戳以纳秒为单位。这需要我投一个双倍的长。
例如,我从 directshow 获得的媒体时间以纳秒为单位,但我的内部计算需要以毫秒为单位。这意味着我需要在 ns 和 ms 之间进行转换。对我来说,这就是精度损失所在。我对此的解决方案是您需要跟踪任何精度损失。
我过去所做的是我有一个正在运行的“timingFraction”计数器。基本上每当我做除法时,它都会给我一个帧的基本时间戳(所以帧时间/NS_PS_MS)。但是,我还将预制时间戳的丢弃小数部分添加到计时分数计数器(在 c++ 中我使用了 modf
函数)。现在,如果时间分数是整数,我将时间戳(它是一个整数,因为它被转换为长)和剩余的时间分数相加。基本上,如果您积累了额外的毫秒数,请确保将其添加到框架中。通过这种方式,您可以补偿任何精度漂移。
Accordion 效应。虽然随着时间的推移,所有事情都可能加起来是正确的,并且您认为即使在 1 秒的粒度上事情也应该匹配,但它们不会。音频需要完美匹配,否则听起来会很奇怪。这通常表现为您在正确的时间听到某人发出正确的音频,但嘴唇没有对齐。随着时间的推移,一切都很好,但没有什么是完全一致的。这是因为您没有在正确的时间渲染帧。有些帧有点太长,有些帧有点太短,所有的一切加起来都是正确的位置,但没有一个是正确的长度。
现在,如果您的精度已经达到 100 纳秒级别,为什么您会遇到这个问题,这在我看来可能是第 1 项。在继续之前,我会验证您确定您正在计算正确的结束时间戳。
我有时也会运行测试,在其中总结帧之间的增量并确保添加正确。流式传输期间每个帧之间的时间总和应等于流式传输的时间。 IE。第 1 帧长 33 毫秒,第 2 帧长 34 毫秒,您录制了 67 毫秒。如果你录制了 70 毫秒,你就会在某处丢失一些东西。漂移通常会在几个小时后出现,并且在将音频和视频匹配在一起时更容易通过耳朵/眼睛检测到。
此外,为了反驳汉斯的评论,音频工程界对此有很多话要说。 10 毫秒足以听到延迟,尤其是与视频反馈配对时。您可能看不到 10 毫秒的延迟,但您绝对可以听到。来自 http://helpx.adobe.com/audition/kb/troubleshoot-recording-playback-monitoring-audition.html
General guidelines that apply to latency times
Less than 10 ms - allows real-time monitoring of incoming tracks including effects.
At 10 ms - latency can be detected but can still sound natural and is usable for monitoring.
11-20 ms - monitoring starts to become unusable, smearing of the actual sound source, >and the monitored output is apparent.
20-30 ms - delayed sound starts to sound like an actual delay rather than a component of >the original signal.
我在这里有点咆哮,但有很多事情在起作用。
关于c# - 逐帧录制视频时,如何处理C#.NET TimeSpan Progressive Rounding Error?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14442461/
这对我来说似乎很简单,但我找不到合适的属性。出于错误报告的目的,我想知道我所在的内部过程的名称。 这是最简单的示例: 运行测试。 程序测试。 /* 如何在此处显示过程名称“test”? */ 结束程序
虽然这不是我的主要职责,但我从事 Progress 4GL 已经 8 年了。我更多地使用 C++ 和 Java。当用其他语言编程时,建议声明接近用法。然而,对于 4GL,我看到人们将声明放在文件的顶部
我注意到 Progress 4gl 中的 IF 语句有一个非常奇怪的行为。 我定义了一个格式为“999”的整数,它告诉它有 3 位数字,然后我分配一个小于 100 的值(例如 12),然后当我显示它时
我有下面的代码片段(如之前的 Stack Overflow 回答... Deleting all special characters from a string in progress 4GL 中所
如何将数字和字符串添加到 Progress4GL 上的字符变量中 如下所示(这只是一个展示想法的例子)。 a = 'Code' b = 1 c = a+b 所以c的值为“Code1” 我怎样才能在pr
我有一个缓冲区,其中混合了数据、数字和字符字段。我正在显示字段的值,但由于某种原因,日期字段返回“?”当我尝试将它们添加到字符串时。 我还明白吗?即使我这样做 ASSIGN lvString = lv
有没有办法用特定字符格式化正在进行的字符串? 一个示例显示了前 6 个数字为 x 的 SSN。我已尝试使用 String 函数,但它不支持以格式发送的字母 x。 SSNString = '333224
我正在寻找好的文献来学习 Progress 4GL。这是一个与工作空间相关的项目,无法获得培训资金。我试过文档,但它不准确且相当困惑。 我将不得不在 OE 10.1B 上的 ChUI 中完成大部分工作
我如何计算总数?表中的记录?我想显示数据库中的所有表名以及编号。每个表中的记录数 最佳答案 最快的方法是: proutil dbname -C tabanalys > dbname.tab 这是一个分
我正在创建某种音频播放器,但遇到了障碍。我添加了一个进度条,它会根据正在播放的歌曲进行更新。 但是,我希望进度条可以点击并在点击时跳转到轨道的时间(就像每个普通玩家一样)。
在我的进度应用程序中使用浏览器时,滚动条永远不会正常工作。它会显示我只能向下滚动一点,然后继续前进。这是一个正在进行的错误还是我可以做些什么来解决这个问题? /* Connected Database
我们如何更改 Progress 中的默认锁而不是共享锁? 最佳答案 您可以通过使用 [NO|EXCLUSIVE|SHARE]-LOCK 修饰符将锁定状态添加到查询来在每个单独的查询(FIND、FOR
我正在使用 Material-UI的 默认情况下转换 scaleX() 的组件 的属性在另一个里面 每当值更改以可视化当前进度时。它具有缓动效果,使一切看起来都很流畅,这通常非常好,但是出于我的应用程
我很好奇 PWA 添加到主屏幕后将在后台使用什么浏览器。它是您最初选择“添加到主屏幕”的那个吗?如果是,如果我在我的 Chrome 上将 PWA 添加到主屏幕怎么办手机,然后删除 Chrome(假设现
在我问任何问题之前,让我告诉你我对 Progress Openedge 没有任何经验,但我的公司运行一个用它制作的应用程序,现在我必须通过它进行一些 SOAP 调用。所以我想,为什么不调用用我认为合适
在我提出任何问题之前,让我告诉你我对 Progress Openedge 没有任何经验,但我的公司运行一个用它制作的应用程序,现在我必须通过它进行一些 SOAP 调用。所以我想,为什么不调用用我认为合
进度处理程序已在一些领先的 promise 库(Q、When、Bluebird)中弃用,并且也已从新的 Promises/A+ spec 中删除。虽然我理解取消进度事件背后的原因,但我在重构以下我
如何改变的颜色 progress[value]::-webkit-progress-value { background-color: #00bdf8;
我有一个需要连接的进度数据库。它们与 SQL Server Management Studio 的等价物是什么? 服务器似乎是 Progress OpenEdge 10.1 最佳答案 这在一定程度上取
我在不了解 PWA 的内在含义的情况下开始构建 PWA。当我搜索时,PWA 使用以下技术逐步为 Web 应用程序提供了类似于外观的原生应用程序 舱单 服务人员 设计App shell Web 应用程序
我是一名优秀的程序员,十分优秀!