gpt4 book ai didi

video - 以编程方式在视频剪辑上添加数百个图像叠加层

转载 作者:行者123 更新时间:2023-11-28 21:41:13 24 4
gpt4 key购买 nike

我正在寻找一种程序化视频编辑解决方案,它可以提供 API,用于在视频 (1080p) 剪辑的特定坐标处的特定时间/帧中添加图像和文本叠加层,以及将大小调整为 720p 等。

我尝试了 AviSynth,但由于“内存不足错误”而在总共约 400 次叠加后被阻止 - 请参阅 AviSynth Out of Memory Error (100s of image overlays)

还有什么我可以尝试的吗(示例代码会很棒)?

最佳答案

您始终可以使用我推荐的商业解决方案,例如 Adob​​e After Effects,它具有您可以使用 JavaScript 控制的 API(jsx 文件)。

商业视频和合成解决方案通常比免费/开源替代方案更强大,并且具有更好的缓存和缓冲能力,这意味着它们可以在不耗尽内存的情况下为合成添加更多层。

(作为旁注:尽管它是面向合成的,但我在这里将您指向 After Effects 事件。Adobe Premier(或其他非线性编辑器)对于简单的图像和文本叠加来说是更自然的选择,但它确实没有脚本界面(据我所知,Adobe 网站上没有为此列出的资源)。但是,也可以使用 AE 创建长序列,并且您可以使用添加到场景中的元素做更多事情。)

如果您已经熟悉 JavaScript,那么(显然)只需阅读有关其对象、方法和属性等的 API 文档即可(我在下面添加了文档链接)。

Adobe 也有自己的 JavaScript 编辑器(但不是必需的),可以在以下位置找到:

苹果操作系统:

/Applications/Utilities/Adobe Utilities CS6/ExtendScript Toolkit CS6/

window :

C:\Program Files\Adobe\Adobe Utilities - CS6\ExtendScript Toolkit CS6

以下示例取自this site创建一个 comp,然后向其添加一个文本层(转到站点以获取完整脚本):

// create project if necessary

var proj = app.project;
if(!proj) proj = app.newProject();

// create new comp named 'my text comp'

var compW = 160; // comp width
var compH = 120; // comp height
var compL = 15; // comp length (seconds)
var compRate = 24; // comp frame rate
var compBG = [48/255,63/255,84/255] // comp background color

var myItemCollection = app.project.items;
var myComp = myItemCollection.addComp('my text',compW,compH,1,compL,compRate);

myComp.bgColor = compBG;

然后添加一个文字层:

var text;
while (!myFile.eof){
text = myFile.readln();
if (text == "") text = "\r" ;
myComp.layers.addText(text);
}

您还可以使用 JavaScript/jsx 文件控制 Photoshop/Illustrator,这样您就可以在这里制作强大的组合/效果等(这让我想起了古老的 AREXX :-))。

使用 Python 的 Flame(和 Combustion,Autodesk 购买后不再可用)等解决方案也有类似的 API,但这里的价格区间相对较高。

如果商业变体不是一个选项,那么您可以查看 Blender,它也为 Python 提供了一个 API。

但请注意,Blender 主要面向 3D,但也可用于视频合成。

取自 this page 的示例将文本写入屏幕:

def write():
"""write on screen"""
width = render.getWindowWidth()
height = render.getWindowHeight()

# OpenGL setup
bgl.glMatrixMode(bgl.GL_PROJECTION)
bgl.glLoadIdentity()
bgl.gluOrtho2D(0, width, 0, height)
bgl.glMatrixMode(bgl.GL_MODELVIEW)
bgl.glLoadIdentity()

# BLF drawing routine
font_id = logic.font_id
blf.position(font_id, (width * 0.2), (height * 0.3), 0)
blf.size(font_id, 50, 72)
blf.draw(font_id, "Hello World")

当然,您始终可以编写脚本程序,例如 FFmpeg,它本身非常强大和灵活。

您可以通过在命令行中向其添加参数来编写脚本,例如 ( taken from here ):

在视频帧的最后一行显示从右向左滑动的文本行。假定文件“LONG_LINE”包含没有换行符的单行。

drawtext="fontsize=15:fontfile=FreeSerif.ttf:text=LONG_LINE:y=h-line_h:x=-50*t"

您只需将其放入某种批处理文件中并运行即可。限制当然是您需要进行一些反复试验才能使文本和图像准确显示在您想要的位置。

我从未尝试过数百层,我怀疑它是否具有内置缓冲区/缓存来处理大量层,但值得一试,因为它既免费又功能强大。

资源:

关于video - 以编程方式在视频剪辑上添加数百个图像叠加层,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18750525/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com