gpt4 book ai didi

image-processing - 绘图机器人的算法-有什么提示吗?

转载 作者:行者123 更新时间:2023-12-04 04:08:49 24 4
gpt4 key购买 nike

绘画机器人的算法-

你好

我想写一个软件来分析图像,然后生成图像,该图像使用最少的颜色和不透明度变化的贝塞尔曲线路径对象来捕获人眼在原始图像中的感知。

与最近的Twitter超压缩竞赛(see: stackoverflow.com/questions/891643/twitter-image-encoding-challenge)不同,我的目标不是创建一个忠实于图像的副本,而是复制观看图像的人类体验。

例如,如果原始图像的左上角显示一个红色气球,并且复制品的外观类似于左上角的红色气球,那么即使复制品中的气球是位置不完全相同,尺寸或颜色也不完全相同。

当我说“被人类感知”时,我的意思是非常有限的。我并不是试图分析图像的含义,我不需要知道图像的含义,我只是对人眼会注意到的关键视觉特征感兴趣,只要它可以由一个人自动完成即可。该算法无法概念化实际观察到的内容。

为什么人类对摄影准确性的感知这一不寻常的标准?

该软件将用于驱动绘图机器人,该机器人将与人类艺术家(see: video.google.com/videosearch?q=mr%20squiggle)合作。

该算法应该设法将 Canvas 上已经存在的内容合并到最终图像中,而不是将人类在摄影上无法完成的标记视为错误。

因此,相对亮度,色相,饱和度,大小和位置比在照相上与原始照片相同要重要得多。保持要素的拓扑,颜色块,渐变,凹凸曲线的准确性,对于这些要素的确切尺寸形状和颜色将更为重要

还在我这儿?

我的问题是我遭受“当您用锤子敲打时一切都看起来像钉子”综合症。在我看来,实现此目的的方法是使用一种遗传算法,该算法类似于retrievr使用的小波变换(参见:grail.cs.washington.edu/projects/query/)的比较(参见:labs.systemone.at/retrievr/)来选择适合的解决方案。

但是我认为这是答案的主要原因是,这些是我所知道的技术,使用我现在不知道的任何技术,可能会有更优雅的解决方案。

考虑到人类视觉系统分析图像的方式将特别有趣,因此也许需要特别注意直线,角度,高对比度边框和类似颜色的大块。

您对我应该在视觉,图像算法,遗传算法或类似项目上阅读的东西有什么建议吗?

谢谢



PS。上面的某些拼写可能对您和您的拼写检查都不正确。这只是国际拼写形式的变化,可能与您所在国家/地区的标准不同:例如澳大利亚标准:颜色与美国标准:颜色

最佳答案

有一个模型可以实现为一种算法,以计算图像的显着性图,从而确定图像的哪些部分最受人类关注。

该模型称为itti koch模型
您可以找到入门纸here
以及更多资源和C++源代码here

关于image-processing - 绘图机器人的算法-有什么提示吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1085351/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com