gpt4 book ai didi

image-processing - 图像分类 - 检测图像类似于卡通

转载 作者:行者123 更新时间:2023-12-04 07:24:49 25 4
gpt4 key购买 nike

我有大量大小从 120x90 到 320x240 的 JPEG 缩略图图像,我想将它们分类为类似真实生活或类似卡通。

如何使用 ImageMagick 做到这一点的公用事业:convert , compare , identify ?或者有没有其他程序可以做到这一点?

最佳答案

我想你最好的一点是直方图和像素数之间的 radio 。卡通线图像趋向于颜色数量少于现实生活中的颜色。

您可以使用

COLORS=`convert picture.jpg  -format %c histogram:info:- | wc -l`

计算图片有多少种颜色。并使用如下命令:
WIDTH=`jpeginfo picture.jpg | sed -r "s/.* ([0-9]+) x.*/\1/"`


HEIGHT=`jpeginfo picture.jpg | sed -r 's/.*x ([0-9]+)  .*/\1/'`

提取宽度和高度。

然后使用此命令查找比率:
echo $WIDTH $HEIGHT $COLORS | awk '{ print $3/($1 * $2);}'
然后由您来定义什么比例符合卡通风格,什么不符合。
对于卡通类,该比例大多低于现实生活中的比例。

只是一个想法。

编辑:我刚刚看到你的评论,你不想知道如何只是一个退出的。所以请忽略我的回答。

编辑 2:我对其进行了一些修改以使其更易于查看。

注意 1:您应该注意到我交换了比率,因为像素数总是比颜色数大得多,因此之前的程序导致
一个较低的数字。这就是为什么你很难区分它们的原因。

NOTE2:我也从“jpeginfo”改为“identity”为 jpeginfo只能做 jpg,它不是 ImageMagick 的一部分。

~/test/CheckCartoon.sh
#!/bin/sh



IMAGE=$1
COLORS=convert $IMAGE -format %c histogram:info:- | wc -l
WIDTH=<b>identify</b> $IMAGE | sed -r "s/.* ([0-9]+)x[0-9]+ .*/\1/"
HEIGHT=<b>identify</b> $IMAGE | sed -r 's/.* [0-9]+x([0-9]+) .*/\1/'
RATIO=echo $WIDTH $HEIGHT $COLORS | awk '{ print <b>($1 * $2)/$3</b>;}'
echo $RATIO | awk '{ printf "%020.5f",$1 }'


~/test/CheckAll.sh
#!/bin/sh



cd images
FILES=ls
for FILE in $FILES; do
IsIMAGE=identify $FILE 2>&1 | grep " no decode delegate " | grep -o "no"
if [ "$IsIMAGE" = "no" ]; then continue; fi



IsIMAGE=`identify $FILE 2>&1 | grep " Improper image header " | grep -o "Improper"`
if [ "$IsIMAGE" = "Improper" ]; then continue; fi

echo `.././CheckCartoon.sh $FILE` $FILE

完毕

光盘..

现在为了测试你在这里复制文件。

图1:~/test/images/Cartoon-01.jpg

图2:~/test/images/Cartoon-02.png

图3:~/test/images/Cartoon-03.gif

图4:~/test/images/Real-01.jpg

图5:~/test/images/Real-02.jpg

图6:~/test/images/Real-03.jpg

http://dl.getdropbox.com/u/1961549/StackOverflow/SO1518347/Images.png

然后我运行 ./CheckAll.sh | sort (在 test 文件夹中)。这是我想要的。
00000000000003.31362 Real-03.jpg
00000000000004.61574 Real-02.jpg
00000000000009.89920 Cartoon-01.jpg
00000000000013.05870 Real-01.jpg
00000000000020.55470 Cartoon-03.gif
00000000000032.21900 Cartoon-02.png

如您所见,结果通常很好。您可以使用像 15 这样的数字作为分隔符。
Cartoon-01.jpg是一幅画,但它看起来很逼真,所以很容易混淆。还有 Real-01.jpg是我女 friend 站在大海前的照片,所以颜色的数量比平时少。这并不奇怪为什么会发生困惑。

我在这里向你展示的仍然是一个原始理论。如果你真的想要一个决定性的指示,你可能需要找到指标的数量并进行比较。例如,局部对比度的程度。

希望这会有所帮助。

关于image-processing - 图像分类 - 检测图像类似于卡通,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1518305/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com