gpt4 book ai didi

c# - 如何扫描两个图像的差异?

转载 作者:IT王子 更新时间:2023-10-29 04:44:38 26 4
gpt4 key购买 nike

我正在尝试扫描 2 个图像(32bppArgb 格式),识别何时存在差异并将差异 block 的边界存储在矩形列表中。

假设这些是图像: enter image description here

第二个: enter image description here

我想获得不同的矩形边界(在我们的例子中是打开的目录窗口)。

这是我所做的:

private unsafe List<Rectangle> CodeImage(Bitmap bmp, Bitmap bmp2)
{

List<Rectangle> rec = new List<Rectangle>();
bmData = bmp.LockBits(new System.Drawing.Rectangle(0, 0, 1920, 1080), System.Drawing.Imaging.ImageLockMode.ReadOnly, bmp.PixelFormat);
bmData2 = bmp2.LockBits(new System.Drawing.Rectangle(0, 0, 1920, 1080), System.Drawing.Imaging.ImageLockMode.ReadOnly, bmp2.PixelFormat);

IntPtr scan0 = bmData.Scan0;
IntPtr scan02 = bmData2.Scan0;
int stride = bmData.Stride;
int stride2 = bmData2.Stride;
int nWidth = bmp.Width;
int nHeight = bmp.Height;
int minX = int.MaxValue;;
int minY = int.MaxValue;
int maxX = 0;
bool found = false;

for (int y = 0; y < nHeight; y++)
{
byte* p = (byte*)scan0.ToPointer();
p += y * stride;
byte* p2 = (byte*)scan02.ToPointer();
p2 += y * stride2;
for (int x = 0; x < nWidth; x++)
{

if (p[0] != p2[0] || p[1] != p2[1] || p[2] != p2[2] || p[3] != p2[3]) //found differences-began to store positions.
{
found = true;
if (x < minX)
minX = x;
if (x > maxX)
maxX = x;
if (y < minY)
minY = y;

}
else
{

if (found)
{

int height = getBlockHeight(stride, scan0, maxX, minY, scan02, stride2);
found = false;
Rectangle temp = new Rectangle(minX, minY, maxX - minX, height);
rec.Add(temp);
//x += minX;
y += height;
minX = int.MaxValue;
minY = int.MaxValue;
maxX = 0;
}
}
p += 4;
p2 += 4;
}
}

return rec;
}

public unsafe int getBlockHeight(int stride, IntPtr scan, int x, int y1, IntPtr scan02, int stride2) //a function to get an existing block height.
{
int height = 0;;
for (int y = y1; y < 1080; y++) //only for example- in our case its 1080 height.
{
byte* p = (byte*)scan.ToPointer();
p += (y * stride) + (x * 4); //set the pointer to a specific potential point.
byte* p2 = (byte*)scan02.ToPointer();
p2 += (y * stride2) + (x * 4); //set the pointer to a specific potential point.
if (p[0] != p2[0] || p[1] != p2[1] || p[2] != p2[2] || p[3] != p2[3]) //still change on the height in the increasing **y** of the block.
height++;
}

return height;
}

这实际上是我调用该方法的方式:

Bitmap a = Image.FromFile(@"C:\Users\itapi\Desktop\1.png") as Bitmap;//generates a 32bppRgba bitmap;
Bitmap b = Image.FromFile(@"C:\Users\itapi\Desktop\2.png") as Bitmap;//

List<Rectangle> l1 = CodeImage(a, b);
int i = 0;
foreach (Rectangle rec in l1)
{
i++;
Bitmap tmp = b.Clone(rec, a.PixelFormat);
tmp.Save(i.ToString() + ".png");
}

但我没有得到确切的矩形。我只得到了一半,有时甚至更糟。我认为代码的逻辑有问题。

@nico 的代码

private unsafe List<Rectangle> CodeImage(Bitmap bmp, Bitmap bmp2) 
{
List<Rectangle> rec = new List<Rectangle>();
var bmData1 = bmp.LockBits(new System.Drawing.Rectangle(0, 0, bmp.Width, bmp.Height), System.Drawing.Imaging.ImageLockMode.ReadOnly, bmp.PixelFormat);

var bmData2 = bmp2.LockBits(new System.Drawing.Rectangle(0, 0, bmp.Width, bmp.Height), System.Drawing.Imaging.ImageLockMode.ReadOnly, bmp2.PixelFormat);

int bytesPerPixel = 3;

IntPtr scan01 = bmData1.Scan0;
IntPtr scan02 = bmData2.Scan0;
int stride1 = bmData1.Stride;
int stride2 = bmData2.Stride;
int nWidth = bmp.Width;
int nHeight = bmp.Height;

bool[] visited = new bool[nWidth * nHeight];

byte* base1 = (byte*)scan01.ToPointer();
byte* base2 = (byte*)scan02.ToPointer();

for (int y = 0; y < nHeight; y += 5)
{
byte* p1 = base1;
byte* p2 = base2;

for (int x = 0; x < nWidth; x += 5)
{
if (!ArePixelsEqual(p1, p2, bytesPerPixel) && !(visited[x + nWidth * y]))
{
// fill the different area
int minX = x;
int maxX = x;
int minY = y;
int maxY = y;

var pt = new Point(x, y);

Stack<Point> toBeProcessed = new Stack<Point> ();
visited[x + nWidth * y] = true;
toBeProcessed.Push(pt);

while (toBeProcessed.Count > 0)
{
var process = toBeProcessed.Pop();
var ptr1 = (byte*)scan01.ToPointer() + process.Y * stride1 + process.X * bytesPerPixel;
var ptr2 = (byte*) scan02.ToPointer() + process.Y * stride2 + process.X * bytesPerPixel;
//Check pixel equality
if (ArePixelsEqual(ptr1, ptr2, bytesPerPixel))
continue;

//This pixel is different
//Update the rectangle
if (process.X < minX) minX = process.X;
if (process.X > maxX) maxX = process.X;
if (process.Y < minY) minY = process.Y;
if (process.Y > maxY) maxY = process.Y;

Point n;
int idx;

//Put neighbors in stack
if (process.X - 1 >= 0)
{
n = new Point(process.X - 1, process.Y);
idx = n.X + nWidth * n.Y;
if (!visited[idx])
{
visited[idx] = true;
toBeProcessed.Push(n);
}
}

if (process.X + 1 < nWidth)
{
n = new Point(process.X + 1, process.Y);
idx = n.X + nWidth * n.Y;
if (!visited[idx])
{
visited[idx] = true;
toBeProcessed.Push(n);
}
}

if (process.Y - 1 >= 0)
{
n = new Point(process.X, process.Y - 1);
idx = n.X + nWidth * n.Y;
if (!visited[idx])
{
visited[idx] = true;
toBeProcessed.Push(n);
}
}

if (process.Y + 1 < nHeight)
{
n = new Point(process.X, process.Y + 1);
idx = n.X + nWidth * n.Y;
if (!visited[idx])
{
visited[idx] = true;
toBeProcessed.Push(n);
}
}
}

if (((maxX - minX + 1) > 5) & ((maxY - minY + 1) > 5))
rec.Add(new Rectangle(minX, minY, maxX - minX + 1, maxY - minY + 1));
}

p1 += 5 * bytesPerPixel;
p2 += 5 * bytesPerPixel;
}

base1 += 5 * stride1;
base2 += 5 * stride2;
}

bmp.UnlockBits(bmData1);
bmp2.UnlockBits(bmData2);

return rec;

}

最佳答案

我发现您的代码存在一些问题。如果我没理解错的话,你

  1. 找到两个图像之间不同的像素。
  2. 然后您继续从那里向右扫描,直到找到两个图像再次相同的位置。
  3. 然后您从最后一个“不同”像素扫描到底部,直到找到两个图像再次相同的位置。
  4. 然后你存储那个矩形并从它下面的下一行开始

enter image description here

到目前为止我说得对吗?

这里有两个明显的问题:

  • 如果两个矩形有重叠的 y 范围,你就有麻烦了:你会发现第一个矩形很好,然后跳到底部的 Y 坐标,忽略你刚找到的矩形左边或右边的所有像素。
  • 即使只有一个矩形,您也假设矩形边框上的每个 像素都是不同的,并且所有 其他像素都是相同的。如果该假设不成立,您将过早停止搜索,并且只会找到矩形的一部分。

如果您的图像来自扫描仪或数码相机,或者如果它们包含有损压缩 (jpeg) 伪像,则第二个假设几乎肯定是错误的。为了说明这一点,当我将每个相同的像素标记为黑色链接的两个 jpg 图像,并将每个不同的像素标记为白色时,我得到的结果如下:

enter image description here

您看到的不是一个矩形。相反,您正在寻找的矩形周围的很多像素是不同的:

enter image description here

那是因为 jpeg 压缩伪像。但是,即使您使用无损源图像,边界处的像素也可能不会形成完美的矩形,因为抗锯齿或因为背景碰巧在该区域具有相似的颜色。

您可以尝试改进您的算法,但如果您查看该边界,您会发现所有 种针对您所做的任何几何假设的丑陋反例。

实现这种“正确的方式”可能会更好。含义:

  • 要么实现 flood fill删除不同像素的算法(例如,通过将它们设置为相同或通过将标志存储在单独的掩码中),然后递归检查 4 个相邻像素是否。
  • 或者实现 connected component labeling算法,用一个临时整数标签标记每个不同的像素,使用巧妙的数据结构来跟踪连接了哪些临时标签。如果你只对一个边界框感兴趣,你甚至不必合并临时标签,只需合并相邻标记区域的边界框即可。

连接组件标记通常要快一点,但比洪水填充要正确一些。

最后一个建议:如果我是你,我会重新考虑你的“禁止第 3 方图书馆”政策。即使您的最终产品不包含第 3 方库,如果您使用库中记录良好、经过良好测试且有用的构建 block ,然后用您自己的代码将它们一一替换,开发速度可能会快很多。 (谁知道呢,您甚至可能会找到一个具有合适许可证的开源库,它比您自己的代码快得多,以至于您最终会坚持使用它...)


添加:如果您想重新考虑您的“无库”立场:这是使用 AForge(它具有比 emgucv 更宽松的库)的快速简单实现:

private static void ProcessImages()
{
(* load images *)
var img1 = AForge.Imaging.Image.FromFile(@"compare1.jpg");
var img2 = AForge.Imaging.Image.FromFile(@"compare2.jpg");

(* calculate absolute difference *)
var difference = new AForge.Imaging.Filters.ThresholdedDifference(15)
{OverlayImage = img1}
.Apply(img2);

(* create and initialize the blob counter *)
var bc = new AForge.Imaging.BlobCounter();
bc.FilterBlobs = true;
bc.MinWidth = 5;
bc.MinHeight = 5;

(* find blobs *)
bc.ProcessImage(difference);

(* draw result *)
BitmapData data = img2.LockBits(
new Rectangle(0, 0, img2.Width, img2.Height),
ImageLockMode.ReadWrite, img2.PixelFormat);

foreach (var rc in bc.GetObjectsRectangles())
AForge.Imaging.Drawing.FillRectangle(data, rc, Color.FromArgb(128,Color.Red));

img2.UnlockBits(data);
img2.Save(@"compareResult.jpg");
}

实际差异+blob检测部分(没有加载和结果显示)需要大约43ms,第二次运行(第一次需要更长的时间,由于JITting,缓存等)

结果(由于 jpeg 伪像,矩形变大了):

enter image description here

关于c# - 如何扫描两个图像的差异?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32035320/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com