gpt4 book ai didi

python - 使用 Python 从 OpenCV 中的扫描中裁剪矩形照片

转载 作者:行者123 更新时间:2023-12-01 02:06:12 25 4
gpt4 key购买 nike

我有很多这样的照片:

Asakusa photo scan

我想自动裁剪图像,以便仅显示照片(可能还有标题)。

我尝试检测轮廓,但他们找到了照片中物体的边界,而不是照片本身。图像边缘以及其他小边缘也存在虚假轮廓。

Bad contours

如何才能只获取包含照片的矩形?

最佳答案

我设法对此提出了令人满意的解决方案。有几个步骤:

  1. 获取轮廓
  2. 删除面积过小或过大的轮廓
  3. 查找所有剩余轮廓的最小/最大 x/y
  4. 使用这些值创建要裁剪的矩形

这就是基本流程。

无论如何,这是核心部分的一些代码:

import cv2
from os.path import basename
from glob import glob

def get_contours(img):
# First make the image 1-bit and get contours
imgray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

ret, thresh = cv2.threshold(imgray, 150, 255, 0)

cv2.imwrite('thresh.jpg', thresh)
img2, contours, hierarchy = cv2.findContours(thresh, 1, 2)

# filter contours that are too large or small
size = get_size(img)
contours = [cc for cc in contours if contourOK(cc, size)]
return contours

def get_size(img):
ih, iw = img.shape[:2]
return iw * ih

def contourOK(cc, size=1000000):
x, y, w, h = cv2.boundingRect(cc)
if w < 50 or h < 50: return False # too narrow or wide is bad
area = cv2.contourArea(cc)
return area < (size * 0.5) and area > 200

def find_boundaries(img, contours):
# margin is the minimum distance from the edges of the image, as a fraction
ih, iw = img.shape[:2]
minx = iw
miny = ih
maxx = 0
maxy = 0

for cc in contours:
x, y, w, h = cv2.boundingRect(cc)
if x < minx: minx = x
if y < miny: miny = y
if x + w > maxx: maxx = x + w
if y + h > maxy: maxy = y + h

return (minx, miny, maxx, maxy)

def crop(img, boundaries):
minx, miny, maxx, maxy = boundaries
return img[miny:maxy, minx:maxx]

def process_image(fname):
img = cv2.imread(fname)
contours = get_contours(img)
#cv2.drawContours(img, contours, -1, (0,255,0)) # draws contours, good for debugging
bounds = find_boundaries(img, contours)
cropped = crop(img, bounds)
if get_size(cropped) < 400: return # too small
cv2.imwrite('cropped/' + basename(fname), cropped)

process_image('pic.jpg')

这有重要的部分,但我使用了另外两个对我的数据集效果很好的技巧:

  1. 修改阈值,直到图像的一定百分比为黑色。对于我的大多数图像,即使照片中最亮的部分也比下面的页面更暗,因此在一定的神奇阈值水平下,照片会变成黑色方 block ,从而更容易获得良好的轮廓。

  2. 完全忽略图像边缘附近的轮廓。有时书脊的一点点会导致在原始图像的边界处形成轮廓,这是不希望的。检查边缘的小像素数(例如 20)内的轮廓并忽略它们解决了这个问题。

一些结果图像,左侧为原始图像,右侧为自动裁剪图像:

Street with streetcar

People in a park

关于python - 使用 Python 从 OpenCV 中的扫描中裁剪矩形照片,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49049318/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com