gpt4 book ai didi

machine-learning - 机器学习和不同尺寸的图像

转载 作者:行者123 更新时间:2023-11-30 09:29:24 25 4
gpt4 key购买 nike

假设我有一个机器学习系统,它已经学会识别图像是否包含物体(例如汽车)。

我的问题是,当系统收到不同尺寸的图片时怎么办?例如,训练集可能由 1000x700 像素的图像组成,但现实世界并不那么统一,人们可以期望图像为 700x1000、700x400 ...

第一个冲动是调整图像大小,使其与训练集大小相同,但这感觉很脏而且没什么用。

我在这里遗漏了一些明显的东西吗?另外,即使对于训练集,我认为假设每个图像都具有固定大小(再次假设 1000x700 像素)并没有真正意义。

此外,如果使用滑动窗口技术,也可能会出现同样的问题,因为确定正确的窗口大小并不容易。

我想这一定是一个比较常见的问题,所以一定有一套通用的解决方案,有什么想法吗?

最佳答案

是的。常见的解决方案有

  1. 调整大小和裁剪 - 缩小或放大图像,直到两个尺寸至少达到所需的尺寸。然后将照片裁剪为常用尺寸。
  2. 裁剪 - 提取常见大小的裁剪,如果需要则进行填充。

现在...裁剪通常是通过一系列裁剪照片完成的:所有四个角和中心。在上面的 (1) 中,只有三张图像,而不是 5 张。

关于machine-learning - 机器学习和不同尺寸的图像,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39583715/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com