tensorflow - 动态张量对齐/裁剪-6ren

tensorflow - 动态张量对齐/裁剪

转载作者：行者123 更新时间：2023-12-02 00:42:45

31

4

我在 TensorFlow 上实现了全卷积网络。它使用编码器-解码器结构。训练时，我始终使用相同的图像大小(224x224，使用随机裁剪)并且一切正常。

在干扰阶段，我想一次预测一张图像，因为我想使用全图(未裁剪)。例如，此类图像的大小为 [406,256]。这是问题。在编码器-解码器架构中，我添加了两个tesors (z = x + y) .训练时，两个张量的大小匹配。预测我的单个图像时，尺寸不匹配(张量尺寸:[1,47,47,64] vs [1,46,46,64])。我认为这是由在 Conv 和 Pool 层中进行的一些舍入引起的。

我应该在我的架构中更改什么以适用于我想要的任何图像尺寸？我应该更改舍入参数吗？或者添加张量的“裁剪”？

架构实现链接: https://gist.github.com/melgor/0e43cadf742fe3336148ab64dd63138f(问题出现在第166行)

最佳答案

我找到了可变输入大小的解决方案:)

我们真正需要的是一个“裁剪层”，裁剪一个张量以匹配另一个张量。我在这里找到了非常相似的图层:http://tf-unet.readthedocs.io/en/latest/_modules/tf_unet/layers.html(crop_and_concat)。

我刚刚将其设为“crop_and_add”并且它正在运行:

def crop_and_add(x1,x2):
    x1_shape = tf.shape(x1)
    x2_shape = tf.shape(x2)
    # offsets for the top left corner of the crop
    offsets = [0, (x1_shape[1] - x2_shape[1]) // 2, (x1_shape[2] - x2_shape[2]) // 2, 0]
    size = [-1, x2_shape[1], x2_shape[2], -1]
    x1_crop = tf.slice(x1, offsets, size)
    return x1_crop + x2

模型 I 中的所有添加都替换为上层(因此合并了编码器和解码器数据)。

此外，模型的输入需要定义为:

image = tf.placeholder(tf.float32, shape=[1, None, None, 3], name="input_image")

所以我们知道我们将传递单个图像并且该图像有 3 个 channel 。但我们既不知道宽度也不知道高度。而且效果很好! (K80 上的 40 FPS 作为 AWS P2，图像大小为 224x{}-图像的拍摄侧有 224)

仅供引用，我还尝试运行 ENET (比 LinkNet 快 2 倍)，但在 TensorFlow 中速度较慢。我认为这是因为 PReLu(在 TF 上很慢)。此外，它不支持图像的任意大小，因为 UnPool 层需要通过整数列表(而不是占位符)预定义输出大小。所以 LinkNet 在 TF 中的速度和性能方面看起来更好。

关于tensorflow - 动态张量对齐/裁剪，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/45611237/

31

4

0

文章推荐： c# - ObserveOn 和 SubscribeOn - 工作完成的地方

文章推荐： svg - depricated tref 的替代方案是什么？

文章推荐： oracle - 两个不同表的SQL外键

文章推荐： SQL Unpivot/Coalesce 多列基于值的一列

FFmpeg - 最大高度(裁剪)
是否有可能(在 cmd 批处理 ffmpeg 中)拍摄宽度已知(1920px)但高度未知的图像，如果超过，则将高度裁剪为特定的值？基本上是最大高度裁剪。我玩过缩放和裁剪，但我无法得到我需要的结果。任
r - 裁剪 SpatialPolygonsDataFrame
我有两个 SpatialPolygonsDataFrame文件:dat1、dat2 extent(dat1) class : Extent xmin : -180 xmax
tensorflow - 动态张量对齐/裁剪
我在 TensorFlow 上实现了全卷积网络。它使用编码器-解码器结构。训练时，我始终使用相同的图像大小(224x224，使用随机裁剪)并且一切正常。在干扰阶段，我想一次预测一张图像，因为我想使用
tensorflow - 动态张量对齐/裁剪
我在 TensorFlow 上实现了全卷积网络。它使用编码器-解码器结构。训练时，我始终使用相同的图像大小(224x224，使用随机裁剪)并且一切正常。在干扰阶段，我想一次预测一张图像，因为我想使用
ios - 裁剪 UIView
我有一个需要裁剪的 View 。我有 4 个 View 显示在主视图上查看的视频 subview 。由于视频比例，我需要裁剪使视频成为正方形而不是矩形的 View 。这是我的代码: - (void)v
javascript - 客户端图像处理(裁剪)
我正在构建一个使用 Parse 作为我的后端的网络应用程序。部分注册过程涉及用户上传和裁剪图片，然后我将其传递到我的数据库(图片是用户个人资料的一部分，类似于您在 Twitter 上所做的)。我已
C++、OpenGL 裁剪
我正在制作一个基于立方体的游戏(一切都是立方体)，目前正在尝试通过不在视野之外绘制东西来优化它。以下内容仅适用于 x 和 y 平面，稍后我会担心 z ......所以现在只进行侧面裁剪。我知道我自
ios - 一指图像缩放/裁剪
我正在尝试在 iOS 上实现单指图像缩放/裁剪。类似于柯比·特纳的单指旋转。我正在寻找现有的库，或者如果您可以帮助我处理代码本身，那就太好了。最佳答案我不太清楚你所说的一指裁剪是什么意思，但我为
CSS 裁剪、饼图和悬停
从这里: http://www.kylejlarson.com/blog/2011/how-to-create-pie-charts-with-css3/ .pieContainer
swift - 裁剪 SKReferenceNode
我已经设置了一个 SKScene 用作 SKReferenceNode。雪橇是一个 SKSpriteNode，在引用节点场景中定义了一个自定义类，所有的狗都是雪橇 Sprite 的 child 。自定
c++ - 自动矢量化感兴趣区域(裁剪)
我有一个库，其中包含一些图像处理算法，包括感兴趣区域(裁剪)算法。使用 GCC 编译时，自动矢量化器会加速很多代码，但会降低 Crop 算法的性能。是否有标记某个循环以被矢量化器忽略的方法，或者是否有
CSS3 裁剪 div
代码位于 http://jsfiddle.net/rSSXu/ Child #parent { margin-left:auto; margin-right:auto;
c# - 裁剪/删除图像边缘不需要的空间
我搜索了很多以删除不需要的空间，但找不到。我只找到可用于删除黑白背景空间的链接。但我的背景图片可以是任何东西。所以，如果我有这些图片，我如何提取我需要的图像部分。例如，最佳答案这是我对你的问题的
ios - 裁剪 CMSampleBufferRef
我正在尝试将 CMSampleBufferRef 中的图像裁剪为特定大小。我正在执行 5 个步骤 - 1. 从 SampleBuffer 获取 PixelBuffer 2. 将 PixelBuffer
ios - UIImagePickerController 裁剪？
我读到它是自动的，但在我的案例中似乎没有发生。使用 UIImagePickerController 并将 allowsEditing 设置为 YES 我得到了带有裁剪方形叠加层的编辑 View ，但是
javascript - “裁剪”二维数组？
我正在寻找一种高效的方法来裁剪二维数组。考虑这个例子: 我有一个构成 100x100 网格的二维数组。我只想返回其中的一部分，60x60。这是一个“a”方法的示例，但我正在寻找指向执行此操作的最高性能
ios - 裁剪 CIImage
我有一个接受 UIImage 的类，用它初始化一个 CIImage，如下所示: workingImage = CIImage.init(image: baseImage!) 然后使用图像以 3x3 的
database - 存储在数据库中的图像在浏览器上显示时被剪切/裁剪
我正在尝试显示来自 mysql 数据库的图像。有些图像显示正确，但有些图像在底部显示为剪切/裁剪，裁剪部分仅显示为空白，当它成为图像的一部分时，您真的无法摆脱。 CSS 无法解决这个问题，使用 ima
Android 裁剪 Intent
我有个问题。我有什么理由不应该使用这个 Intent: Intent intent = new Intent("com.android.camera.action.CROP"); 为了裁剪我刚刚拍摄的
ios - 裁剪 UIImage
我有一些代码可以调整图像大小，因此我可以获得图像中心的缩放 block - 我使用它来获取 UIImage 并返回一个小的方形表示图片，类似于在照片应用程序的相册 View 中看到的内容。 (我知道我

首页

博学

6Ren·AI

商城

tensorflow - 动态张量对齐/裁剪