- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在使用使用 VGG(神经网络)的基于转移式的深度学习方法。后者适用于小尺寸(512x512 像素)的图像,但是当输入图像很大(尺寸 > 1500 像素)时它会提供失真的结果。该方法的作者建议将输入的大图像分成几部分,然后对第 1 部分和第 2 部分进行风格迁移,最后将这两个部分连接起来得到最终的大结果图像,因为 VGG 是为小图像制作的......这种方法的问题在于生成的图像将在“粘合”部分的区域级别具有一些不一致的区域。
我该如何纠正这些区域?
是这种划分方法的替代方法吗?
最佳答案
欢迎来到 SO,让吕克。很好的第一个问题。
当您说 VGG 时,我希望您指的是 VGG-16。该架构最终使用全连接层,这意味着您只能将其用于特定大小的图像。我相信 ImageNet 默认是 224x224 像素。
如果你想不加修改地使用 VGG-16,你必须使用这种尺寸的图像。然而,许多人最终移除了完全连接的层(特别是在风格转移的背景下),以便以他们想要的任何大小进行输入。
任何尺寸?好吧,您可能想要确保图像是 32 的倍数,因为 VGG-16 带有 5 个 MaxPooling 操作,每次都将尺寸减半。
但仅仅因为网络现在可以消化任何大小的图像并不意味着预测将是有意义的。 VGG-16 学习了 1000 个不同对象在 224px 的比例下的样子。使用 1500 像素的猫可能不会激活与猫相关的神经元。那是问题吗?
这取决于您的用例。我不相信 VGG-16 在 ImageNet 的上下文中对这些高分辨率图像进行分类,但这不是您所追求的。您想使用预训练的 VGG-16,因为它应该已经学习了一些在风格迁移中可能会派上用场的能力。无论输入的大小如何,这通常都是正确的。与从头开始相比,几乎总是首选从预训练模型开始。您可能想要考虑为您的任务微调此模型,因为 A) 样式转移与分类完全不同,并且 B) 您使用的是完全不同的图像比例。
由于您遇到的问题完全相同,我从未找到这种推荐的基于补丁的方法来提供帮助。虽然 CNN 学习识别图像中的局部模式,但它们也会学习全局分布,这就是为什么这不能很好地工作的原因。你总是可以尝试使用插值技术合并补丁,但我个人不会浪费时间。
而是像你提到的那样输入完整的图像,在你删除完全连接的层后应该可以工作。规模将关闭,但如果您真的想要高分辨率输入,则无能为力。微调 VGG-16,以便它可以学习适应您手头的用例。
如果您不想进行微调,我认为您无能为力。当您更改分辨率时,使用网络训练的转换/规模或接受低于最佳性能的结果。
关于python - 在 VGG 神经网络中放置和获取大图像的策略,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/63829340/
语句 1: [2,4,6,7,8].each do |i| (i % 2 == 0) || (puts "Not even" && break) puts i end 声明 2: [2
我有一张正在显示的卡片,上面有一些信息。我想将其包装在SingleChildScrollView中,因为我还有更多项目要添加到卡中,但是当我这样做时,屏幕只是空白吗?我曾尝试将其作为根(脚手架主体)放
我有一个带有窗体的 View ,该窗体显示ViewModel中ObservableCollection中对象的数据。 ObservableCollection使我可以浏览数据。 ObservableC
如何将时间戳附加文件名放在HDFS中? hadoop fs -put topic_2018-12-15%2016:31:15.csv /user/file_structure/ 最佳答案 您只是在运行
我正在寻求一些帮助,以找出为什么以下叠加函数的运行时间会随着每次连续运行而增加。 据我所知,如果缓冲区中的文本保持不变,则运行时间应该是相同的——即,仅向左/向右移动光标应该不会增加运行时间(但它确实
我有一个事件指示器,它显示在中间。如何将其放置在 View 的左上角? var activityIndicator = UIActivityIndicatorView() func show() {
首先,我想提前感谢所有回答这个问题的人。非常感谢您的帮助。这是我第一次在这里发帖,所以如果我发帖不礼貌,请原谅我。 我的问题是关于方法原型(prototype)的: void copySubtree(
我正在开发一个应该是通用的应用程序,一个适用于 iPad 和 iPhone 的应用程序。我想让他们的界面尽可能相似。在 iPhone 应用程序中,我使用的是选项卡栏 Controller ,其中一个选
我目前正在使用 JS 开发 REST API,但遇到以下问题:该代码有效,但如果我尝试删除、放置或修补不存在的条目,它不会返回错误,但会打印成功消息。这是为什么?获取路由完美运行。 app.route
.a{ width:500px; height:500px; background:yellow; border: 3px dashed black; }
首先,请引用下图: 这基本上是我对布局的想法。 我想要的是: 内容 div 成为“主要焦点”,例如当浏览器 调整大小,它应该留在中间; 当浏览器被调整大小时,我希望这两个图像基本上 位于内容 div
我的应用程序需要使用内存映射并发访问数据文件。我的目标是使其在共享内存系统中可扩展。研究了内存映射文件库实现的源码,想不通: 在多个线程中从 MappedByteBuffer 中读取是否合法? get
我有一个 JDesktopPane 并希望以网格样式显示 JInternalFrames 而无需覆盖框架。框架的尺寸会有所不同,因此应动态分配它们的位置。我可以存储最后放置的框架的坐标,但可以移动、最
根据https://isocpp.org/wiki/faq/dtors#placement-new传递给placement-new的地址必须正确对齐。但它给出的例子似乎与此相矛盾。 char memo
我最近一直在查看 Illumos 源代码,发现了一些奇怪的东西。 在他们的源代码中,函数类型是这样写的: static int outdec64(unsigned char *out, unsigne
您好,我目前正在尝试在我的一张图片旁边放置一个图例,但我在放置时遇到了问题。 我想将图例放在图像的左侧或右侧。这是我当前的代码: .my-legend .legend-title { text-a
根据文档, print 之间的唯一区别和 say 似乎是后者添加了 "\n"(并使用 .gist 进行字符串化)。然而, perl6 -e 'print "del\b\b"' 打印“d”,有效地应用转
所以我试图将我的图像标志放在背景上,但我的背景突然被裁剪,出现了一半的黑屏。如图: 我的 main.dart 代码: import 'package:flutter/material.dart'; i
我正在使用 Azure DevOps 构建 python 轮。我想让它尽可能通用,以便团队中的每个人都可以使用相同的管道来构建自己的 python 轮并将它们部署在一些 databricks 工作区中
在构建标准(非 WordPress)网页时,我通常会在正文末尾之前加载所有 javascript 文件,然后包含页面特定 js 代码的部分。 WorPress 建议使用 wp_enqueue_scri
我是一名优秀的程序员,十分优秀!