- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
我意识到以下问题可能会得到“这是关于实验和使用经验”的回答,但无论如何我都会问,因为我认为了解我应该寻找什么是有用的开始于。
在 Keras 中,Conv2D
卷积层,有一个参数叫filters
,我将其理解为“在尺寸由 kernel_size
参数定义的图像上卷积的过滤器窗口的数量”。 IE。 Conv2D(filters=32, kernel_size=(3,3)..)
将意味着 32 个大小为 3x3 的窗口将扫描整个图像。
我的问题是:如果您正在创建一个全新的神经网络来解决图像分类/识别问题,而不利用预先训练的神经网络(因此从头开始),那么 filters
会怎样?您通常从第一个卷积层开始的值是什么?有经验法则吗?这真的只是一个实验答案吗?
假设我想要一个全新的模型能够识别图像中是否有狗,而无需利用 ResNet50
或InceptionV3
imagenet 模型,我将使用尺寸为 4160x3120 的彩色图像,我已将其缩小到 input_shape
(224,168,3),我的第一个应该是什么Conv2D
图层是什么样的?
例如此示例代码是解决我的问题的良好起点吗:
model = Sequential()
model.add(Conv2D(32, kernel_size=(3,3), activation="relu", input_shape=(224,168,3), data_format="channels_last"))
model.add(Conv2D(64, kernel_size=(3,3), activation="relu"))
#additional model design code
32 是一个好的起点吗?我应该变小吗?过滤器尺寸从 Conv2D
加倍图层至 Conv2D
分层解决新问题的适当方法?
完全理解这是一个本质上复杂的主题,并且没有“快速致富”的方法,但我只是想更好地理解这个主题。
最佳答案
16 或 32 就可以。
前几层中的过滤器通常不太抽象,通常模拟边缘检测器、 Blob 检测器等。您通常不希望将太多过滤器应用于输入层,因为从原始输入中只能提取这么多信息层。如果添加太多,大多数过滤器都会变得多余。您可以通过修剪来检查这一点(减少过滤器数量,直到性能指标下降)
内核大小决定了您想要影响卷积输出的图像量(内核的“感受野”)。人们发现较小的内核通常比较大的内核更好(即使用 3x3 而不是 5x5、7x7)。
Inception 架构将这些决策从建模者手中夺走,因为它将不同内核大小的过滤器集中在一起,让模型学习最适合使用的过滤器。
作为引用,我建议在 YouTube 上浏览斯坦福大学的 CS231n 类(class),以全面了解:https://www.youtube.com/playlist?list=PLC1qU-LWwrF64f4QKQT-Vg5Wr4qEE1Zxk
关于python - 选择 Conv2D 过滤器值作为开始,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52447345/
关闭。这个问题需要debugging details .它目前不接受答案。 编辑问题以包含 desired behavior, a specific problem or error, and th
我试图用这种形式简单地获取数字 28 integer+space+integer+integer+space+integer我试过这个正则表达式 \\s\\d\\d\\s 但我得到了两个数字11 和
最近一直在学习D语言。我一直对运行时感到困惑。 从我能收集到的关于它的信息中,(这不是很多)我知道它是一种有助于 D 的一些特性的运行时。像垃圾收集一样,它与您自己的程序一起运行。但是既然 D 是编译
想问一下这两个正则表达式有区别吗? \d\d\d 与 \d{3} 我已经在我的本地机器上使用 Java 和 Windows 操作系统对此进行了测试,两者都工作正常并且结果相同。但是,当在 linux
我正在学习 Go,而且我坚持使用 Go 之旅(exercise-stringer.go:https://tour.golang.org/methods/7)。 这是一些代码: type IPAddr
我在Java正则表达式中发现了一段令我困惑的代码: Pattern.compile( "J.*\\d[0-35-9]-\\d\\d-\\d\\d" ); 要编译的字符串是: String string
我在 ruby 代码上偶然发现了这个。我知道\d{4})\/(\d\d)\/(\d\d)\/(.*)/是什么意思,但是\1-\2-\3-\4 是什么意思? 最佳答案 \1-\2-\3-\4 是 b
我一直在努力解决这个问题,这让我很恼火。我了解 D 运行时库。它是什么,它做什么。我也明白你可以在没有它的情况下编译 D 应用程序。就像 XoMB 所做的那样。好吧,XoMB 定义了自己的运行时,但是
我有两个列表列表,子列表代表路径。我想找到所有路径。 List> pathList1 List> pathList2 当然是天真的解决方案: List> result = new ArrayList>
我需要使用 Regex 格式化一个字符串,该字符串包含数字、字母 a-z 和 A-Z,同时还包含破折号和空格。 从用户输入我有02-219 8 53 24 输出应该是022 198 53 24 我正在
目标是达到与this C++ example相同的效果: 避免创建临时文件。我曾尝试将 C++ 示例翻译为 D,但没有成功。我也尝试过不同的方法。 import std.datetime : benc
tl;dr:你好吗perfect forwarding在 D? 该链接有一个很好的解释,但例如,假设我有这个方法: void foo(T)(in int a, out int b, ref int c
有什么方法可以在 D 中使用abstract auto 函数吗? 如果我声明一个类如下: class MyClass { abstract auto foo(); } 我收到以下错误: mai
有没有人为内存中重叠的数组切片实现交集?算法在没有重叠时返回 []。 当 pretty-print (使用重叠缩进)内存中重叠的数组切片时,我想要这个。 最佳答案 如果您确定它们是数组,那么只需取 p
我已经开始学习 D,但我在使用 Andrei Alexandrescu 所著的 The D Programming Language 一书中提供的示例时遇到了一些麻烦。由于 int 和 ulong 类
如何创建一个不可变的类? 我的目标是创建一个实例始终不可变的类。现在我只是用不可变的方法和构造函数创建了一个“可变”类。我将其称为 mData,m 表示可变。然后我创建一个别名 alias immut
不久前我买了《The D Programming Language》。好书,很有教育意义。但是,我在尝试编译书中列出的语言功能时遇到了麻烦:扩展函数。 在这本书中,Andrei 写了任何可以像这样调用
我在 D http://www.digitalmars.com/d/2.0/lazy-evaluation.html 中找到了函数参数的惰性求值示例 我想知道如何在 D 中实现可能的无限数据结构,就像
这个问题在这里已经有了答案: 12 年前关闭。 Possible Duplicate: Could anyone explain these undefined behaviors (i = i++
当前是否可以跨模块扫描/查询/迭代具有某些属性的所有函数(或类)? 例如: source/packageA/something.d: @sillyWalk(10) void doSomething()
我是一名优秀的程序员,十分优秀!