python - 训练 E-net 进行人体分割-6ren

python - 训练 E-net 进行人体分割

转载作者：行者123 更新时间：2023-11-30 09:16:52

25

4

我正在尝试训练语义分割网络(E-Net)，特别是用于高质量的人体分割。为此，我收集了“Supervisely Person”数据集并使用提供的 API 提取了注释掩码。该数据集拥有高质量的掩模，因此我认为与例如相比，它将提供更好的结果。 COCO 数据集。

监督 - 下面的示例:原始图像 - 真实情况。

首先我想提供模型的一些细节。网络本身(Enet_arch)返回来自最后一个卷积层的logits以及通过tf.nn.sigmoid(logits,name='logits_to_softmax')产生的概率。 .

我在基本事实上使用 sigmoid 交叉熵，并在学习率上使用返回的逻辑、动量和指数衰减。模型实例和训练流程如下。

    self.global_step = tf.Variable(0, name='global_step', trainable=False)
    self.momentum = tf.Variable(0.9, trainable=False)

    # introducing weight decay
    #with slim.arg_scope(ENet_arg_scope(weight_decay=2e-4)):
    self.logits, self.probabilities  = Enet_arch(inputs=self.input_data, num_classes=self.num_classes, batch_size=self.batch_size) # returns logits (2d), probabilities (2d)

    #self.gt is int32 with values 0 or 1 (coming from read_tfrecords.Read_TFRecords annotation images + placeholder defined to int)
    self.gt = self.input_masks

    # self.probabilities is output of sigmoid, pixel-wise between probablities [0, 1].
    # self.predictions is filtered probabilities > 0.5 = 1 else 0
    self.predictions = tf.to_int32(self.probabilities > 0.5)

    # capture segmentation accuracy
    self.accuracy, self.accuracy_update = tf.metrics.accuracy(labels=self.gt, predictions=self.predictions)

    # losses and updates
    # calculate cross entropy loss on logits
    loss = tf.losses.sigmoid_cross_entropy(multi_class_labels=self.gt, logits=self.logits)

    # add the loss to total loss and average (?)
    self.total_loss = tf.losses.get_total_loss()

    # decay_steps = depend on the number of epochs
    self.learning_rate = tf.train.exponential_decay(self.starter_learning_rate, global_step=self.global_step, decay_steps=123893, decay_rate=0.96, staircase=True)

    #Now we can define the optimizer
    #optimizer = tf.train.AdamOptimizer(learning_rate=self.learning_rate, epsilon=1e-8)
    optimizer = tf.train.MomentumOptimizer(self.learning_rate, self.momentum)

    #Create the train_op.
    self.train_op = optimizer.minimize(loss, global_step=self.global_step)

我首先尝试在单个图像上过度拟合模型，以确定该网络可以捕获的细节的深度。为了提高输出质量，我将所有图像的大小调整为 1080p，然后再将其输入网络。在这次试验中，我对网络进行了 10K 次迭代训练，总误差达到了约 30%(从 tf.losses.get_total_loss() 捕获)。

在单个图像上训练的结果非常好，如下所示。

监督 - 下面的示例:(1) 损失 (2) 输入(调整大小之前)|地面实况(调整大小之前)| 1080p 输出

后来，我尝试对整个数据集进行训练，但训练损失产生了很多振荡。这意味着网络在某些图像中表现良好，而在其他图像中则表现不佳。结果，经过 743360 次迭代(即 160 个时期，因为训练集包含 4646 个图像)后，我停止了训练，因为显然我所做的超参数选择有问题。

监督 - 下面的示例:(1) 损失 (2) 学习率 (3) 输入(调整大小之前)|地面实况(调整大小之前)| 1080p 输出

另一方面，在训练集图像的某些实例上，网络会产生公平(但不是很好)的结果，如下所示。

监督 - 下面的示例:输入(调整大小之前)|地面实况(调整大小之前)| 1080p 输出

为什么我在这些训练实例上存在这些差异？我应该对模型或超参数进行任何明显的更改吗？该模型是否可能不适合该用例(例如网络容量低)？

提前致谢。

最佳答案

事实证明，这里的问题确实是E-net架构的问题。我使用 DeepLabV3 更改了架构，发现损失行为和性能有很大差异......即使在小分辨率下!

关于python - 训练 E-net 进行人体分割，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/53761933/

25

4

0

文章推荐： java - 缓存必须是键值对吗？

文章推荐： Java声明一个变量然后初始化它。？

文章推荐： java - 如何将 IvParameterSpec 写入文件？

文章推荐： Javascript MVC，addEventListener 不能附加到 dom 元素

java - ArrayDqueue类的add(E e)和offer(E e)的区别
您好，我在最后一步使用了 add 和 offer 来添加我的元素。两者都返回 boolean 值，并且除了 NPE 之外都不会抛出任何异常。 public class ArrayDequeDemo
javascript - 使用url编码转换特殊字符(é è ë)
我正在做一个功能，用户的电子邮件客户端只打开一个预填充的内容 (javascript)。问题是我在转换特殊字符时遇到问题，因此它们无法正确显示到电子邮件客户端(内容由 url 传递)。我写了一个函
java - Collection&Queue&BlockingQueue接口(interface)中的add(E e)方法
问题一: 在阅读 JDK 源代码时，我发现该方法 boolean add(E e);在接口(interface)中定义 Collection & Queue & BlockingQueue . 我无法
sql-server-2005 - 如何在 SQL Server 中执行不区分重音的比较(e 与 è、é、ê 和 ë)？
我想比较 SQL 中的两个 varchar，一个类似于 Cafe ，另一个 Café SQL 中是否有一种方法可以允许这两个值进行比较。例如: SELECT * FROM Venue WHERE Na
php 正则表达式匹配类似于字母。又名 u=ü 或 ê=é=è=e
我正在研究一种方法来搜索文本中的特定单词并突出显示它们。该代码工作完美，除了我希望它也匹配相似的字母。我的意思是，搜索 fête 应该匹配 fêté、fete、... 有没有一种简单而优雅的方法来做到
Angular2 异常 : No provider for e! (e -> e)
所以我有一个非常简单的组件，它加载了一个简单的路由器。我正在使用所有基本的东西，比如 ngFor、ngSwitch、ngIf，我通过 COMMON_DIRECTIVES 注入(inject)它们我收
javascript - 如何在 javascript 中转换 é -> e, š -> s, ė -> e , ą -> a ... ？
我有一个类似 Brazil: Série A 的字符串，我的目标是转换为 Brazil: Serie A。此外，方法应该转换和其他类似的情况:é -> e, š -> s, ė -> e , ą -
java - AbstractList - add(int index, E element)、add(E e) 等返回类型的区别？
就目前而言，这个问题不适合我们的问答形式。我们希望答案得到事实、引用或专业知识的支持，但这个问题可能会引起辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开，visit the he
angular - StaticInjectorError[e -> e] : NullInjectorError: No provider for e
在我的 app.module.ts @NgModule({ declarations: [ AppComponent ], imports: [ BrowserModule
java - SELECT e From Employee e - 为什么是多余的 "e"？
Sample查询: SELECT e FROM Employee e WHERE SUBSTRING(e.name, 3) = 'Mac' 在这种语法中，说 SELECT e 似乎很直观，即 e 现在
objective-c - 将 ë、à、é、ä 等特殊字符全部转换为 e、a、e、a？ objective-c
objective-c 中是否有一种简单的方法可以将所有特殊字符(如 ë、à、é、ä)转换为普通字符(如 e en a)？最佳答案是的，而且非常简单: NSString *src = @"Conv
ruby - 在 Ruby 中，如何将 ë,à,é,ä 等特殊字符全部转换为 e,a,e,a？
我想将 ë 之类的字符转换为普通的 e。我正在寻找关于语言和人们如何输入城市的转换。例如，大多数人在搜索时实际上输入的是 Brasilia，而不是 Brasília。当 Rueters 等新闻机构报道
javascript - function(e){e.something...} 什么是 e？
当我写作时 $("#new_lang").click(function(e) { alert("something"); e.stopPropagation(); }); 这里的 e 是什么，
Java List 到 Map> 的键是 E 的某些属性，值是具有该属性的 E
我想知道如何将 Java List 转换为 Map。映射中的键是列表元素的某些属性(不同的元素可能具有相同的属性)，值是这些列表项的列表(具有相同的属性)。例如。 List --> Map> 。我找到
java - 为什么我们在 Deque 中有 offer(E e) 和 offerLast(E e) 方法，即使它们解决的是相同的目的
我试图理解，为什么我们需要 Deque 中的 Offer 和 OfferLast 方法，因为这两种方法都在Deque 的结尾/尾部。它有什么意义？最佳答案 Queue 接口(interface)是在
c# - 使用表达式生成 e => new { e.Id, e.CompanyId }
这个问题是这个问题的延续 here .如果有人想知道为什么我需要做这样的事情，你可以在那个问题中找到理由。这并不重要，真的。我需要这样的方法: public virtual Expression>
java - 什么时候需要 Some> 而不是 Some？
注意:这个问题与 Enum 无关，所以它不是重复的。Enum 被迫只与自身比较，因为编译器生成类型参数，而不是因为 java 递归类型参数。我试图找到将类声明为的优势: public class S
java - 什么时候需要 Some> 而不是 Some？
注意:这个问题与 Enum 无关，所以它不是重复的。Enum 被迫只与自身比较，因为编译器生成类型参数，而不是因为 java 递归类型参数。我试图找到将类声明为的优势: public class S
c - 结构示例 *e : differences between function(&e) and function(e)
如果我有一个struct example *e，function(&e) 和function(e) 之间有什么区别？一个例子。这是第一个代码: #include struct example {
c# - LINQ: "select new {e.FName, e.LName}"和 "select (e.FName, e.LName)"之间的区别？
这个问题在这里已经有了答案: C# 7.0 ValueTuples vs Anonymous Types (2 个答案) 关闭去年。这两个查询有什么区别？ var query = from e i

首页

博学

6Ren·AI

商城

python - 训练 E-net 进行人体分割