- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我按照本教程进行对象检测: https://pytorch.org/tutorials/intermediate/torchvision_tutorial.html
及其包含以下 train_one_epoch
和 evaluate
函数的 GitHub 存储库:
https://github.com/pytorch/vision/blob/main/references/detection/engine.py
但是,我想计算验证期间的损失。我为评估损失实现了这个,基本上为了获得损失,model.train()
需要打开:
@torch.no_grad()
def evaluate_loss(model, data_loader, device):
val_loss = 0
model.train()
for images, targets in data_loader:
images = list(image.to(device) for image in images)
targets = [{k: v.to(device) for k, v in t.items()} for t in targets]
loss_dict = model(images, targets)
losses = sum(loss for loss in loss_dict.values())
# reduce losses over all GPUs for logging purposes
loss_dict_reduced = utils.reduce_dict(loss_dict)
losses_reduced = sum(loss for loss in loss_dict_reduced.values())
val_loss += losses_reduced
validation_loss = val_loss/ len(data_loader)
return validation_loss
然后我将它放在我的 for 循环中的学习率调度程序步骤之后:
for epoch in range(args.num_epochs):
# train for one epoch, printing every 10 iterations
train_one_epoch(model, optimizer, train_data_loader, device, epoch, print_freq=10)
# update the learning rate
lr_scheduler.step()
validation_loss = evaluate_loss(model, valid_data_loader, device=device)
# evaluate on the test dataset
evaluate(model, valid_data_loader, device=device)
这看起来正确吗?它会干扰训练或产生不准确的验证损失吗?
如果可以,通过使用它,是否有一种简单的方法可以为验证损失应用提前停止?
我正在考虑在上面显示的评估模型函数之后添加类似这样的东西:
torch.save({
'epoch': epoch,
'model_state_dict': net.state_dict(),
'optimizer_state_dict': optimizer.state_dict(),
'validation loss': valid_loss,
}, PATH)
我还打算在每个时期保存模型以用于检查点目的。但是,我需要确定保存“最佳”模型的验证“损失”。
最佳答案
因此,当 model.eval()
设置时,pytorch fasterrcnn 返回损失没有任何阶段。但是,您可以手动使用 forward
代码在评估模式下生成损失:
from typing import Tuple, List, Dict, Optional
import torch
from torch import Tensor
from collections import OrderedDict
from torchvision.models.detection.roi_heads import fastrcnn_loss
from torchvision.models.detection.rpn import concat_box_prediction_layers
def eval_forward(model, images, targets):
# type: (List[Tensor], Optional[List[Dict[str, Tensor]]]) -> Tuple[Dict[str, Tensor], List[Dict[str, Tensor]]]
"""
Args:
images (list[Tensor]): images to be processed
targets (list[Dict[str, Tensor]]): ground-truth boxes present in the image (optional)
Returns:
result (list[BoxList] or dict[Tensor]): the output from the model.
It returns list[BoxList] contains additional fields
like `scores`, `labels` and `mask` (for Mask R-CNN models).
"""
model.eval()
original_image_sizes: List[Tuple[int, int]] = []
for img in images:
val = img.shape[-2:]
assert len(val) == 2
original_image_sizes.append((val[0], val[1]))
images, targets = model.transform(images, targets)
# Check for degenerate boxes
# TODO: Move this to a function
if targets is not None:
for target_idx, target in enumerate(targets):
boxes = target["boxes"]
degenerate_boxes = boxes[:, 2:] <= boxes[:, :2]
if degenerate_boxes.any():
# print the first degenerate box
bb_idx = torch.where(degenerate_boxes.any(dim=1))[0][0]
degen_bb: List[float] = boxes[bb_idx].tolist()
raise ValueError(
"All bounding boxes should have positive height and width."
f" Found invalid box {degen_bb} for target at index {target_idx}."
)
features = model.backbone(images.tensors)
if isinstance(features, torch.Tensor):
features = OrderedDict([("0", features)])
model.rpn.training=True
#model.roi_heads.training=True
#####proposals, proposal_losses = model.rpn(images, features, targets)
features_rpn = list(features.values())
objectness, pred_bbox_deltas = model.rpn.head(features_rpn)
anchors = model.rpn.anchor_generator(images, features_rpn)
num_images = len(anchors)
num_anchors_per_level_shape_tensors = [o[0].shape for o in objectness]
num_anchors_per_level = [s[0] * s[1] * s[2] for s in num_anchors_per_level_shape_tensors]
objectness, pred_bbox_deltas = concat_box_prediction_layers(objectness, pred_bbox_deltas)
# apply pred_bbox_deltas to anchors to obtain the decoded proposals
# note that we detach the deltas because Faster R-CNN do not backprop through
# the proposals
proposals = model.rpn.box_coder.decode(pred_bbox_deltas.detach(), anchors)
proposals = proposals.view(num_images, -1, 4)
proposals, scores = model.rpn.filter_proposals(proposals, objectness, images.image_sizes, num_anchors_per_level)
proposal_losses = {}
assert targets is not None
labels, matched_gt_boxes = model.rpn.assign_targets_to_anchors(anchors, targets)
regression_targets = model.rpn.box_coder.encode(matched_gt_boxes, anchors)
loss_objectness, loss_rpn_box_reg = model.rpn.compute_loss(
objectness, pred_bbox_deltas, labels, regression_targets
)
proposal_losses = {
"loss_objectness": loss_objectness,
"loss_rpn_box_reg": loss_rpn_box_reg,
}
#####detections, detector_losses = model.roi_heads(features, proposals, images.image_sizes, targets)
image_shapes = images.image_sizes
proposals, matched_idxs, labels, regression_targets = model.roi_heads.select_training_samples(proposals, targets)
box_features = model.roi_heads.box_roi_pool(features, proposals, image_shapes)
box_features = model.roi_heads.box_head(box_features)
class_logits, box_regression = model.roi_heads.box_predictor(box_features)
result: List[Dict[str, torch.Tensor]] = []
detector_losses = {}
loss_classifier, loss_box_reg = fastrcnn_loss(class_logits, box_regression, labels, regression_targets)
detector_losses = {"loss_classifier": loss_classifier, "loss_box_reg": loss_box_reg}
boxes, scores, labels = model.roi_heads.postprocess_detections(class_logits, box_regression, proposals, image_shapes)
num_images = len(boxes)
for i in range(num_images):
result.append(
{
"boxes": boxes[i],
"labels": labels[i],
"scores": scores[i],
}
)
detections = result
detections = model.transform.postprocess(detections, images.image_sizes, original_image_sizes) # type: ignore[operator]
model.rpn.training=False
model.roi_heads.training=False
losses = {}
losses.update(detector_losses)
losses.update(proposal_losses)
return losses, detections
测试这段代码给我:
import torchvision
from torchvision.models.detection.faster_rcnn import FastRCNNPredictor
# load a model pre-trained on COCO
model = torchvision.models.detection.fasterrcnn_resnet50_fpn(pretrained=True)
# replace the classifier with a new one, that has
# num_classes which is user-defined
num_classes = 2 # 1 class (person) + background
# get number of input features for the classifier
in_features = model.roi_heads.box_predictor.cls_score.in_features
# replace the pre-trained head with a new one
model.roi_heads.box_predictor = FastRCNNPredictor(in_features, num_classes)
losses, detections = eval_forward(model,torch.randn([1,3,300,300]),[{'boxes':torch.tensor([[100,100,200,200]]),'labels':torch.tensor([0])}])
{'loss_classifier': tensor(0.6594, grad_fn=<NllLossBackward0>),
'loss_box_reg': tensor(0., grad_fn=<DivBackward0>),
'loss_objectness': tensor(0.5108, grad_fn=<BinaryCrossEntropyWithLogitsBackward0>),
'loss_rpn_box_reg': tensor(0.0160, grad_fn=<DivBackward0>)}
关于python - 如何确定更快的 RCNN (PyTorch) 的验证损失?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/71288513/
RCNN Mask 检测人添加边界框和形状近似,我的目标是只获得这些 如何仅从 RCNN Mask 获得形状近似和边界框? 最佳答案 假设您有一个带有对象掩码的 NumPy 数组列表,您可以尝试 sc
我正在尝试运行 Py-Faster-RCNN 来解决 2 类问题,比如 obj1 和 obj2。 我已将数据存储为 Pascal 格式。 我还将 caffe 定义的最后一层中的输出数量更改为 3(即
我正在尝试使用掩码 rcnn 运行 TF 对象检测,但它在具有 500GB 内存的节点上不断死亡。 我将models/research/object_detection/trainer.py Conf
我正在使用 Tensorflow 和 faster_rcnn_inception_v2_coco 模型训练对象检测器,但在对视频进行分类时遇到了很多误报。 经过一些研究,我发现我需要在训练过程中添加负
我正在使用Ubuntu 14.04操作系统的g2.8xlarge EC-2实例上启用cuDNN的情况下运行py-faster-rcnn。一切都已编译,似乎工作正常。我通过以下方式登录到远程实例: ss
我正在 INRIA Person 数据集上训练 Faster-RCNN(VGG-16 架构)。我接受了 180,000 个训练步骤的训练。但是当我评估网络时,它会用相同的图像给出不同的结果。以下是图片
我正在尝试使用 RCNN 在我自己的数据集上执行对象检测,遵循 the tutorial on Matlab webpage .基于下图: 我应该将图像路径放在第一列中,将每个对象的边界框放在后面的列
我按照本教程进行对象检测: https://pytorch.org/tutorials/intermediate/torchvision_tutorial.html 及其包含以下 train_one_
我正在尝试在自定义数据集上训练 Mask RCNN 模型。我用于测试的数据集是来自 https://github.com/experiencor/kangaroo 的袋鼠数据集。我基本上是在遵循这个例
我正在研究使用 PyTorch 进行文本分类的 RCNN 实现。 Full Code .有两点使用 permute 函数置换张量的维度。第一个是在 LSTM 层之后和 tanh 之前。第二个是在线性层
我正在使用 Matterport 存储库在自定义数据集上训练 MASK RCNN。我在训练中取得了成功。现在我想保存经过训练的模型并在 Web 应用程序中使用它来检测对象。训练后如何保存mask rc
论文中已经明确提到 分类和回归 损失与 Faster RCNN 中的 RPN 网络相同。有人可以解释一下 Mask Loss 函数吗?使用FCN如何改进? 最佳答案 FCN 使用每像素 softmax
我目前正在使用从 pytorch 预训练的 Faster-RCNN 模型(如在 torchvision tutorial 中)的迁移学习在自定义数据集上进行对象检测。 我想在每个时期结束时计算验证损失
有人实现了 FRCNN for TensorFlow 版本吗?我找到了一些相关的仓库如下: Implement roi pool layer Implement fast RCNN based on
关闭。这个问题不满足Stack Overflow guidelines .它目前不接受答案。 想改善这个问题吗?更新问题,使其成为 on-topic对于堆栈溢出。 上个月关闭。 Improve thi
我一直在玩Fast-RCNN一段时间,但仍然无法获得一些核心机制。 在教程幻灯片(http://tutorial.caffe.berkeleyvision.org/caffe-cvpr15-detec
我正在尝试理解快速(呃)RCNN,以下是我正在寻找的问题: 为了训练 FastRcnn 模型,我们是否必须给出边界框训练阶段的信息。 如果您必须提供接线盒信息,那么它的作用是什么ROI 层。 我们可以
我正在使用 fast-rcnn 并尝试为新类(标签)训练系统我跟着这个:https://github.com/EdisonResearch/fast-rcnn/tree/master/help/tra
我希望只使用一个类,人(连同 BG,背景)来进行 Mask RCNN 对象检测。我正在使用此链接:https://github.com/matterport/Mask_RCNN运行掩码 rcnn。有没
我正在看论文 https://research.fb.com/wp-content/uploads/2017/08/maskrcnn.pdf来自 Facebook 研究。 Mask RCNN 基于检测
我是一名优秀的程序员,十分优秀!