gpt4 book ai didi

python - 如何将 2D 边界框像素坐标 (x, y, w, h) 转换为相对坐标(Yolo 格式)?

转载 作者:行者123 更新时间:2023-12-04 14:10:37 25 4
gpt4 key购买 nike

嗨!我正在通过在线平台注释图像数据,该平台正在生成如下输出坐标: bbox":{"top":634,"left":523,"height":103,"width":145} 但是,我想用这个注解来训练 Yolo。所以,我必须转换它yolo 格式如下: 4 0.838021 0.605556 0.177083 0.237037
在这方面,我需要有关如何转换它的帮助。

最佳答案

这里,
对于需要传递的大小 (w,h) 和需要传递的框 (x,x+w, y, y+h)
https://github.com/ivder/LabelMeYoloConverter/blob/master/convert.py

def convert(size, box):
dw = 1./size[0]
dh = 1./size[1]
x = (box[0] + box[1])/2.0
y = (box[2] + box[3])/2.0
w = box[1] - box[0]
h = box[3] - box[2]
x = x*dw
w = w*dw
y = y*dh
h = h*dh
return (x,y,w,h)
或者,您可以在下面使用
def convert(x,y,w,h):
dw = 1.0/w
dh = 1.0/h
x = (2*x+w)/2.0
y = (2*y+w)/2.0
x = x*dw
y = y*dh
w = w*dw
h = h*dh
return (x,y,w,h)
每个网格单元预测 B 个边界框以及 C 类概率。边界框预测有 5 个分量:(x、y、w、h、置信度)。 (x, y) 坐标表示框的中心,相对于网格单元的位置(请记住,如果框的中心不在网格单元内,则该单元不对其负责)。这些坐标被归一化为介于 0 和 1 之间。 (w, h) 框尺寸也被归一化为 [0, 1],相对于图像大小。让我们看一个例子:
What does the coordinate output of yolo algorithm represent?

关于python - 如何将 2D 边界框像素坐标 (x, y, w, h) 转换为相对坐标(Yolo 格式)?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/64634300/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com