javascript - 如何将 Darknet 标签文件转换为常规 x,y,w,h？-6ren

javascript - 如何将 Darknet 标签文件转换为常规 x,y,w,h？

转载作者：行者123 更新时间：2023-11-28 03:35:40

24

4

很抱歉在这里问这个问题，但我已经研究了好几天了，但我不知道该使用什么公式。我希望有人知道我能做什么，谢谢!

所以我试图为暗网制作一个 GUI 工具，但前面显示的小方 block 位置错误。

图像尺寸:1024 x 683标签文件中的注释行:0 0.6681250000000001 0.510788 0.09750000000000003 0.15103200000000006

我正在尝试像这样得到x,y,w,h

    var convertDarknetImageLabelsToMatrices = function(loadedImage){
        // loadedImage = {
        //     annotation: "0 0.6681250000000001 0.510788 0.09750000000000003 0.15103200000000006",
        //     dimensions: {
        //         height: 683,
        //         width: 1024
        //     }
        // }
            var width = loadedImage.dimensions.width
            var height = loadedImage.dimensions.height
            var matrices = []
            var labels = loadedImage.annotation.split('\n')
            labels.forEach(function(label){
                if(!label)return
                var lineParts = label.split(' ')
                var classNumber = lineParts[0]
                var x = lineParts[1] * width / 2
                var y = lineParts[2] * height / 2
                var w = lineParts[3] * width
                var h = lineParts[4] * height
                matrices.push({
                    classNumber: classNumber,
                    tag: loadedImage.className,
                    x: x,
                    y: y,
                    w: w,
                    h: h,
                    imageWidth: width,
                    imageHeight: height
                })
            })
            return matrices
    }

解析部分是

                var x = lineParts[1] * width / 2
                var y = lineParts[2] * height / 2
                var w = lineParts[3] * width
                var h = lineParts[4] * height

我添加了 /2 因为它看起来更接近。在某些图像上，它在单个轴上几乎是精确的，例如 X 会对齐，但 Y 会偏离很远。我试图找出一个静态公式，但每当打开另一个图像时，它总是在其他方向上关闭。

训练本身很好，我只是无法稍后在 UI 中编辑/查看这些框:(

谢谢!如果您需要更多信息，请告诉我!

最佳答案

感谢所有查看并考虑回答的人。我刚刚想通了!这是我需要用于解析的内容。

                var w = lineParts[3] * width
                var h = lineParts[4] * height
                var x = (lineParts[1] * width) - w / 2
                var y = (lineParts[2] * height) - h / 2

关于javascript - 如何将 Darknet 标签文件转换为常规 x,y,w,h？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/57764459/

24

4

0

文章推荐： javascript - 无法摆脱 this.tech.isReady is null or not an object

文章推荐： html - Firefox 无法正确显示表格单元格

python - x,y = y,y+x 和 x=y , y=x+y 之间有什么区别？
我刚刚编写了这些代码，但输出不同。第二个代码的输出符合我的预期，但第一个代码的输出不正确。但为什么呢？ def fib(n): x = 0 y = 1 print x
c - #define如何工作？多维数据集(y)y *(y * y)的奇怪结果
#include #include #define CUBE(y)y*(y*y) main() { int j; j = CUBE(-2+4);
python - 这个表达式是做什么的 : (x, y) = (y, x % y)？
这个问题在这里已经有了答案: Multiple assignment and evaluation order in Python (11 个答案) 关闭 1 年前。我看到下面的代码，但不知道它做
haskell - Eq typeclass函数: x == y = not (x/= y) x/= y = not (x == y) work?怎么实现
我正在阅读 book , 并讲了 typeclass Eq 的定义有两个功能== , /=在等式中，它们被实现为: x == y = not (x /= y) x /= y = not (
c++ - 这个方程如何 x + y = x & y + x | y 成立(假设 x, y > 0)？
我最近参加了一个代码力量竞赛。在比赛的编辑部分，我看到了按位运算符之间的一种美妙关系，即 x + y = x & y + x |是的我还不知道证据。我拿了几个数字来看看这个等式是否正确。我很高兴知道这
ios - 将 CGRectMake (x,x,x,x) 更改为不同的位置，例如 (y,y,y,y)
我使用 CGRectMake(x,x,x,x) 在我的 View 中放置了一个按钮，当然 x 是位置和大小。当我使用 -(BOOL)shouldAutoRotate... 旋转 View 时，我想将按
javascript - this.shift = {x :this. x, y :this. y} 有效但 this.shift.x = this.x 和 this.shift.y = this.y?
this.x = (Math.random()*canvasWidth); this.y = (Math.random()*canvasHeight); (1) this.shift = {x: th
Python 组合条件运算符 : if AA in Y or BB in Y and not B in Y
我想将此代码运行为“if 'Britain' or 'UK' in string do stuff, but don't do stuff if "Ex UK" 在字符串中": #Case insen
algorithm - 三个正数 x、y、z 的组合，使得 x + y、x - y、y + z、y - z、x + z 和 x - z 是完全平方数
早上好，我是新来的，我带来了一个小问题。我无法针对以下问题开发有效的算法:我需要找到三个正数 x、y 和 z 的组合，以便 x + y、x - y、y + z、y - z、x + z 和 x - z
scheme - (define (add x y) (+ x y)) 和 (define add (lambda (x y) (+ x y))) 有什么区别？
我现在正在使用 C++ 编写方案的解释器。我有一个关于定义和 lambda 的问题。 (define (add x y) (+ x y)) 扩展为 (define add (lambda (x y)
通过 FTP 上传 PHP - ftp_put() 我不会打开到 x.x.x.x 的连接(仅到 y.y.y.y)
我正在尝试使用一台主机通过 FTP 将内容上传到另一台主机。 “我不会打开到 172.xxx.xxx.xxx(仅到 54.xxx.xxx.xxx)的连接”甚至不相关，因为我没有连接到那个主持人。这是托
python - 解包 : [x, y], (x,y), x,y - 有什么区别？
在 Python 中，使用 [] 解包函数调用有什么区别？ , 与 ()还是一无所有？ def f(): return 0, 1 a, b = f() # 1 [a, b] = f() # 2
python - 从两个曲面的交点求方程 y = y(x) z = z(x,y)
给定方程 z = z(x,y) 2 个表面 I和 II : z_I(x, y) = a0 + a1*y + a2*x + a3*y**2 + a4*x**2 + a5*x*y z_II(x, y)
java - 如何使用 "x <= y && x >= y && x != y"使循环无限？
几年前我有这个面试问题，但我还没有找到答案。 x 和 y 应该是什么才能形成无限循环？ while (x = y && x != y) { } 我们尝试了 Nan,infinity+/-,null f
java - 如何处理Camel FTP的 "Host attempting data connection x.x.x.x is not the same as server y.y.y.y"错误？
我正在尝试使用 Camel FTP Producer 将文件发送到第三方 ftp 服务器(似乎由 Amazon 托管)，但遇到了一个问题，写入文件失败，并显示:文件操作失败...主机尝试数据连接 x.
algorithm - 了解用于查找数字 x 和 y(小于 n)的排列的代码，使得 x*y 是一个完美的平方并且 y -x 是最大值(x < y)
关闭。这个问题需要details or clarity .它目前不接受答案。想改进这个问题吗？通过 editing this post 添加细节并澄清问题. 关闭 8 年前。 Improve t
python-3.x - Y 和 *Y 之间有什么区别吗，其中 Y 是用作输入参数的列表？
我正在使用 torch.tensor.repeat() x = torch.tensor([[1, 2, 3], [4, 5, 6]]) period = x.size(1) repeats = [1
c - 为什么 (x-(x/y)*y) 的计算结果与 x%y 相同？
#include int main() { int x = 9; int y = 2; int z = x - (x / y) * y; printf("%d", z
c - #define FUNC(x,y) x=^y; y^x;在c中
我很难理解先有定义然后有两个异或表达式的含义。这个定义的作用是什么？我尝试发送 x=8, y=7，结果是 x=15 和 y=8为什么会这样？这是程序: #define FUNC(a,b) a^=b
c - 使用 SSE (x*x*x)+(y*y*y) 的乘法
我正在尝试使用 SIMD 优化此功能，但我不知道从哪里开始。 long sum(int x,int y) { return x*x*x+y*y*y; } 反汇编函数如下所示: 4007a0

首页

博学

6Ren·AI

商城

javascript - 如何将 Darknet 标签文件转换为常规 x,y,w,h？