- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
我尝试制作简单的AR程序。
我使用 Aruco(OpenCV) 和 OpenGL,但我的程序有点错误。
当我移动相机时,立方体移动并绘制错误的位置。
我上传示例图片
] 1
和
] 2 .
我希望立方体总是绘制在标记的中心。
我的所有来源都在下面。我使用 Python3。
#coding: utf-8
from OpenGL.GL import *
from OpenGL.GLU import *
from OpenGL.GLUT import *
import cv2
import numpy as np
import time
USE_CAMERA = True
# Set AR
aruco = cv2.aruco
dictionary = aruco.getPredefinedDictionary(aruco.DICT_4X4_50)
#load camera parameter
mtx = np.loadtxt("mtx.csv",delimiter=",")
dist = np.loadtxt("dist.csv",delimiter=",")
alpha = mtx[0][0]
beta = mtx[1][1]
cx = mtx[0][2]
cy = mtx[1][2]
if USE_CAMERA:
# USB camera setup
cap = cv2.VideoCapture(0)
if cap.isOpened() is False:
raise("IO Error")
cap.set(cv2.CAP_PROP_FPS, 30)
cap.set(cv2.CAP_PROP_FRAME_WIDTH, 640)
cap.set(cv2.CAP_PROP_FRAME_HEIGHT, 480)
windowWidth = 640
windowHeight = 480
def draw():
if USE_CAMERA:
ret, img = cap.read() #read camera image
else:
img = cv2.imread('testimg.jpg') # if use the image file
# Aruco
corners, ids, rejectedImgPoints = aruco.detectMarkers(img, dictionary)
rvec, tvec, _objPoints = aruco.estimatePoseSingleMarkers(corners, 8.0, mtx, dist)
if not ids is None:
# draw axis and center circle
p1 = corners[0][0][2]
p2 = corners[0][0][1]
p3 = corners[0][0][0]
p4 = corners[0][0][3]
s1 = ((p4[0] - p2[0])*(p1[1] - p2[1]) - (p4[1] - p2[1])*(p1[0] - p2[0])) / 2
s2 = ((p4[0] - p2[0])*(p2[1] - p3[1]) - (p4[1] - p2[1])*(p2[0] - p3[0])) / 2
c1x = p1[0] + (p3[0] - p1[0]) * s1 / (s1 + s2)
c1y = p1[1] + (p3[1] - p1[1]) * s1 / (s1 + s2)
cv2.circle(img,(int(c1x), int(c1y)),10,(0,0,1))
aruco.drawAxis(img, mtx, dist, rvec[0], tvec[0], 8.0)
img= cv2.cvtColor(img,cv2.COLOR_BGR2RGB) #BGR-->RGB
h, w = img.shape[:2]
glTexImage2D(GL_TEXTURE_2D, 0, GL_RGB, w, h, 0, GL_RGB, GL_UNSIGNED_BYTE, img)
## Enable / Disable
glDisable(GL_DEPTH_TEST) # Disable GL_DEPTH_TEST
glDisable(GL_LIGHTING) # Disable Light
glDisable(GL_LIGHT0) # Disable Light
glEnable(GL_TEXTURE_2D) # Enable texture map
## init
glClear(GL_COLOR_BUFFER_BIT | GL_DEPTH_BUFFER_BIT) # Clear Buffer
glColor3f(1.0, 1.0, 1.0) # Set texture Color(RGB: 0.0 ~ 1.0)
glTexParameteri(GL_TEXTURE_2D, GL_TEXTURE_MIN_FILTER, GL_LINEAR)
glTexParameteri(GL_TEXTURE_2D, GL_TEXTURE_MAG_FILTER, GL_LINEAR)
## draw background
glMatrixMode(GL_PROJECTION)
glLoadIdentity()
glPushMatrix()
glBegin(GL_QUADS)
glTexCoord2d(0.0, 1.0)
glVertex3d(-1.0, -1.0, 0)
glTexCoord2d(1.0, 1.0)
glVertex3d( 1.0, -1.0, 0)
glTexCoord2d(1.0, 0.0)
glVertex3d( 1.0, 1.0, 0)
glTexCoord2d(0.0, 0.0)
glVertex3d(-1.0, 1.0, 0)
glEnd()
glPopMatrix()
## Enable / Disable
glEnable(GL_DEPTH_TEST) # Enable GL_DEPTH_TEST
glEnable(GL_LIGHTING) # Enable Light
glEnable(GL_LIGHT0) # Enable Light
glDisable(GL_TEXTURE_2D) # Disable texture map
## make projection matrix
f = 1000.0 #far
n = 1.0 #near
m1 = np.array([
[(alpha)/cx, 0, 0, 0],
[0, beta/cy, 0, 0],
[0, 0, -(f+n)/(f-n), (-2.0*f*n)/(f-n)],
[0,0,-1,0],
])
glLoadMatrixd(m1.T)
## draw cube
glMatrixMode(GL_MODELVIEW)
glLoadIdentity()
glPushMatrix() #projection Push(?)
glMaterialfv(GL_FRONT_AND_BACK, GL_AMBIENT_AND_DIFFUSE, [0.0,0.0,1.0,1.0])
if not ids is None:
# fix axis
tvec[0][0][0] = tvec[0][0][0]
tvec[0][0][1] = -tvec[0][0][1]
tvec[0][0][2] = -tvec[0][0][2]
rvec[0][0][1] = -rvec[0][0][1]
rvec[0][0][2] = -rvec[0][0][2]
m = compositeArray(cv2.Rodrigues(rvec)[0], tvec[0][0])
glPushMatrix()
glLoadMatrixd(m.T)
glTranslatef(0, 0, -0.5)
glutSolidCube(1.0)
glPopMatrix()
glPopMatrix() #projection POP(?)
glFlush();
glutSwapBuffers()
def compositeArray(rvec, tvec):
v = np.c_[rvec, tvec.T]
#print(v)
v_ = np.r_[v, np.array([[0,0,0,1]])]
return v_
def init():
#glClearColor(0.7, 0.7, 0.7, 0.7)
glClearColor(0.0, 0.0, 0.0, 1.0)
glEnable(GL_DEPTH_TEST)
glEnable(GL_LIGHTING)
glEnable(GL_LIGHT0)
def idle():
glutPostRedisplay()
def reshape(w, h):
glViewport(0, 0, w, h)
glLoadIdentity()
glOrtho(-w / windowWidth, w / windowWidth, -h / windowHeight, h / windowHeight, -1.0, 1.0)
def keyboard(key, x, y):
# convert byte to str
key = key.decode('utf-8')
if key == 'q':
print('exit')
sys.exit()
if __name__ == "__main__":
glutInitWindowPosition(0, 0);
glutInitWindowSize(windowWidth, windowHeight);
glutInit(sys.argv)
glutSetOption(GLUT_ACTION_ON_WINDOW_CLOSE, GLUT_ACTION_GLUTMAINLOOP_RETURNS);
glutInitDisplayMode(GLUT_RGBA | GLUT_DOUBLE | GLUT_DEPTH)
glutCreateWindow(b"Display")
glutDisplayFunc(draw)
glutReshapeFunc(reshape)
glutKeyboardFunc(keyboard)
init()
glutIdleFunc(idle)
glutMainLoop()
投影矩阵引用here .
我的相机参数是,
dist.csv:
-1.034e-02, -5.17e-01, 3.512e-03, -4.767e-03, 1.831e+00
mtx.csv:
6.677e+02, 0.000e+00, 2.984e+02
0.000e+00, 6.915e+02, 2.375e+02
0.000e+00, 0.000e+00, 1.000e+00
怎么了?
附注
我明白我的投影矩阵是错误的。
所以,我改变了投影矩阵,但立方体仍然存在错误的位置。 ;(
我想我需要一些 tvec 系数,你怎么看?错误视频是here .
最佳答案
您的矩阵计算在数学上是正确的,但实际上是错误的。
参见 OpenGL 2.0 API Specification; 2.11. COORDINATE TRANSFORMATIONS; page 43
LoadMatrix takes a pointer to a 4 × 4 matrix stored in column-major order as 16 consecutive floating-point values, i.e. as
[ a1 a5 a9 a13
a2 a6 a10 a14
a3 a7 a11 a15
a4 a8 a12 a16 ](This differs from the standard row-major C ordering for matrix elements. If the standard ordering is used, all of the subsequent transformation equations are transposed, and the columns representing vectors become rows.)
这意味着透视投影矩阵必须像这样设置:
r = right, l = left, b = bottom, t = top, n = near, f = far
2*n/(r-l) 0 0 0
0 2*n/(t-b) 0 0
(r+l)/(r-l) (t+b)/(t-b) -(f+n)/(f-n) -1
0 0 -2*f*n/(f-n) 0
转置投影矩阵解决问题:
m1 = np.array([
[(alpha)/cx, 0, 0, 0 ],
[0, beta/cy, 0, 0 ],
[0, 0, -(f+n)/(f-n), -1],
[0, 0, (-2.0*f*n)/(f-n), 0 ],
])
glLoadMatrixd(m1.T)
或者 glLoadTransposeMatrix
可以代替 glLoadMatrix
使用。 glLoadTransposeMatrix
用指定的行优先有序矩阵替换当前矩阵:
m1 = np.array([
[(alpha)/cx, 0, 0, 0 ],
[0, beta/cy, 0, 0 ],
[0, 0, -(f+n)/(f-n), (-2.0*f*n)/(f-n)],
[0, 0, -1, 0 ],
])
glLoadTransposeMatrixd(m1.T)
同样的错误存在,当你设置模型 View 矩阵时。像这样更改您的代码:
m = compositeArray(cv2.Rodrigues(rvec)[0], tvec[0][0])
.....
glLoadTransposeMatrixd(m.T)
关于python - 对象在 AR (Aruco + OpenGL) 中错位,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50764623/
我正在处理一组标记为 160 个组的 173k 点。我想通过合并最接近的(到 9 或 10 个组)来减少组/集群的数量。我搜索过 sklearn 或类似的库,但没有成功。 我猜它只是通过 knn 聚类
我有一个扁平数字列表,这些数字逻辑上以 3 为一组,其中每个三元组是 (number, __ignored, flag[0 or 1]),例如: [7,56,1, 8,0,0, 2,0,0, 6,1,
我正在使用 pipenv 来管理我的包。我想编写一个 python 脚本来调用另一个使用不同虚拟环境(VE)的 python 脚本。 如何运行使用 VE1 的 python 脚本 1 并调用另一个 p
假设我有一个文件 script.py 位于 path = "foo/bar/script.py"。我正在寻找一种在 Python 中通过函数 execute_script() 从我的主要 Python
这听起来像是谜语或笑话,但实际上我还没有找到这个问题的答案。 问题到底是什么? 我想运行 2 个脚本。在第一个脚本中,我调用另一个脚本,但我希望它们继续并行,而不是在两个单独的线程中。主要是我不希望第
我有一个带有 python 2.5.5 的软件。我想发送一个命令,该命令将在 python 2.7.5 中启动一个脚本,然后继续执行该脚本。 我试过用 #!python2.7.5 和http://re
我在 python 命令行(使用 python 2.7)中,并尝试运行 Python 脚本。我的操作系统是 Windows 7。我已将我的目录设置为包含我所有脚本的文件夹,使用: os.chdir("
剧透:部分解决(见最后)。 以下是使用 Python 嵌入的代码示例: #include int main(int argc, char** argv) { Py_SetPythonHome
假设我有以下列表,对应于及时的股票价格: prices = [1, 3, 7, 10, 9, 8, 5, 3, 6, 8, 12, 9, 6, 10, 13, 8, 4, 11] 我想确定以下总体上最
所以我试图在选择某个单选按钮时更改此框架的背景。 我的框架位于一个类中,并且单选按钮的功能位于该类之外。 (这样我就可以在所有其他框架上调用它们。) 问题是每当我选择单选按钮时都会出现以下错误: co
我正在尝试将字符串与 python 中的正则表达式进行比较,如下所示, #!/usr/bin/env python3 import re str1 = "Expecting property name
考虑以下原型(prototype) Boost.Python 模块,该模块从单独的 C++ 头文件中引入类“D”。 /* file: a/b.cpp */ BOOST_PYTHON_MODULE(c)
如何编写一个程序来“识别函数调用的行号?” python 检查模块提供了定位行号的选项,但是, def di(): return inspect.currentframe().f_back.f_l
我已经使用 macports 安装了 Python 2.7,并且由于我的 $PATH 变量,这就是我输入 $ python 时得到的变量。然而,virtualenv 默认使用 Python 2.6,除
我只想问如何加快 python 上的 re.search 速度。 我有一个很长的字符串行,长度为 176861(即带有一些符号的字母数字字符),我使用此函数测试了该行以进行研究: def getExe
list1= [u'%app%%General%%Council%', u'%people%', u'%people%%Regional%%Council%%Mandate%', u'%ppp%%Ge
这个问题在这里已经有了答案: Is it Pythonic to use list comprehensions for just side effects? (7 个答案) 关闭 4 个月前。 告
我想用 Python 将两个列表组合成一个列表,方法如下: a = [1,1,1,2,2,2,3,3,3,3] b= ["Sun", "is", "bright", "June","and" ,"Ju
我正在运行带有最新 Boost 发行版 (1.55.0) 的 Mac OS X 10.8.4 (Darwin 12.4.0)。我正在按照说明 here构建包含在我的发行版中的教程 Boost-Pyth
学习 Python,我正在尝试制作一个没有任何第 3 方库的网络抓取工具,这样过程对我来说并没有简化,而且我知道我在做什么。我浏览了一些在线资源,但所有这些都让我对某些事情感到困惑。 html 看起来
我是一名优秀的程序员,十分优秀!