- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我问这个问题是我之前 question 的精简版.现在我有一张脸看着屏幕上的某个位置,还有双眼的注视坐标(俯仰和偏航)。让我们说
左眼 = [-0.06222888 -0.06577308]
右眼 = [-0.04176027 -0.44416167]
我想确定这个人可能正在看的屏幕坐标?这可能吗?请帮忙!
最佳答案
你需要的是:
每只眼睛的 3D 位置和方向
你声称你明白了,但俯仰和偏航只是欧拉角,你还需要一些引用系和变换顺序才能将它们转换回 3D vector 。最好以 vector 形式留下方向(我怀疑你首先得到了)。除了方向,您还需要在同一坐标系中的 3D 位置...
投影平面的 3D 定义
因此您至少需要起始位置和 2 个定义平面矩形的基 vector 。更好的是使用 4x4 homogenous transform matrix为此,因为这允许非常容易地从本地坐标系转换到本地坐标系...
所以我是这样看的:
所以现在只需要找到射线和平面之间的交点
P(s) = R0 + s*R
P(t) = L0 + t*L
P(u,v) = P0 + u*U +v*V
解决这个系统将导致获取 u,v
这也是您正在查看的平面内的 2D 坐标。当然,由于不准确,这将无法通过代数求解。因此,最好将光线转换为平面局部坐标,并使用 w=0.0
计算每条光线上的点(使其成为具有单个未知数的简单线性方程)并计算左眼之间的平均位置另一只用于右眼(以防它们没有完全对齐)。
所以如果 R0',R',L0',L'
是 UVW 局部坐标中的转换值,则:
R0z' + s*Rz' = 0.0
s = -R0z'/Rz'
// so...
R1 = R0' - R'*R0z'/Rz'
L1 = L0' - L'*L0z'/Lz'
P = 0.5 * (R1 + L1)
P
是您在 UVW 坐标中查看的点...
转换很容易根据您的符号完成,您可以将表示平面的逆矩阵或直接矩阵乘以 (R,1),(L,1),(R0,0)(L0,0)
。第四个坐标 (0,1
) 只是告诉您是在变换 vector 还是点。
如果不了解更多关于您的坐标系、数据准确性以及您获得的已知和未知的信息,很难比这更具体。
如果您的平面是相机投影平面,那么 U,V
是从相机拍摄的图像的 x 轴和 y 轴,W 垂直于它(方向只是符号的问题)。
当您使用使用透视投影的相机输入时,我希望您的位置和 vector 已针对它进行了校正。
关于python - 将 Eye Gaze(俯仰和偏航)转换为屏幕坐标(人在看哪里?),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52940347/
我正在运行 Gaze ( https://github.com/shama/gaze ) 来观察几个包含数百个文件的文件夹的变化。现在,该进程稳定消耗 15% 的 CPU,这意味着四个核心中只有一个完
我使用 Psychopy/iohub 和 Tobii TX300 眼动仪记录了注视数据。加载 hdf5 文件会在 BinlingualEyeSampleEvent 中显示以下条目: ['experim
我问这个问题是我之前 question 的精简版.现在我有一张脸看着屏幕上的某个位置,还有双眼的注视坐标(俯仰和偏航)。让我们说 左眼 = [-0.06222888 -0.06577308] 右眼 =
我用自己的 UI 文本按钮修改了 Google Cardboard DemoScene。默认情况下,这些按钮响应 Onclick() 或点击事件以触发操作。我想在用户注视对象 2 秒时触发这些操作。
我是一名优秀的程序员,十分优秀!