gpt4 book ai didi

python - 从仿射变换矩阵生成 pytorch 的 theta

转载 作者:行者123 更新时间:2023-12-04 01:25:40 25 4
gpt4 key购买 nike

我正在尝试使用 pytorch 在 3D 体积上执行刚性 + 比例变换,但我似乎无法理解 torch.nn.functional.affine_grid 所需的 theta 是如何工作的。

我有一个大小为 (1,4,4) 的变换矩阵,它是通过将矩阵 Translation * Scale * Rotation 相乘而生成的。例如,如果我在 scipy.ndimage.affine_transform 中使用这个矩阵,它就没有问题。但是,相同的矩阵(裁剪为 (1,3,4) 的大小)在使用 torch.nn.functional.affine_grid 时完全失败。

我已经设法理解翻译是如何工作的(范围 -1 到 1),并且我已经通过简单地将值归一化到该范围来确认翻译矩阵的工作原理。至于另外两个,我迷路了。

我尝试单独使用基本的缩放矩阵(如下)作为最基本的比较,但 pytorch 的结果与 scipy 的结果不同

Scaling = 
[[0.75, 0, 0, 0],
[[0, 0.75, 0, 0],
[[0, 0, 0.75, 0],
[[0, 0, 0, 1]]

如何将 (1,4,4) 仿射矩阵转换为与 torch.nn.functional.affine_grid 相同的工作?或者,有没有办法根据变换参数(移位、欧拉角、缩放)生成正确的矩阵?

最佳答案

对于将来遇到类似问题的任何人,scipy 与 pytorch 仿射变换的问题在于 scipy 在 (0, 0, 0) 附近应用变换,而 pytorch 在图像/体积的中间应用它。

例如,让我们取参数:

euler_angles = [ea0, ea1, ea2]
translation = [tr0, tr1, tr2]
scale = [sc0, sc1, sc2]

并创建以下变换矩阵:
# Rotation matrix
R_x(ea0, ea1, ea2) = np.array([[1, 0, 0, 0],
[0, math.cos(ea0), -math.sin(ea0), 0],
[0, math.sin(ea0), math.cos(ea0), 0],
[0, 0, 0, 1]])

R_y(ea0, ea1, ea2) = np.array([[math.cos(ea1), 0, math.sin(ea1), 0],
[0, 1, 0, 0],
[-math.sin(ea1), 0, math.cos(ea1)], 0],
[0, 0, 0, 1]])

R_z(ea0, ea1, ea2) = np.array([[math.cos(ea2), -math.sin(ea2), 0, 0],
[math.sin(ea2), math.cos(ea2), 0, 0],
[0, 0, 1, 0],
[0, 0, 0, 1]])

R = R_x.dot(R_y).dot(R_z)

# Translation matrix
T(tr0, tr1, tr2) = np.array([[1, 0, 0, -tr0],
[0, 1, 0, -tr1],
[0, 0, 1, -tr2],
[0, 0, 0, 1]])
# Scaling matrix
S(sc0, sc1, sc2) = np.array([[1/sc0, 0, 0, 0],
[0, 1/sc1, 0, 0],
[0, 0, 1/sc2, 0],
[0, 0, 0, 1]])

如果您有一个大小为 (100, 100, 100) 的体积,则围绕体积中心的 scipy 变换需要先将体积中心移动到 (0, 0, 0),然后再将其移动回 (50, 50, 50) 在应用了 S、T 和 R 之后。定义:
T_zero = np.array([[1, 0, 0, 50],
[0, 1, 0, 50],
[0, 0, 1, 50],
[0, 0, 0, 1]])

T_centre = np.array([[1, 0, 0, -50],
[0, 1, 0, -50],
[0, 0, 1, -50],
[0, 0, 0, 1]])

围绕中心的 scipy 变换是:
transform_scipy_centre = T_zero.dot(T).dot(S).dot(R).T_centre

在pytorch中,参数有一些细微的差异。

转换定义在 -1 和 1 之间。它们的顺序也不同。以相同的(100, 100, 100)卷为例,pytorch中的翻译参数由下式给出:
# Note the order difference
translation_pytorch = =[tr0_p, tr1_p, tr2_p] = [tr0/50, tr2/50, tr1/50]
T_p = T(tr0_p, tr1_p, tr2_p)

比例参数的顺序不同:
scale_pytorch = [sc0_p, sc1_p, sc2_p] = [sc2, sc0, sc1]
S_p = S(sc0_p, sc1_p, sc2_p)

欧拉角是最大的区别。要获得等效变换,首先参数为负且顺序不同:
# Note the order difference
euler_angles_pytorch = [ea0_p, ea1_p, ea2_p] = [-ea0, -ea2, -ea1]
R_x_p = R_x(ea0_p, ea1_p, ea2_p)
R_y_p = R_y(ea0_p, ea1_p, ea2_p)
R_z_p = R_z(ea0_p, ea1_p, ea2_p)

计算旋转矩阵的顺序也不同:
# 注意顺序差异
R_p = R_x_p.dot(R_z_p).dot(R_y_p)

考虑到所有这些因素,scipy 转换为:
transform_scipy_centre = T_zero.dot(T).dot(S).dot(R).T_centre

相当于 pytorch 变换:
transform_pytorch = T_p.dot(S_p).dot(R_p)

我希望这有帮助!

关于python - 从仿射变换矩阵生成 pytorch 的 theta,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/61964914/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com