旋转矩阵与四元数

旋转矩阵的性质

$R^{T} = R^{- 1}$
$R \in S O (3)$
$det (R) = 1$
$R$ 的各行、各列相互正交，且都是单位向量

用旋转矩阵表示坐标变换

点/向量坐标变换：

p^{0} = R_{1}^{0} p^{1}

线性变换的坐标变换：

T^{1} = (R_{1}^{0})^{- 1} T^{0} R_{1}^{0}

Tips

这个变换在线性代数里面叫做相似变换，其几何意义就是在不同坐标系下对同一矩阵（线性变换）的不同表示。

Important

特殊地，线性变换 $T$ 可以是以一个旋转矩阵来描述的旋转运动，由此就得到了旋转运动在不同坐标系下的变换：

R^{1} = (R_{1}^{0})^{- 1} R^{0} R_{1}^{0}

旋转的叠加

绕随动坐标系的叠加：根据叠加的顺序，依次右乘旋转矩阵
绕固定坐标系的叠加：根据叠加的顺序，依次左乘旋转矩阵

证明

记绕固定坐标系的旋转为 $R$ ，则 $R_{2}^{0} = R_{1}^{0} ((R_{1}^{0})^{- 1} R R_{1}^{0}) = R R_{1}^{0}$

旋转的转轴-角度表示

可以证明，三维刚体的任意旋转及其叠加，都可以用一个转轴（方向向量）和绕这个轴的旋转角度表示。记转轴 $\vec{k} = [k_{x} k_{y} k_{z}]^{T}$ ，角度为 $θ$ ，则

R_{\vec{k}, θ} = [\begin{matrix} k_{x}^{2} v_{θ} + c_{θ} & k_{x} k_{y} v_{θ} - k_{z} s_{θ} & k_{x} k_{z} v_{θ} + k_{y} s_{θ} \\ k_{x} k_{y} v_{θ} + k_{z} s_{θ} & k_{y}^{2} v_{θ} + c_{θ} & k_{y} k_{z} v_{θ} - k_{x} s_{θ} \\ k_{x} k_{z} v_{θ} - k_{y} s_{θ} & k_{y} k_{z} v_{θ} + k_{x} s_{θ} & k_{z}^{2} v_{θ} + c_{θ} \end{matrix}]

其中 $c_{θ} = \cos θ$ ， $s_{θ} = \sin θ$ ， $v_{θ} = versine θ = 1 - \cos θ$ 。

Info

全部的三角函数

反过来，对旋转矩阵

R = [\begin{matrix} r_{11} & r_{12} & r_{13} \\ r_{21} & r_{22} & r_{23} \\ r_{31} & r_{32} & r_{33} \end{matrix}]

则有

θ = \arccos (\frac{tr (R) - 1}{2})

k = \frac{1}{2 \sin θ} [\begin{matrix} r_{32} - r_{23} \\ r_{13} - r_{31} \\ r_{21} - r_{12} \end{matrix}]

转轴和角度不是唯一的，绕一个方向旋转 $θ$ 等同于绕相反方向旋转 $- θ$ ：

R_{\vec{k}, θ} = R_{- \vec{k}, - θ}

四元数

定义： $i, j, k$ 是正交的三个虚数单位， $i^{2} = j^{2} = k^{2} = i j k = - 1$ ， $a, b, c, d \in R$ ，则
$q = a + b i + c j + d k$
也可以写成向量形式 $q = [a b c d]$ 或 $q = [a \vec{v}]$
加减法：实部和三个虚部分别运算
乘法：三个虚数单位的乘法关系为：
$\begin{aligned} i j & = k \\ j k & = i \\ k i & = j \\ x y & = - y x, x, y \in {i, j, k} \end{aligned}$
根据分配律和结合律可以写出乘法公式，但是那样太复杂了，比较简单的形式被称为Graßmann积:
$[s, \vec{u}] [t, \vec{v}] = [s t - \vec{u} \cdot \vec{v}, s \vec{v} + t \vec{u} + \vec{u} \times \vec{v}]$
纯四元数：实部为0的四元数称为纯四元数。性质：
- $[0, \vec{u}] [0, \vec{v}] = [- \vec{u} \cdot \vec{v}, \vec{u} \times \vec{v}]$
模： $| | [a b c d] | | = \sqrt{a^{2} + b^{2} + c^{2} + d^{2}}$
共轭： $q^{*} = [s, - \vec{v}]$ ， $q q^{*} = q^{*} q = | | q | |^{2}$ ， $q_{1}^{*} q_{2}^{*} = (q_{2} q_{1})^{*}$
逆： $q^{- 1} = q^{*} / | | q | |$ ，特殊地对于描述旋转的单位四元数，逆和共轭相等

四元数描述旋转

3D旋转公式：向量 $\vec{v}$ 绕旋转轴 $\vec{u}$ 旋转 $θ$ 角之后的向量 ${\vec{v}}^{'}$ 可以使用四元数乘法计算。令 $v = [0, \vec{v}]$ ， $q = [\cos (θ / 2), \sin (θ / 2) \vec{u}]$ ，则

v^{'} = q v q^{*} = q v q^{- 1}

$q v q^{*}$ 这个变换对 $v$ 平行于旋转轴的分量实施的变换是 $q q^{*}$ （无旋转），而正交于旋转轴的分量实施的变换是 $q^{2}$ （旋转 $θ / 2 + θ / 2$ ）。

四元数和旋转矩阵互相转化

四元数到旋转矩阵

对于一个单位四元数 $q = [a, \vec{v}]$ ，可以提取它对应的旋转角度和旋转轴：

θ = 2 \arccos (a)

\vec{k} = \frac{\vec{v}}{\sin (θ / 2)}

再根据前面旋转的转轴-角度表示一节的公式可以得到：

R = [\begin{matrix} 1 - 2 c^{2} - 2 d^{2} & 2 b c - 2 a d & 2 a c + 2 b d \\ 2 b c + 2 a d & 1 - 2 b^{2} - 2 d^{2} & 2 c d - 2 a b \\ 2 b d - 2 a c & 2 a b + 2 c d & 1 - 2 b^{2} - 2 c^{2} \end{matrix}]

旋转矩阵到四元数

算法二

在算法一基础上分类以避免数值不稳定，核心就是让作为分母的那一项比较大

当 $tr (R) > 0$
同算法一
当 $r_{11} > r_{22} + r_{33}$
$\begin{aligned} a & = \frac{r_{32} - r_{23}}{4 b} \\ b & = \frac{1}{2} \sqrt{1 + r_{11} - r_{22} - r_{33}} \\ c & = \frac{r_{12} + r_{21}}{4 b} \\ d & = \frac{r_{13} + r_{31}}{4 b} \end{aligned}$
当 $r_{22} > r_{11} + r_{33}$
$\begin{aligned} a & = \frac{r_{13} - r_{31}}{4 c} \\ b & = \frac{r_{12} + r_{21}}{4 c} \\ c & = \frac{1}{2} \sqrt{1 + r_{22} - r_{11} - r_{33}} \\ d & = \frac{r_{23} + r_{32}}{4 c} \end{aligned}$
当 $r_{33} > r_{11} + r_{22}$
$\begin{aligned} a & = \frac{r_{21} - r_{12}}{4 d} \\ b & = \frac{r_{13} + r_{31}}{4 d} \\ c & = \frac{r_{23} + r_{32}}{4 d} \\ d & = \frac{1}{2} \sqrt{1 + r_{33} - r_{11} - r_{22}} \end{aligned}$

算法三

来自^[1]，首先将旋转矩阵转化成 $K_{3}$ 矩阵：

K_{3} = \frac{1}{3} [\begin{matrix} r_{11} - r_{22} - r_{33} & r_{21} + r_{12} & r_{31} + r_{13} & r_{23} - r_{32} \\ r_{21} + r_{12} & r_{22} - r_{11} - r_{33} & r_{32} + r_{23} & r_{31} - r_{13} \\ r_{31} + r_{13} & r_{32} + r_{23} & r_{33} - r_{11} - r_{22} & r_{12} - r_{21} \\ r_{23} - r_{32} & r_{31} - r_{13} & r_{12} - r_{21} & r_{11} + r_{22} + r_{33} \end{matrix}]

这个矩阵只有一个特征向量 $\vec{q} = [b, c, d, a]^{T}$ ，特征值为1.

旋转的叠加（四元数版）

和旋转矩阵其实一样，当绕固定坐标系旋转时（或者理解为旋转刚体，坐标系不动），复合旋转的四元数是每个旋转的依次左乘：

v^{″} = q_{2} v^{'} q_{2}^{*} = (q_{2} q_{1}) v (q_{2} q_{1})^{*}

而当绕随动坐标系旋转时（或者理解为旋转坐标系，刚体不动），复合旋转的四元数是每个旋转依次右乘。

四元数的插值

四元数相比其他旋转表示方法的优点之一就是其插值较为容易。

旋转变化量

要计算两个旋转之间的变化量很简单：

Δ q = q_{1} q_{0}^{*}

如果将四元数看作四维空间的向量，那么 $q_{0} \cdot q_{1}$ 就是这个四维空间中两个向量夹角的余弦值，这个夹角正是三维空间中该旋转变化量角度的一半。

Nlerp

对Lerp的结果归一化为单位四元数就得到了正规化线性插值（Normalized Linear Interpolation）：

q_{t} = Nlerp (q_{0}, q_{1}, t) ≜ \frac{(1 - t) q_{0} + t q_{1}}{| | (1 - t) q_{0} + t q_{1} | |}

Nlerp在需要插值的角度较大时，角速度会显著变化，在 $t = 0.5$ 附近角速度最大，而在两端角速度较小。

Slerp

球面线性插值（Spherical Linear Interpolation）不是对向量插值而是对角度插值，因此它对角度是均匀的。根据四元数的幂定义可以很容易写出一个版本：

q_{t} = Slerp (q_{0}, q_{1}, t) = (q_{1} q_{0}^{*})^{t} q_{0}

可见当 $t = 0$ 时为 $q_{0}$ ，当 $t = 1$ 时为 $q_{1}$ 。但是这个公式中含有多次四元数乘法和幂运算，实际计算的效率很低。更高效的方法是：

θ = \arccos (q_{0} \cdot q_{1})

q_{t} = Slerp (q_{0}, q_{1}, t) = \frac{\sin ((1 - t) θ)}{\sin θ} q_{0} + \frac{\sin (t θ)}{\sin θ} q_{1}

实际应用中，当夹角很小时 $\sin θ$ 接近于0，就必须改用Nlerp来插值。

双倍覆盖

由于 $q$ 和 $- q$ 表示了相同的旋转，因此四元数空间其实是双倍覆盖了 $S O (3)$ 空间。而插值时对 $q$ 还是 $- q$ 进行插值，旋转的变化量是不同的。因此需要判断 $q_{0} \cdot q_{1}$ 是否为负数，如果是负数说明两个四元数在四维空间中的夹角是钝角，需要将其中一个四元数取反来得到最短的插值路径。

为了解决Slerp插值只实现 $C^{0}$ 连续，在轨迹点存在角速度突变的问题，以牺牲固定角速度为条件实现轨迹的 $C^{1}$ 连续，即角速度连续。Squad指Spherical and quadrangle，球面四边形插值，核心思想是利用Slerp来构建三次贝塞尔曲线。构造贝塞尔曲线有一个著名的递归算法de Casteljau算法，但是它的计算太复杂，对于三次贝塞尔曲线，它是三层一次插值的嵌套：

Bezier ({\vec{v}}_{0}, {\vec{v}}_{1}, {\vec{v}}_{2}, {\vec{v}}_{3}; t) = L (L (L ({\vec{v}}_{0}), {\vec{v}}_{1}; t), L ({\vec{v}}_{1}, {\vec{v}}_{2}; t); t), L (L ({\vec{v}}_{1}, {\vec{v}}_{2}; t), L ({\vec{v}}_{2}, {\vec{v}}_{3}; t); t); t)

其中 $L$ 是Lerp线性插值；对于四元数来说要换成Slerp插值。

而Quad使用一个二次插值和一个一次插值的嵌套来近似它：

Bezier ({\vec{v}}_{0}, {\vec{v}}_{1}, {\vec{v}}_{2}, {\vec{v}}_{3}; t) = L (L ({\vec{v}}_{0}, {\vec{v}}_{3}; t), L ({\vec{v}}_{1}, {\vec{v}}_{2}; t); 2 t (1 - t))

将Lerp换成Slerp就得到Squad插值：

S q u a d (q_{0}, q_{1}, q_{2}, q_{3}; t) = S (S (q_{0}, q_{3}; t), S (q_{1}, q_{2}; t); 2 t (1 - t))

对于四元数序列 $q_{0}, q_{1}, \dots, q_{n}$ ，对每一对四元数 $q_{i}, q_{i + 1}$ 都进行插值 $S q u a d (q_{i}, s_{i}, s_{i + 1}, q_{i + 1}; t)$ ，其中控制点 $s_{i}, s_{i + 1}$ 的选择使得切换点处可导，这里给出结果：

s_{i} = q_{i} \exp (- \frac{\log (q_{i}^{*} q_{i - 1}) + \log (q_{i}^{*} q_{i + 1})}{4})

Reference

https://doi.org/10.2514/2.4654 ↩︎

旋转矩阵与四元数

旋转矩阵与四元数

用旋转矩阵描述旋转

旋转矩阵的性质

用旋转矩阵表示坐标变换

旋转的叠加

旋转的转轴-角度表示

四元数

四元数描述旋转

四元数和旋转矩阵互相转化

四元数到旋转矩阵

旋转矩阵到四元数

算法一

算法二

算法三

旋转的叠加（四元数版）

用四元数实现坐标变换

点/向量

旋转

四元数的指数形式与幂运算

四元数的插值

旋转变化量

Lerp

Nlerp

Slerp

双倍覆盖

Squad

Reference