算法 SLAM FAST-LIO论文阅读

论文：FAST-LIO: A Fast, Robust LiDAR-inertial Odometry Package by Tightly-Coupled Iterated Kalman Filter

源码链接

各位大佬对论文的解析： FAST-LIO论文解读与详细公式推导

FAST-LIO是港大MaRS实验室在2021年提出的一个紧耦合迭代扩展卡尔曼滤波高计算效率、高鲁棒性的雷达里程计。影响深远，后续又陆续提出了FAST-LIO2以及Faster-LIO等框架。下面，我们简单了解一些论文中的各个模块及其处理流程。

符号说明

t_{k}

tk第K帧激光扫描的结束时间

\tau_{i}

τiLiDAR扫描帧中的第i个IMU数据

\rho_{j}

ρjLiDAR扫描帧中的第j个激光点时间

I_{i},I_{j},I_{k}

Ii,Ij,Ik IMU在

\tau_{i}

τi，

\rho_{j}

ρj，以及

t_{k}

tk三个时刻的载体坐标系

L_{j},L_{k}

Lj,Lk LiDAR在

\rho_{j}

ρj，

t_{k}

tk时刻的激光坐标系。

，

X，\hat{X}， \bar{X}

X，X^，Xˉ：状态X的真值，预测值，更新值（后验，估计值）

\tilde{X}

X~：状态X的真值

X与估计值

\bar{X}

Xˉ之间的误差(即：

⊟

\tilde{X}=X\boxminus\bar{X}

X~=X⊟Xˉ ，

⊞

X=\tilde{X}\boxplus\bar{X}

X=X~⊞Xˉ )

\hat{X}^\kappa

X^κ：迭代扩展卡尔曼滤波（IEKF）中的第

\kappa

κ次迭代的状态量

X_{i},X_{j},X_{k}

Xi,Xj,Xk：在

\tau_{i}

τi，

\rho_{j}

ρj，以及

t_{k}

tk三个时刻的状态量

\check{X}_{j}

Xˇj：在后向传播中，相对于

t_{k}

tk时刻状态

X_{k}

Xk的估计值

X_{j}

基础概念（运算符）

作者在文中定义了两个基础的运算符，

⊞

\boxplus

⊞与

⊟

\boxminus

⊟。这里的

M表示一种

n维的流形。

⊞

\boxplus

⊞操作对应于在流形

M上增加一个小的扰动。

⊟

\boxminus

⊟操作对应于两个流形

M_1

M1与

M_2

M2之间的微小差值。分别对应于指数映射与对数映射。同时，我们可以推导出下述结论

文中以IMU坐标系作为载体系，推出来的位姿也在载体系中。假设激光雷达与IMU刚性链接，使用一个外参转换关系

(

)

{^I}T{_L}=({^I}R{_L}, {^I}p{_L})

ITL=(IRL,IpL)进行转换。

IMU连续模型

IMU的动力学模型如下：

这是易于理解的，位置的导数是速度，速度的导数为加速度（增加的坐标转换与重力影响），重力为一个常数，导数为0，旋转的导数为角速度（推导可以参考高翔博士的SLAM十四讲），陀螺仪与加速计零偏的导数为高斯白噪声。

IMU离散模型

假设，IMU的采样频率为

\Delta t

Δt，则离散模型可以写成如下形式：

其中：

LiDAR帧的概念

实际工作过程中 LiDAR是在不断的连续扫描的（这个频率非常高，数十万Hz），但是我们为了能够处理点云数据，人为的划分成了不同的扫描帧，如文中把累积20ms的点云作为一帧数据，扫描频率为50Hz。即把上图中

−

t_{k-1}

tk−1到

t_{k}

tk的时间段（20ms）划分为一帧点云。

但是，这样引起一个问题是，带来了运动畸变。对于这一问题，在后续的章节中通过后向传播来进行纠正。

状态估计

作者使用误差作为要估计的状态，这样做有一系列好处：参考高翔博士-简明ESKF推导

在旋转的处理上，ESKF的状态变量可以采用最小化的参数表达，也就是使用三维变量来表达旋转的增量。而传统KF需要用到四元数（4维）或者更高维的表达（旋转矩阵，9维），要不就得采用带有奇异性的表达方式（欧拉角）。ESKF总是在原点附近，离奇异点较远，并且也不会由于离工作点太远而导致线性化近似不够的问题。ESKF的状态量为小量，其二阶变量相对来说可以忽略。同时大多数雅可比矩阵在小量情况下变得非常简单，甚至可以用单位阵代替。误差状态的运动学也相比原状态变量要来得更小，因为我们可以把大量更新部分放到原状态变量中。

前向传播(运动方程)

前向传播的执行过程如下，每次接收到一次数据我们就会执行一次。

此外，由于不知道噪声的值，所以设置噪声

w为0，不断进行前向传播。当然，这样很快就会“飘”。但是，我们还有观测方程（LiDAR）进行修正。

对公式（4）转换为误差的形式，并进行线性化：

F_{\tilde{X}}

FX~与

F_{W}

FW分别为

\tilde{X}_{i+1}

X~i+1与

{w}_{i}

wi变量的雅克比矩阵。形式如下：其中A（.）的表示方式为：

推导方式见论文中的附录，这里就不详细说了，很烦人。

有了运动方程的线性化表达式，我们还需要对应的协方差更新方式，假设噪声

w的协方差为

Q，则更新方式为：直到一帧的扫描终点时刻

t_k

tk，一个前向传播过程才结束。终点时刻

t_k

tk的预测状态表示为

\hat{X}_k

X^k，对应的协方差表示为

\hat{P}_k

P^k(状态预测值

\hat{X}_k

X^k与状态真值

{X}_k

Xk之间的误差的协方差

⊟

\hat{X}_k\boxminus{X}_k

X^k⊟Xk)。

后向传播(运动畸变校正)

我们在处理过程中会融合在

t_k

tk时刻的状态

\hat{X}_k

X^k与协方差

\hat{P}_k

P^k。但是，正如我们之前所提到的，每个点都有属于他们自己的时间戳，其测量时间并不是我们所规定的

t_k

tk时刻，即LiDAR点采样（测量）时间

\rho_j

ρj

如图中的下半部分，为了消除这种影响，作者使用下述公式，反向（后向）从

t_k

tk时刻的位姿，推算出

\rho_j

ρj时刻的位姿，并把

\rho_j

ρj时刻的特征点转换到

t_k

tk时刻。注意，因为特征点的频率高于IMU频率，所以并不是每个特征点时刻对应一个位姿。每个特征点的转换位姿都由其左侧的IMU时刻确定。

通过上述计算，得到

\rho_j

ρj时刻到

t_k

tk时刻的相对位姿为：

(

)

^{I_k}{\check T}_{I_j}=(^{I_k}{\check R}_{I_j}, ^{I_k}{\check p}_{I_j})

IkTˇIj=(IkRˇIj,IkpˇIj)

基于此，我们可以通过下式，把局部坐标系的点测量值

^{L_j}{p}_{f_j}

Ljpfj，投影的扫描终点时刻

t_k

tk，即

^{L_k}{p}_{f_j}

Lkpfj。

−

^{L_k}{p}_{f_j}={^{I}{T}^{-1}_{L}} {^{I_k}{\check T}_{I_j}} {^{I}{T}_{L}} {^{L_j}{p}_{f_j}}

Lkpfj=ITL−1IkTˇIjITLLjpfj 式中，

^{I}{T}_{L}

ITL为LiDAR与IMU之间的外参，

^{L_k}{p}_{f_j}

Lkpfj为投影到扫描终点时刻

t_k

tk的坐标，用于下面的残差计算。

残差计算

经过上节中的运动畸变校正，我们可以把一个扫描帧中的所有特征点视为在同一时刻

t_k

tk处进行采样，接着，投影到全局坐标系中：式中，

{^{G}{\hat T}^{\kappa}_{I_k}}

GT^Ikκ为我们想要求的

t_k

tk时刻到全局坐标系下的位姿变换。

类似于LOAM的思想，转换后的特征点应该落在其对应的特征“线”“面”上，但是由于存在LiDAR测量误差与前向传播的状态推算误差，导致转换后的特征点并不能完全落在特征线/面上。式中，

G_j

Gj为法向量

u^T_j

ujT（平面特征）或为边缘线特征朝向的反对称阵

⌊

⌋

∧

\left \lfloor u_j \right \rfloor_{\wedge }

⌊uj⌋∧（边缘特征）。即计算点到面或者点到线之间的距离。

作者只考虑模长小于0.5m的残差值。残差值高于阈值的被认为是噪声点或者是新观测的点。

迭代状态更新

如果我们把激光雷达的测量噪声去除，假设测量的点都是真实的坐标。那么我们使用这个真值代入上述公式中转换的全局坐标系

G，再使用状态的真值

X_k

Xk（有变换的真值

{^{G}{T}_{I_k}}

GTIk），那么残差

z^{\kappa}_j

zjκ的值应该为0；对上式

h_j

hj进行一阶近似：

式中，

⊟

\tilde{X}^{\kappa}_k=X_k\boxminus\hat{X}^{\kappa}_k

X~kκ=Xk⊟X^kκ ，

⊞

X_k=\hat{X}^{\kappa}_k\boxplus\tilde{X}^{\kappa}_k

Xk=X^kκ⊞X~kκ。

存在：

结合（15）（运动方程）及残差（14）（观测方程），我们得到下述形式的目标函数：式中:

∥

\left \| x \right \|^2_M=X^TMX

∥x∥M2=XTMX

利用迭代卡尔曼滤波，我们对（17）进行求解

得到

\bar{X}_k

Xˉk与

\bar{P}_k

Pˉk。

上述求解过程中还存在一个问题是求解卡尔曼增益K需要对

HPH^T+R

HPHT+R进行求逆。这个维度为

∗

m*m

m∗m即特征点的数量（观测的数量）。这个维度是很大的，所以求解比较困难。

作者把卡尔曼增益的公式等价转换为下述形式，求逆的维度为状态量的维度

∗

18*18

18∗18，大大降低了计算的维度。等价转换过程的推导也是比较简单的，利用了矩阵的求逆定理。

精彩内容

评论可见，请评论后查看内容，谢谢！！！

您阅读本篇文章共花了：

金钥匙

算法 SLAM FAST-LIO论文阅读

深度学习人工智能机器学习【论文阅读】DSMIL

前端快六一啦，学习CSS3实现一个冰淇淋动画特效

发表评论取消回复

金钥匙

算法 SLAM FAST-LIO论文阅读

深度学习 人工智能 机器学习 【论文阅读】DSMIL

前端 快六一啦，学习CSS3实现一个冰淇淋动画特效

相关文章

发表评论取消回复

深度学习人工智能机器学习【论文阅读】DSMIL

前端快六一啦，学习CSS3实现一个冰淇淋动画特效