车道线检测-Eigenlanes 论文学习笔记

news/2024/4/20 7:54:33/文章来源:https://blog.csdn.net/qq_29695701/article/details/128952351

论文：《Eigenlanes: Data-Driven Lane Descriptors for Structurally Diverse Lanes》

代码：https://github.com/dongkwonjin/Eigenlanes

核心：在 Eigenlane Space 中检测车道线

创新点

Eigenlane：数据驱动的车道描述符，在特征车道空间中紧凑地表示结构多样化的车道；
SIIC-Net：高效地检测和回归特征车道空间中的道路车道；
SDLane数据集：比现有数据集更真实地表示真实驾驶环境中结构多样化和复杂的车道；

0、结构

在这里插入图片描述

1、Eigenlanes

用车道线在训练集中的分布来表示车道线。

车道线： $x=[x1,x2,...,xN]T\pmb{x}=[x_1,x_2,...,x_N]^T$ （横坐标）
车道线矩阵： $A=[x1,x2,...,xL]\pmb{A}=[\pmb{x}_1,\pmb{x}_2,...,\pmb{x}_L]$ （训练集中的所有车道线）
使用 Frobenius 泛数 $∣∣A−AM∣∣F||\pmb{A}-\pmb{A}_M||_F$ ，其在被最小化时， $A\pmb{A}$ 的最佳 $M$ 阶逼近为：
$AM=[x~1,x~2,...,x~L]=σ1u1v1T+⋯+σMuMvMT\pmb{A}_M=[\pmb{\tilde{x}}_1,\pmb{\tilde{x}}_2,...,\pmb{\tilde{x}}_L]=\sigma_1 \pmb{u}_1 \pmb{v}^T_1+\cdots+\sigma_M \pmb{u}_M \pmb{v}^T_M$
其中：
- $UM=[u1,...,uM]\pmb{U}_M=[\pmb{u}_1,...,\pmb{u}_M]$ 是 $U=[u1,...,uN]\pmb{U}=[\pmb{u}_1,...,\pmb{u}_N]$ 的前 M 个左奇异向量；
- $VM=[v1,...,vM]\pmb{V}_M=[\pmb{v}_1,...,\pmb{v}_M]$ 是 $V=[v1,...,vL]\pmb{V}=[\pmb{v}_1,...,\pmb{v}_L]$ 的前 M 个右奇异向量；
- $ΣM=[σ1,...,σM]\pmb{\Sigma}_M=[\pmb{\sigma}_1,...,\pmb{\sigma}_M]$ 是 $Σ\pmb{\Sigma}$ 的前 M 个奇异值（ $Σ\pmb{\Sigma}$ 中的奇异值经过了由大到小的排序，均大于0，且最小值为 $σr\sigma_r$ ，r 是 A 的秩）；
- $U\pmb{U}$ 、 $V\pmb{V}$ 以及 $Σ\pmb{\Sigma}$ 是通过奇异值分解 $A=UΣV\pmb{A}=\pmb{U}\pmb{\Sigma}\pmb{V}$ 得到的。
- 由此可知：
  - $x~i=UMci=[u1,...,uM]ci\tilde{x}_i=\pmb{U}_M \pmb{c}_i=[\pmb{u}_1,...,\pmb{u}_M]\pmb{c}_i$
  - 定义 Eigenlanes： $u1,...,uM\pmb{u}_1,...,\pmb{u}_M$
  - 定义 Eigenlanes 空间：由 ${u1,...,uM}\{\pmb{u}_1,...,\pmb{u}_M\}$ 张成的空间
给定车道线 $x\pmb{x}$ ，将其映射到 Eigenlanes 空间： $x~=UMc\tilde{\pmb{x}}=\pmb{U}_M \pmb{c}$ ，其中 $c=UMTx\pmb{c}=\pmb{U}_M^T \pmb{x}$

在 Eigenlanes 空间生成候选车道线

在低维空间进行聚类，效果更佳。

在这里插入图片描述

Algorithm 1 Lane candidate generation in eigenlane space
Input: Set of training lanes ${x_1,x_2,...,x_L\}$ , $M=#M=\#$ of eigenlanes, $K=#K=\#$ of lane candidates

Construct the lane matrix A and perform SVD in $A=UΣV\pmb{A}=\pmb{U}\pmb{\Sigma}\pmb{V}$ ;
Transform each lane $x_i$ to $c_i$ via $c=UMTx\pmb{c}=\pmb{U}_M^T \pmb{x}$ ;
Apply the K-means algorithm to ${c_1,c_2,...,c_L\}$ to obtain K centroids $c^1,c^2,...,c^K$
Generate the lane candidate $lk=UMck\pmb{l}_k=\pmb{U}_M\pmb{c}^k$ by inversely transforming each centroid $ck\pmb{c}^k$

Output: Set of lane candidates ${l_1,...,l_K\}$

在 Eigenlanes 空间上，（通过最近邻）检测到 $l=UMc\pmb{l}=\pmb{U}_M\pmb{c}$ 之后，再用一个回归器回归出 $Δc\Delta \pmb{c}$ ，这样有：

$l+Δl=UM(c+Δc)\pmb{l}+\Delta\pmb{l}=\pmb{U}_M(\pmb{c}+\Delta \pmb{c})$
在这里插入图片描述

2、SIIC-Net

整体结构

在这里插入图片描述

Encoder：ResNet50

Decoder：Binary Segmentation Map

2.1、SI 模块（Self-lane Identification）

预测：车道线概率、位置偏移、最顶处点的高度

输入：Squeezed Feature Map $X_s$ 、候选车道线 $l_k$

输出： $P=σ(f1(Y)),H=σ(f2(Y)),O=f3(Y)P=\sigma(f_1(Y)),\ H=\sigma(f_2(Y)),\ O=f_3(Y)$

其中， $Ys=[Ys1,Ys2,...,YsC2]∈RK×C2Y_s=[Y^1_s,Y^2_s,...,Y^{C_2}_s]\in \mathbb{R}^{K\times C_2}$ 是沿着候选车道线 $lk\pmb{l}_k$ 做均值：

$Ysc=1∣lk∣Σp∈lkXsc(p)Y_s^c=\frac{1}{|\pmb{l}_k|}\Sigma_{p\in \pmb{l}_k}X^c_s(p)$

$f_i$ 分别是 $C2×2C_2\times 2$ 、 $C2×RC_2\times R$ 、 $C2×MC_2\times M$ 的全连接层。 $O_k$ 就是前面提到的偏移量 $Δck\Delta c_k$

SI 模块之后，应用 NMS T 次，以选出 T 条有价值的车道线。

2.2、IC 模块（Inter-lane Correlation）

利用了车道线之间的 相关性：

相邻车道等间距
透视变换下，车道线交于 Vanishing Point

输入：Aggregated Feature Map $X_a$ 、候选车道线 $l_k$ 、前段 NMS 输出的 T 条车道线；

输出：相应两条车道线对的匹配度 $R=ϕ1(Ya)×ϕ2(Ya)TR=\phi_1(Y_a)\times\phi_2(Y_a)^T$

其中，

$Y_a$ 使用 $X_a$ 计算得到，计算方式与 $Y_s$ 类似，它是 $T×C1T\times C_1$ 的矩阵
$R$ 是 $T×TT\times T$ 的矩阵， $Rij∈[−1,1]R_{ij}\in [-1,1]$
$ϕ1\phi_1$ 与 $ϕ2\phi_2$ 是用卷积与 $l_2$ 泛数实现的特征变换。

2.3、MWCS 模块

这是一种图优化技术，可见论文：《Harmonious Semantic Line Detection via Maximal Weight Clique Selection》

主要有两步操作：

寻找可以修正的最佳车道线 clique；
通过删除 y 坐标比 $H_{v_i}$ 大的点，修正了每条车道线的高度；（后面不再赘述）

寻找可以修正的最佳车道线 clique

构建完全图

$G=(V,E)G=(\mathcal{V},\mathcal{E})$
$V={v1,v2,...,vT}\mathcal{V}=\{v_1,v_2,...,v_T\}$ 是 NMS 输出的车道线
$E={(vi,vj):i≠j}\mathcal{E}=\{(v_i,v_j):i\ne j\}$ ，每条边上有个权重 $w(vi,vj)=12(Rij+Rji)w(v_i,v_j)=\frac{1}{2}(R_{ij}+R_{ji})$