CTPN
优点:对水平文字检测效果超级好
缺点:对扭曲的文字不好
RRPN
在faster的基础上改进
RPN改为RRPN
ROI pooling改进为RROI pooling
能解决旋转,但是解决不了弯曲的曲面问题
EAST
Anchor free
特征合并,检测不同尺度文本
检测各个方向文本
非极大值抑制
说白了就是在被选出的多个目标区域中选出最大IOU的那个其他的统统删掉
soft就比较温柔
就是把置信度比较低的框更新为更低的值而不是从列表中直接删去避免造成漏检
NMS变种
正负样本选择
开发场景中,有可能一张图中目标只有少数个,大部分候选框全都是背景一类的无意义的,造成正负样本数量不均,所以需要对负样本进行抽样
RNN
专门处理timeseep值,即数据存在上下关联性