8.7 KiB
8.7 KiB
模型库和基线
内容
基础设置
测试环境
- Python 3.7
- PaddlePaddle 每日版本
- CUDA 10.1
- cuDNN 7.5
- NCCL 2.4.8
通用设置
- 所有模型均在COCO17数据集中训练和测试。
- YOLOv5、YOLOv6、YOLOv7和YOLOv8这几类模型的代码在PaddleYOLO中,PaddleYOLO库开源协议为GPL 3.0。
- 除非特殊说明,所有ResNet骨干网络采用ResNet-B结构。
- 推理时间(fps): 推理时间是在一张Tesla V100的GPU上通过'tools/eval.py'测试所有验证集得到,单位是fps(图片数/秒), cuDNN版本是7.5,包括数据加载、网络前向执行和后处理, batch size是1。
训练策略
- 我们采用和Detectron相同的训练策略。
- 1x 策略表示:在总batch size为8时,初始学习率为0.01,在8 epoch和11 epoch后学习率分别下降10倍,最终训练12 epoch。
- 2x 策略为1x策略的两倍,同时学习率调整的epoch数位置也为1x的两倍。
ImageNet预训练模型
Paddle提供基于ImageNet的骨架网络预训练模型。所有预训练模型均通过标准的Imagenet-1k数据集训练得到,ResNet和MobileNet等是采用余弦学习率调整策略或SSLD知识蒸馏训练得到的高精度预训练模型,可在PaddleClas查看模型细节。
基线
目标检测
Faster R-CNN
请参考Faster R-CNN
YOLOv3
请参考YOLOv3
PP-YOLOE/PP-YOLOE+
请参考PP-YOLOE
PP-YOLO/PP-YOLOv2
请参考PP-YOLO
PicoDet
请参考PicoDet
RetinaNet
请参考RetinaNet
Cascade R-CNN
SSD/SSDLite
请参考SSD
FCOS
请参考FCOS
CenterNet
请参考CenterNet
TTFNet/PAFNet
请参考TTFNet
Group Normalization
Deformable ConvNets v2
HRNets
请参考HRNets
Res2Net
请参考Res2Net
ConvNeXt
请参考ConvNeXt
GFL
请参考GFL
TOOD
请参考TOOD
PSS-DET(RCNN-Enhance)
请参考PSS-DET
DETR
请参考DETR
Deformable DETR
Sparse R-CNN
请参考Sparse R-CNN
Vision Transformer
DINO
请参考DINO
YOLOX
请参考YOLOX
YOLOF
请参考YOLOF
实例分割
Mask R-CNN
请参考Mask R-CNN
Cascade R-CNN
SOLOv2
请参考SOLOv2
QueryInst
请参考QueryInst
PaddleYOLO
YOLOv5
请参考YOLOv5
YOLOv6(v3.0)
请参考YOLOv6
YOLOv7
请参考YOLOv7
YOLOv8
请参考YOLOv8
RTMDet
请参考RTMDet
人脸检测
请参考人脸检测模型库
BlazeFace
请参考BlazeFace
旋转框检测
请参考旋转框检测模型库
PP-YOLOE-R
请参考PP-YOLOE-R
FCOSR
请参考FCOSR
S2ANet
请参考S2ANet
关键点检测
请参考关键点检测模型库
PP-TinyPose
请参考PP-TinyPose
HRNet
请参考HRNet
Lite-HRNet
请参考Lite-HRNet
HigherHRNet
请参考HigherHRNet
多目标跟踪
请参考多目标跟踪模型库
DeepSORT
请参考DeepSORT
ByteTrack
请参考ByteTrack
OC-SORT
请参考OC-SORT
BoT-SORT
请参考BoT-SORT
CenterTrack
请参考CenterTrack
FairMOT/MC-FairMOT
请参考FairMOT
JDE
请参考JDE