Echo/fcb_photo_review

Fork 0

Files

liuyebo 1514e09c40 更换文档检测模型

2024-08-27 14:42:45 +08:00

8.7 KiB

Raw Blame History

模型库和基线

内容

基础设置
基线

基础设置

测试环境

Python 3.7
PaddlePaddle 每日版本
CUDA 10.1
cuDNN 7.5
NCCL 2.4.8

通用设置

所有模型均在COCO17数据集中训练和测试。
YOLOv5、YOLOv6、YOLOv7和YOLOv8这几类模型的代码在PaddleYOLO中，PaddleYOLO库开源协议为GPL 3.0。
除非特殊说明，所有ResNet骨干网络采用ResNet-B结构。
推理时间(fps): 推理时间是在一张Tesla V100的GPU上通过'tools/eval.py'测试所有验证集得到，单位是fps(图片数/秒), cuDNN版本是7.5，包括数据加载、网络前向执行和后处理, batch size是1。

训练策略

我们采用和Detectron相同的训练策略。
1x 策略表示：在总batch size为8时，初始学习率为0.01，在8 epoch和11 epoch后学习率分别下降10倍，最终训练12 epoch。
2x 策略为1x策略的两倍，同时学习率调整的epoch数位置也为1x的两倍。

ImageNet预训练模型

Paddle提供基于ImageNet的骨架网络预训练模型。所有预训练模型均通过标准的Imagenet-1k数据集训练得到，ResNet和MobileNet等是采用余弦学习率调整策略或SSLD知识蒸馏训练得到的高精度预训练模型，可在PaddleClas查看模型细节。

基线

目标检测

Faster R-CNN

请参考Faster R-CNN

YOLOv3

请参考YOLOv3

PP-YOLOE/PP-YOLOE+

请参考PP-YOLOE

PP-YOLO/PP-YOLOv2

请参考PP-YOLO

PicoDet

请参考PicoDet

RetinaNet

请参考RetinaNet

Cascade R-CNN

请参考Cascade R-CNN

SSD/SSDLite

请参考SSD

FCOS

请参考FCOS

CenterNet

请参考CenterNet

TTFNet/PAFNet

请参考TTFNet

Group Normalization

请参考Group Normalization

Deformable ConvNets v2

请参考Deformable ConvNets v2

HRNets

请参考HRNets

Res2Net

请参考Res2Net

ConvNeXt

请参考ConvNeXt

GFL

请参考GFL

TOOD

请参考TOOD

PSS-DET(RCNN-Enhance)

请参考PSS-DET

DETR

请参考DETR

DINO

请参考DINO

YOLOX

请参考YOLOX

YOLOF

请参考YOLOF

实例分割

Mask R-CNN

请参考Mask R-CNN

Cascade R-CNN

请参考Cascade R-CNN

SOLOv2

请参考SOLOv2

QueryInst

请参考QueryInst

PaddleYOLO

请参考PaddleYOLO模型库

YOLOv5

请参考YOLOv5

YOLOv6(v3.0)

请参考YOLOv6

YOLOv7

请参考YOLOv7

YOLOv8

请参考YOLOv8

RTMDet

请参考RTMDet

人脸检测

请参考人脸检测模型库

BlazeFace

请参考BlazeFace

旋转框检测

请参考旋转框检测模型库

PP-YOLOE-R

请参考PP-YOLOE-R

FCOSR

请参考FCOSR

S2ANet

请参考S2ANet

关键点检测

请参考关键点检测模型库

PP-TinyPose

请参考PP-TinyPose

HRNet

请参考HRNet

Lite-HRNet

请参考Lite-HRNet

HigherHRNet

请参考HigherHRNet

多目标跟踪

请参考多目标跟踪模型库

DeepSORT

请参考DeepSORT

ByteTrack

请参考ByteTrack

OC-SORT

请参考OC-SORT

BoT-SORT

请参考BoT-SORT

CenterTrack

请参考CenterTrack

FairMOT/MC-FairMOT

请参考FairMOT

JDE

请参考JDE

8.7 KiB Raw Blame History Unescape Escape

模型库和基线

内容

基础设置

测试环境

通用设置

训练策略

ImageNet预训练模型

基线

目标检测

Faster R-CNN

YOLOv3

PP-YOLOE/PP-YOLOE+

PP-YOLO/PP-YOLOv2

PicoDet

RetinaNet

Cascade R-CNN

SSD/SSDLite

FCOS

CenterNet

TTFNet/PAFNet

Group Normalization

Deformable ConvNets v2

HRNets

Res2Net

ConvNeXt

GFL

TOOD

PSS-DET(RCNN-Enhance)

DETR

Deformable DETR

Sparse R-CNN

Vision Transformer

DINO

YOLOX

YOLOF

实例分割

Mask R-CNN

Cascade R-CNN

SOLOv2

QueryInst

PaddleYOLO

YOLOv5

YOLOv6(v3.0)

YOLOv7

YOLOv8

RTMDet

人脸检测

BlazeFace

旋转框检测

PP-YOLOE-R

FCOSR

S2ANet

关键点检测

PP-TinyPose

HRNet

Lite-HRNet

HigherHRNet

多目标跟踪

DeepSORT

ByteTrack

OC-SORT

BoT-SORT

CenterTrack

FairMOT/MC-FairMOT

JDE

8.7 KiB

Raw Blame History