Files
2024-08-27 14:42:45 +08:00

10 KiB
Raw Permalink Blame History

English | 简体中文

PaddleDetection 在昆仑芯上的部署方案-FastDeploy

1. 说明

PaddleDetection支持利用FastDeploy在昆仑芯片上部署检测模型。

支持如下芯片的部署

  • 昆仑 818-100推理芯片
  • 昆仑 818-300训练芯片

支持如下芯片的设备

  • K100/K200 昆仑 AI 加速卡
  • R200 昆仑芯 AI 加速卡

2. 使用预导出的模型列表

为了方便开发者的测试下面提供了PaddleDetection导出的各系列模型开发者可直接下载使用。其中精度指标来源于PaddleDetection中对各模型的介绍详情各参考PaddleDetection中的说明。

2.1 目标检测及实例分割模型

模型 参数大小 精度 备注
picodet_l_320_coco_lcnet 23MB Box AP 42.6%
ppyoloe_crn_l_300e_coco 200MB Box AP 51.4%
ppyoloe_plus_crn_m_80e_coco 83.3MB Box AP 49.8%
ppyolo_r50vd_dcn_1x_coco 180MB Box AP 44.8% 暂不支持TensorRT
ppyolov2_r101vd_dcn_365e_coco 282MB Box AP 49.7% 暂不支持TensorRT
yolov3_darknet53_270e_coco 237MB Box AP 39.1%
yolox_s_300e_coco 35MB Box AP 40.4%
faster_rcnn_r50_vd_fpn_2x_coco 160MB Box AP 40.8% 暂不支持TensorRT
mask_rcnn_r50_1x_coco 128M Box AP 37.4%, Mask AP 32.8% 暂不支持TensorRT、ORT
ssd_mobilenet_v1_300_120e_voc 24.9M Box AP 73.8% 暂不支持TensorRT、ORT
ssd_vgg16_300_240e_voc 106.5M Box AP 77.8% 暂不支持TensorRT、ORT
ssdlite_mobilenet_v1_300_coco 29.1M 暂不支持TensorRT、ORT
rtmdet_l_300e_coco 224M Box AP 51.2%
rtmdet_s_300e_coco 42M Box AP 44.5%
yolov5_l_300e_coco 183M Box AP 48.9%
yolov5_s_300e_coco 31M Box AP 37.6%
yolov6_l_300e_coco 229M Box AP 51.0%
yolov6_s_400e_coco 68M Box AP 43.4%
yolov7_l_300e_coco 145M Box AP 51.0%
yolov7_x_300e_coco 277M Box AP 53.0%
cascade_rcnn_r50_fpn_1x_coco 271M Box AP 41.1% 暂不支持TensorRT、ORT
cascade_rcnn_r50_vd_fpn_ssld_2x_coco 271M Box AP 45.0% 暂不支持TensorRT、ORT
faster_rcnn_enhance_3x_coco 119M Box AP 41.5% 暂不支持TensorRT、ORT
fcos_r50_fpn_1x_coco 129M Box AP 39.6% 暂不支持TensorRT
gfl_r50_fpn_1x_coco 128M Box AP 41.0% 暂不支持TensorRT
ppyoloe_crn_l_80e_sliced_visdrone_640_025 200M Box AP 31.9%
retinanet_r101_fpn_2x_coco 210M Box AP 40.6% 暂不支持TensorRT、ORT
retinanet_r50_fpn_1x_coco 136M Box AP 37.5% 暂不支持TensorRT、ORT
tood_r50_fpn_1x_coco 130M Box AP 42.5% 暂不支持TensorRT、ORT
ttfnet_darknet53_1x_coco 178M Box AP 33.5% 暂不支持TensorRT、ORT
yolov8_x_500e_coco 265M Box AP 53.8%
yolov8_l_500e_coco 173M Box AP 52.8%
yolov8_m_500e_coco 99M Box AP 50.2%
yolov8_s_500e_coco 43M Box AP 44.9%
yolov8_n_500e_coco 13M Box AP 37.3%

2.2 关键点检测模型

模型 说明 模型格式 版本
PP-TinyPose-128x96 单人关键点检测模型 Paddle Release/2.5
PP-TinyPose-256x192 单人关键点检测模型 Paddle Release/2.5
PicoDet-S-Lcnet-Pedestrian-192x192 + PP-TinyPose-128x96 单人关键点检测串联配置 Paddle Release/2.5
PicoDet-S-Lcnet-Pedestrian-320x320 + PP-TinyPose-256x192 多人关键点检测串联配置 Paddle Release/2.5

3. 自行导出PaddleDetection部署模型

3.1 模型版本

支持PaddleDetection大于等于2.4版本的PaddleDetection模型部署。目前FastDeploy测试过成功部署的模型:

3.2 模型导出

PaddleDetection模型导出请参考其文档说明模型导出注意PaddleDetection导出的模型包含model.pdmodelmodel.pdiparamsinfer_cfg.yml三个文件FastDeploy会从yaml文件中获取模型在推理时需要的预处理信息

3.3 导出须知

如果您是自行导出PaddleDetection推理模型请注意以下问题

  • 在导出模型时不要进行NMS的去除操作正常导出即可
  • 如果用于跑原生TensorRT后端非Paddle Inference后端不要添加--trt参数
  • 导出模型时,不要添加fuse_normalize=True参数

4. 详细的部署示例