Files
fcb_photo_review/paddle_detection/configs/smrt/DataAnalysis.md
2024-08-27 14:42:45 +08:00

69 lines
4.2 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

# 数据分析功能说明
为了更好的帮助用户进行数据分析,从推荐更合适的模型,我们推出了**数据分析**功能,用户不需要上传原图,只需要上传标注好的文件格式即可进一步分析数据特点。
当前支持格式有:
* LabelMe标注数据格式
* 精灵标注数据格式
* LabelImg标注数据格式
* VOC数据格式
* COCO数据格式
* Seg数据格式
## LabelMe标注数据格式
1. 需要选定包含标注文件的zip格式压缩包。zip格式压缩包中包含一个annotations文件夹文件夹中的内容为与标注图像相同数量的json文件每一个json文件除后缀外与对应的图像同名。
2. 支持检测与分割任务。若提供的标注信息与所选择的任务类型不匹配,则将提示错误。
3. 对于检测任务需提供rectangle类型标注信息对于分割任务需提供polygon类型标注信息。
<div align="center">
<img src="https://user-images.githubusercontent.com/48433081/169194724-c3fff1db-78b0-4013-925b-b99e5f51e5f2.png" width = "600" />
</div>
## 精灵标注数据格式
1. 需要选定包含标注文件的zip格式压缩包。zip格式压缩包中包含一个annotations文件夹文件夹中的内容为与标注图像相同数量的json文件每一个json文件除后缀外与对应的图像同名。
2. 支持检测与分割任务。若提供的标注信息与所选择的任务类型不匹配,则将提示错误。
3. 对于检测任务需提供bndbox或polygon类型标注信息对于分割任务需提供polygon类型标注信息。
<div align="center">
<img src="https://user-images.githubusercontent.com/48433081/169194724-c3fff1db-78b0-4013-925b-b99e5f51e5f2.png" width = "600" />
</div>
## LabelImg标注数据格式
1. 需要选定包含标注文件的zip格式压缩包。zip格式压缩包中包含一个annotations文件夹文件夹中的内容为与标注图像相同数量的xml文件每一个xml文件除后缀外与对应的图像同名。
2. 仅支持检测任务。
3. 标注文件中必须提供bndbox字段信息segmentation字段是可选的。
<div align="center">
<img src="https://user-images.githubusercontent.com/48433081/169195232-2ccd4c07-8203-44a5-9911-97c092a228d8.png" width = "600" />
</div>
## VOC数据格式
1. 需要选定包含标注文件的zip格式压缩包。zip格式压缩包中包含一个annotations文件夹文件夹中的内容为与标注图像相同数量的xml文件每一个xml文件除后缀外与对应的图像同名。
2. 仅支持检测任务。
3. 标注文件中必须提供bndbox字段信息segmentation字段是可选的。
<div align="center">
<img src="https://user-images.githubusercontent.com/48433081/169195232-2ccd4c07-8203-44a5-9911-97c092a228d8.png" width = "600" />
</div>
## COCO数据格式
1. 需要选定包含标注文件的zip格式压缩包。zip格式压缩包中包含一个annotations文件夹文件夹中仅存在一个名为annotation.json的文件。
2. 支持检测与分割任务。若提供的标注信息与所选择的任务类型不匹配,则将提示错误。
3. 对于检测任务标注文件中必须包含bbox字段segmentation字段是可选的对于分割任务标注文件中必须包含segmentation字段。
<div align="center">
<img src="https://user-images.githubusercontent.com/48433081/169195416-eb12f1bb-6d18-4354-bad5-c18961aa049d.png" width = "600" />
</div>
## Seg数据格式
1. 需要选定包含标注文件的zip格式压缩包。zip格式压缩包中包含一个annotations文件夹文件夹中的内容为与标注图像相同数量的png文件每一个png文件除后缀外与对应的图像同名。
2. 仅支持分割任务。
3. 标注文件需要与原始图像在像素上严格保持一一对应格式只可为png后缀为.png或.PNG。标注文件中的每个像素值为[0,255]区间内从0开始依序递增的整数ID除255外标注ID值的增加不能跳跃。在标注文件中使用255表示需要忽略的像素使用0表示背景类标注。
<div align="center">
<img src="https://user-images.githubusercontent.com/48433081/169195389-85a9bda2-282b-452f-a809-d0100291f86f.png" width = "600" />
</div>