ymir-mmsegmentation镜像说明文档#
-
支持任务类型: 训练, 推理, 挖掘
-
支持算法: deeplabv3plus, fastscnn,hrnet, ocrnet 语义分割
-
版本信息
python: 3.8.8
pytorch: 1.8.0
torchvision: 0.9.0
cuda: 11.1
cudnn: 8
mmcv: 1.6.1
mmsegmentation: 0.27.0+
镜像信息#
-
镜像地址
docker pull youdaoyzbx/ymir-executor:ymir2.1.0-mmseg-cu111-tmi
性能表现#
参考 fastscnn
Cityscapes#
| Method | Backbone | Crop Size | Lr schd | Mem (GB) | Inf time (fps) | mIoU | mIoU(ms+flip) | config | download |
|---|---|---|---|---|---|---|---|---|---|
| FastSCNN | FastSCNN | 512x1024 | 160000 | 3.3 | 56.45 | 70.96 | 72.65 | config | model | log |
| HRNet | HRNetV2p-W18-Small | 512x1024 | 40000 | 1.7 | 23.74 | 73.86 | 75.91 | config | model | log |
| HRNet | HRNetV2p-W18 | 512x1024 | 40000 | 2.9 | 12.97 | 77.19 | 78.92 | config | model | log |
| HRNet | HRNetV2p-W18-Small | 512x1024 | 80000 | - | - | 75.31 | 77.48 | config | model | log |
| HRNet | HRNetV2p-W18 | 512x1024 | 80000 | - | - | 78.65 | 80.35 | config | model | log |
| HRNet | HRNetV2p-W18-Small | 512x1024 | 160000 | - | - | 76.31 | 78.31 | config | model | log |
| HRNet | HRNetV2p-W18 | 512x1024 | 160000 | - | - | 78.80 | 80.74 | config | model | log |
| DeepLabV3+ | R-50-D8 | 512x1024 | 40000 | 7.5 | 3.94 | 79.61 | 81.01 | config | model | log |
| DeepLabV3+ | R-50-D8 | 769x769 | 40000 | 8.5 | 1.72 | 78.97 | 80.46 | config | model | log |
| DeepLabV3+ | R-18-D8 | 512x1024 | 80000 | 2.2 | 14.27 | 76.89 | 78.76 | config | model | log |
| DeepLabV3+ | R-18-D8 | 769x769 | 80000 | 2.5 | 5.74 | 76.26 | 77.91 | config | model | log |
| DeepLabV3+ | R-18b-D8 | 512x1024 | 80000 | 2.1 | 14.95 | 75.87 | 77.52 | config | model | log |
| DeepLabV3+ | R-18b-D8 | 769x769 | 80000 | 2.4 | 5.96 | 76.36 | 78.24 | config | model | log |
| OCRNet | HRNetV2p-W18-Small | 512x1024 | 40000 | 3.5 | 10.45 | 74.30 | 75.95 | config | model | log |
| OCRNet | HRNetV2p-W18 | 512x1024 | 40000 | 4.7 | 7.50 | 77.72 | 79.49 | config | model | log |
| OCRNet | HRNetV2p-W18-Small | 512x1024 | 80000 | - | - | 77.16 | 78.66 | config | model | log |
| OCRNet | HRNetV2p-W18 | 512x1024 | 80000 | - | - | 78.57 | 80.46 | config | model | log |
| OCRNet | HRNetV2p-W18-Small | 512x1024 | 160000 | - | - | 78.45 | 79.97 | config | model | log |
| OCRNet | HRNetV2p-W18 | 512x1024 | 160000 | - | - | 79.47 | 80.91 | config | model | log |
训练参数#
| 超参数 | 默认值 | 类型 | 说明 | 建议 |
|---|---|---|---|---|
| hyper-parameter | default value | type | note | advice |
| export_format | seg-coco:raw | 字符串 | 受ymir后台处理,ymir分割数据集导出格式 | 禁止改变 |
| shm_size | 128G | 字符串 | 受ymir后台处理,docker image 可用共享内存 | 建议大小:镜像占用GPU数 * 32G |
| config_file | configs/fastscnn/fast_scnn_lr0.12_8x4_160k_cityscapes.py | 文件路径 | mmlab配置文件 | 建议采用fastscnn系列, 参考configs |
| samples_per_gpu | 2 | 整数 | 每张GPU一次处理的图片数量 | 建议大小:显存占用<50% 可增加2倍加快训练速度 |
| workers_per_gpu | 2 | 整数 | 每张GPU对应的数据读取进程数 | 采用默认值即可,若内存及CPU配置高,可适当增大 |
| max_iters | 20000 | 整数 | 数据集的训练批次 | 建议:必要时分析tensorboard确定是否有必要改变,一般采用默认值即可 |
| interval | 2000 | 整数 | 模型在验证集上评测的周期 | 采用默认值即可 |
| args_options | '' | 字符串 | 训练命令行参数 | 参考tools/train.py |
| cfg_options | '' | 字符串 | 训练命令行参数 | 参考 tools/train.py |
| save_least_file | True | 布尔型 | 是否只保存最优和最新的权重文件 | 设置为True |
| max_keep_ckpts | -1 | 整数 | 当save_least_file为False时,最多保存的权重文件数量 | 设置为k, 可保存k个最优权重和k个最新的权重文件,设置为-1可保存所有权重文件。 |
| ignore_black_area | False | 布尔型 | 是否忽略未标注的区域 | 采用默认即可将空白区域当成背景进行训练 |
推理参数#
| 超参数 | 默认值 | 类型 | 说明 | 建议 |
|---|---|---|---|---|
| hyper-parameter | default value | type | note | advice |
| shm_size | 128G | 字符串 | 受ymir后台处理,docker image 可用共享内存 | 建议大小:镜像占用GPU数 * 32G |
| samples_per_gpu | 2 | 整数 | 每张GPU一次处理的图片数量 | 建议大小:显存占用<50% 可增加2倍加快训练速度 |
| workers_per_gpu | 2 | 整数 | 每张GPU对应的数据读取进程数 | 采用默认值即可,若内存及CPU配置高,可适当增大 |
挖掘参数#
| 超参数 | 默认值 | 类型 | 可选值 | 说明 | | hyper-parameter | default value | type | choices | note | | - | - | - | - | - | | mining_algorithm | RSAL | str | RSAL, RIPU | 挖掘算法名称 | | superpixel_algorithm | slico | str | slico, slic, mslic, seeds | 超像素算法名称 | | uncertainty_method | BvSB | str | BvSB | 不确定性计算方法名称 | | shm_size | 128G | str | 128G | 容器可使用的共享内存大小 | | max_superpixel_per_image | 1024 | int | 1024, ... | 一张图像中超像素的数量上限 | | max_kept_mining_image | 5000 | int | 500, 1000, 2000, 5000, ... | 挖掘图像数量的上限 | | topk_superpixel_score | 3 | int | 3, 5, 10, ... | 一张图像中采用的超像素数量 | | class_balance | True | bool | True, False | 是否考虑各类标注的平衡性 | | fp16 | True | bool | True, False | 是否采用fp16技术加速 | | samples_per_gpu | 2 | int | 2, 4, ... | batch size per gpu | | workers_per_gpu | 2 | int | 2 | num_workers per gpu | | ripu_region_radius | 1 | int | 1, 2, 3 | ripu挖掘算法专用参数 |