ymir-mmsegmentation镜像说明文档#

  • 支持任务类型: 训练, 推理, 挖掘

  • 支持算法: deeplabv3plus, fastscnn,hrnet, ocrnet 语义分割

  • 版本信息

python: 3.8.8
pytorch: 1.8.0
torchvision: 0.9.0
cuda: 11.1
cudnn: 8
mmcv: 1.6.1
mmsegmentation: 0.27.0+

镜像信息#

参考仓库open-mmlab/mmsegmentation

docker pull youdaoyzbx/ymir-executor:ymir2.1.0-mmseg-cu111-tmi

性能表现#

参考 fastscnn

Cityscapes#

Method Backbone Crop Size Lr schd Mem (GB) Inf time (fps) mIoU mIoU(ms+flip) config download
FastSCNN FastSCNN 512x1024 160000 3.3 56.45 70.96 72.65 config model | log
HRNet HRNetV2p-W18-Small 512x1024 40000 1.7 23.74 73.86 75.91 config model | log
HRNet HRNetV2p-W18 512x1024 40000 2.9 12.97 77.19 78.92 config model | log
HRNet HRNetV2p-W18-Small 512x1024 80000 - - 75.31 77.48 config model | log
HRNet HRNetV2p-W18 512x1024 80000 - - 78.65 80.35 config model | log
HRNet HRNetV2p-W18-Small 512x1024 160000 - - 76.31 78.31 config model | log
HRNet HRNetV2p-W18 512x1024 160000 - - 78.80 80.74 config model | log
DeepLabV3+ R-50-D8 512x1024 40000 7.5 3.94 79.61 81.01 config model | log
DeepLabV3+ R-50-D8 769x769 40000 8.5 1.72 78.97 80.46 config model | log
DeepLabV3+ R-18-D8 512x1024 80000 2.2 14.27 76.89 78.76 config model | log
DeepLabV3+ R-18-D8 769x769 80000 2.5 5.74 76.26 77.91 config model | log
DeepLabV3+ R-18b-D8 512x1024 80000 2.1 14.95 75.87 77.52 config model | log
DeepLabV3+ R-18b-D8 769x769 80000 2.4 5.96 76.36 78.24 config model | log
OCRNet HRNetV2p-W18-Small 512x1024 40000 3.5 10.45 74.30 75.95 config model | log
OCRNet HRNetV2p-W18 512x1024 40000 4.7 7.50 77.72 79.49 config model | log
OCRNet HRNetV2p-W18-Small 512x1024 80000 - - 77.16 78.66 config model | log
OCRNet HRNetV2p-W18 512x1024 80000 - - 78.57 80.46 config model | log
OCRNet HRNetV2p-W18-Small 512x1024 160000 - - 78.45 79.97 config model | log
OCRNet HRNetV2p-W18 512x1024 160000 - - 79.47 80.91 config model | log

训练参数#

超参数 默认值 类型 说明 建议
hyper-parameter default value type note advice
export_format seg-coco:raw 字符串 受ymir后台处理,ymir分割数据集导出格式 禁止改变
shm_size 128G 字符串 受ymir后台处理,docker image 可用共享内存 建议大小:镜像占用GPU数 * 32G
config_file configs/fastscnn/fast_scnn_lr0.12_8x4_160k_cityscapes.py 文件路径 mmlab配置文件 建议采用fastscnn系列, 参考configs
samples_per_gpu 2 整数 每张GPU一次处理的图片数量 建议大小:显存占用<50% 可增加2倍加快训练速度
workers_per_gpu 2 整数 每张GPU对应的数据读取进程数 采用默认值即可,若内存及CPU配置高,可适当增大
max_iters 20000 整数 数据集的训练批次 建议:必要时分析tensorboard确定是否有必要改变,一般采用默认值即可
interval 2000 整数 模型在验证集上评测的周期 采用默认值即可
args_options '' 字符串 训练命令行参数 参考tools/train.py
cfg_options '' 字符串 训练命令行参数 参考 tools/train.py
save_least_file True 布尔型 是否只保存最优和最新的权重文件 设置为True
max_keep_ckpts -1 整数 当save_least_file为False时,最多保存的权重文件数量 设置为k, 可保存k个最优权重和k个最新的权重文件,设置为-1可保存所有权重文件。
ignore_black_area False 布尔型 是否忽略未标注的区域 采用默认即可将空白区域当成背景进行训练

推理参数#

超参数 默认值 类型 说明 建议
hyper-parameter default value type note advice
shm_size 128G 字符串 受ymir后台处理,docker image 可用共享内存 建议大小:镜像占用GPU数 * 32G
samples_per_gpu 2 整数 每张GPU一次处理的图片数量 建议大小:显存占用<50% 可增加2倍加快训练速度
workers_per_gpu 2 整数 每张GPU对应的数据读取进程数 采用默认值即可,若内存及CPU配置高,可适当增大

挖掘参数#

| 超参数 | 默认值 | 类型 | 可选值 | 说明 | | hyper-parameter | default value | type | choices | note | | - | - | - | - | - | | mining_algorithm | RSAL | str | RSAL, RIPU | 挖掘算法名称 | | superpixel_algorithm | slico | str | slico, slic, mslic, seeds | 超像素算法名称 | | uncertainty_method | BvSB | str | BvSB | 不确定性计算方法名称 | | shm_size | 128G | str | 128G | 容器可使用的共享内存大小 | | max_superpixel_per_image | 1024 | int | 1024, ... | 一张图像中超像素的数量上限 | | max_kept_mining_image | 5000 | int | 500, 1000, 2000, 5000, ... | 挖掘图像数量的上限 | | topk_superpixel_score | 3 | int | 3, 5, 10, ... | 一张图像中采用的超像素数量 | | class_balance | True | bool | True, False | 是否考虑各类标注的平衡性 | | fp16 | True | bool | True, False | 是否采用fp16技术加速 | | samples_per_gpu | 2 | int | 2, 4, ... | batch size per gpu | | workers_per_gpu | 2 | int | 2 | num_workers per gpu | | ripu_region_radius | 1 | int | 1, 2, 3 | ripu挖掘算法专用参数 |

镜像制作#