ymir-mmsegmentation镜像说明文档#

支持任务类型：训练，推理，挖掘
支持算法: deeplabv3plus, fastscnn，hrnet, ocrnet 语义分割
版本信息

python: 3.8.8
pytorch: 1.8.0
torchvision: 0.9.0
cuda: 11.1
cudnn: 8
mmcv: 1.6.1
mmsegmentation: 0.27.0+

镜像信息#

参考仓库open-mmlab/mmsegmentation

代码仓库modelai/ymir-mmsegmentation
镜像地址

docker pull youdaoyzbx/ymir-executor:ymir2.1.0-mmseg-cu111-tmi

性能表现#

参考 fastscnn

Cityscapes#

Method	Backbone	Crop Size	Lr schd	Mem (GB)	Inf time (fps)	mIoU	mIoU(ms+flip)	config	download
FastSCNN	FastSCNN	512x1024	160000	3.3	56.45	70.96	72.65	config	model \| log
HRNet	HRNetV2p-W18-Small	512x1024	40000	1.7	23.74	73.86	75.91	config	model \| log
HRNet	HRNetV2p-W18	512x1024	40000	2.9	12.97	77.19	78.92	config	model \| log
HRNet	HRNetV2p-W18-Small	512x1024	80000	-	-	75.31	77.48	config	model \| log
HRNet	HRNetV2p-W18	512x1024	80000	-	-	78.65	80.35	config	model \| log
HRNet	HRNetV2p-W18-Small	512x1024	160000	-	-	76.31	78.31	config	model \| log
HRNet	HRNetV2p-W18	512x1024	160000	-	-	78.80	80.74	config	model \| log
DeepLabV3+	R-50-D8	512x1024	40000	7.5	3.94	79.61	81.01	config	model \| log
DeepLabV3+	R-50-D8	769x769	40000	8.5	1.72	78.97	80.46	config	model \| log
DeepLabV3+	R-18-D8	512x1024	80000	2.2	14.27	76.89	78.76	config	model \| log
DeepLabV3+	R-18-D8	769x769	80000	2.5	5.74	76.26	77.91	config	model \| log
DeepLabV3+	R-18b-D8	512x1024	80000	2.1	14.95	75.87	77.52	config	model \| log
DeepLabV3+	R-18b-D8	769x769	80000	2.4	5.96	76.36	78.24	config	model \| log
OCRNet	HRNetV2p-W18-Small	512x1024	40000	3.5	10.45	74.30	75.95	config	model \| log
OCRNet	HRNetV2p-W18	512x1024	40000	4.7	7.50	77.72	79.49	config	model \| log
OCRNet	HRNetV2p-W18-Small	512x1024	80000	-	-	77.16	78.66	config	model \| log
OCRNet	HRNetV2p-W18	512x1024	80000	-	-	78.57	80.46	config	model \| log
OCRNet	HRNetV2p-W18-Small	512x1024	160000	-	-	78.45	79.97	config	model \| log
OCRNet	HRNetV2p-W18	512x1024	160000	-	-	79.47	80.91	config	model \| log

训练参数#

超参数	默认值	类型	说明	建议
hyper-parameter	default value	type	note	advice
export_format	seg-coco:raw	字符串	受ymir后台处理，ymir分割数据集导出格式	禁止改变
shm_size	128G	字符串	受ymir后台处理，docker image 可用共享内存	建议大小：镜像占用GPU数 * 32G
config_file	configs/fastscnn/fast_scnn_lr0.12_8x4_160k_cityscapes.py	文件路径	mmlab配置文件	建议采用fastscnn系列, 参考configs
samples_per_gpu	2	整数	每张GPU一次处理的图片数量	建议大小：显存占用<50% 可增加2倍加快训练速度
workers_per_gpu	2	整数	每张GPU对应的数据读取进程数	采用默认值即可，若内存及CPU配置高，可适当增大
max_iters	20000	整数	数据集的训练批次	建议：必要时分析tensorboard确定是否有必要改变，一般采用默认值即可
interval	2000	整数	模型在验证集上评测的周期	采用默认值即可
args_options	''	字符串	训练命令行参数	参考tools/train.py
cfg_options	''	字符串	训练命令行参数	参考 tools/train.py
save_least_file	True	布尔型	是否只保存最优和最新的权重文件	设置为True
max_keep_ckpts	-1	整数	当save_least_file为False时，最多保存的权重文件数量	设置为k, 可保存k个最优权重和k个最新的权重文件，设置为-1可保存所有权重文件。
ignore_black_area	False	布尔型	是否忽略未标注的区域	采用默认即可将空白区域当成背景进行训练

推理参数#

超参数	默认值	类型	说明	建议
hyper-parameter	default value	type	note	advice
shm_size	128G	字符串	受ymir后台处理，docker image 可用共享内存	建议大小：镜像占用GPU数 * 32G
samples_per_gpu	2	整数	每张GPU一次处理的图片数量	建议大小：显存占用<50% 可增加2倍加快训练速度
workers_per_gpu	2	整数	每张GPU对应的数据读取进程数	采用默认值即可，若内存及CPU配置高，可适当增大

挖掘参数#

| 超参数 | 默认值 | 类型 | 可选值 | 说明 | | hyper-parameter | default value | type | choices | note | | - | - | - | - | - | | mining_algorithm | RSAL | str | RSAL, RIPU | 挖掘算法名称 | | superpixel_algorithm | slico | str | slico, slic, mslic, seeds | 超像素算法名称 | | uncertainty_method | BvSB | str | BvSB | 不确定性计算方法名称 | | shm_size | 128G | str | 128G | 容器可使用的共享内存大小 | | max_superpixel_per_image | 1024 | int | 1024, ... | 一张图像中超像素的数量上限 | | max_kept_mining_image | 5000 | int | 500, 1000, 2000, 5000, ... | 挖掘图像数量的上限 | | topk_superpixel_score | 3 | int | 3, 5, 10, ... | 一张图像中采用的超像素数量 | | class_balance | True | bool | True, False | 是否考虑各类标注的平衡性 | | fp16 | True | bool | True, False | 是否采用fp16技术加速 | | samples_per_gpu | 2 | int | 2, 4, ... | batch size per gpu | | workers_per_gpu | 2 | int | 2 | num_workers per gpu | | ripu_region_radius | 1 | int | 1, 2, 3 | ripu挖掘算法专用参数 |