配置说明¶
简介¶
本文档介绍了PaddleClas配置文件(configs/*.yaml)中各参数的含义,以便您更快的自定义或修改超参数配置。
配置详解¶
基础配置¶
| 参数名字 | 具体含义 | 默认值 | 可选值 |
|---|---|---|---|
| mode | 运行模式 | "train" | ["train"," valid"] |
| architecture | 模型结构名字 | "ResNet50_vd" | PaddleClas提供的模型结构 |
| pretrained_model | 预训练模型路径 | "" | Str |
| model_save_dir | 保存模型路径 | "" | Str |
| classes_num | 分类数 | 1000 | int |
| total_images | 总图片数 | 1281167 | int |
| save_interval | 每隔多少个epoch保存模型 | 1 | int |
| validate | 是否在训练时进行评估 | TRUE | bool |
| valid_interval | 每隔多少个epoch进行模型评估 | 1 | int |
| epochs | 训练总epoch数 | int | |
| topk | 评估指标K值大小 | 5 | int |
| image_shape | 图片大小 | [3,224,224] | list, shape: (3,) |
| use_mix | 是否启用mixup | False | ['True', 'False'] |
| ls_epsilon | label_smoothing epsilon值 | 0 | float |
学习率与优化器¶
学习率
| 参数名字 | 具体含义 | 默认值 | 可选值 |
|---|---|---|---|
| function | decay方法名 | "Linear" | ["Linear", "Cosine", "Piecewise", "CosineWarmup"] |
| params.lr | 初始学习率 | 0.1 | float |
| params.decay_epochs | piecewisedecay中 衰减学习率的milestone |
list | |
| params.gamma | piecewisedecay中gamma值 | 0.1 | float |
| params.warmup_epoch | warmup轮数 | 5 | int |
| parmas.steps | lineardecay衰减steps数 | 100 | int |
| params.end_lr | lineardecayend_lr值 | 0 | float |
优化器
| 参数名字 | 具体含义 | 默认值 | 可选值 |
|---|---|---|---|
| function | 优化器方法名 | "Momentum" | ["Momentum", "RmsProp"] |
| params.momentum | momentum值 | 0.9 | float |
| regularizer.function | 正则化方法名 | "L2" | ["L1", "L2"] |
| regularizer.factor | 正则化系数 | 0.0001 | float |
数据读取器与数据处理¶
| 参数名字 | 具体含义 |
|---|---|
| batch_size | 批大小 |
| num_workers | 数据读取器worker数量 |
| file_list | train文件列表 |
| data_dir | train文件路径 |
| shuffle_seed | 用来进行shuffle的seed值 |
数据处理
| 功能名字 | 参数名字 | 具体含义 |
|---|---|---|
| DecodeImage | to_rgb | 数据转RGB |
| to_np | 数据转numpy | |
| channel_first | 按CHW排列的图片数据 | |
| RandCropImage | size | 随机裁剪 |
| RandFlipImage | 随机翻转 | |
| NormalizeImage | scale | 归一化scale值 |
| mean | 归一化均值 | |
| std | 归一化方差 | |
| order | 归一化顺序 | |
| ToCHWImage | 调整为CHW | |
| CropImage | size | 裁剪大小 |
| ResizeImage | resize_short | 按短边调整大小 |
mix处理
| 参数名字 | 具体含义 |
|---|---|
| MixupOperator.alpha | mixup处理中的alpha值 |