一、基本图像处理的扩增

常见的就是对图像进行几何变换,图像翻转,裁剪,旋转和平移等等,还可以使用对比度,锐化,白平衡,色彩抖动,随机色彩处理和许多其他技术来更改图像的色彩空间。

此外,还可以使用遮挡类的方法,如 CutOut、RandomRrase、GridMask。Cutmix 就是将一部分区域 cut 掉但不填充 0 像素而是随机填充训练集中的其他数据的区域像素值,分类结果按一定的比例分配,CutMix 的操作使得模型能够从一幅图像上的局部视图上识别出两个目标,提高训练的效率。

而 Mosaic 数据增强方法是 YOLOV4 论文中提出来的,主要思想是将四张图片进行随机裁剪,再拼接到一张图上作为训练数据,这样做的好处是丰富了图片的背景。

基础的图形扩增方法在很多深度学习框架中都有实现,例如:torchvision。还有一些更加全面丰富的数据扩增库,如 albumentations 等等。

二、特征空间扩增

**论文标题:**On Feature Normalization and Data Augmentation(MoEx)

论文链接:https://arxiv.org/abs/2002.11102

代码链接:https://github.com/Boyiliee/MoEx

三、GAN-based Data Augmentation

生成建模是当前最火的技术之一,生成模型学习数据的分布,而不是数据之间的边界,因此,可以生成全新的图像。

**论文标题:**Emotion classification with data augmentation using generative adversarial networks.

论文链接:https://arxiv.org/abs/1711.00648

四、NAS-based Data Augmentation

让网络自主的寻找数据增强方法

**论文标题:**AutoAugment: Searching for best Augmentation policies Directly on the Dataset of Interest

论文链接:https://arxiv.org/abs/1805.09501