知识蒸馏

共 1 篇文章

微软亚太研究院推出TinyMIM,利用知识蒸馏来优化小型ViT

一、研究动机 近年来,掩码建模(Masked Image Modeling, MIM)作为一种自监督训练方法,展示了其在大规模模型中的有效性。然而,研究发现,MIM在小型模型(如ViT-T 5M参数)上反而可能导致性能下降。特别是在ImageNet上,使用MAE训练的ViT-L相比于传统监督学习模型...
开放I2年前
微软亚太研究院推出TinyMIM,利用知识蒸馏来优化小型ViT