3 months ago

ResMLP: Feedforward networks for image classification with data-efficient training

Hugo Touvron Piotr Bojanowski Mathilde Caron Matthieu Cord Alaaeldin El-Nouby Edouard Grave Gautier Izacard Armand Joulin Gabriel Synnaeve Jakob Verbeek

Abstract

We present ResMLP, an architecture built entirely upon multi-layer perceptrons for image classification. It is a simple residual network that alternates (i) a linear layer in which image patches interact, independently and identically across channels, and (ii) a two-layer feed-forward network in which channels interact independently per patch. When trained with a modern training strategy using heavy data-augmentation and optionally distillation, it attains surprisingly good accuracy/complexity trade-offs on ImageNet. We also train ResMLP models in a self-supervised setup, to further remove priors from employing a labelled dataset. Finally, by adapting our model to machine translation we achieve surprisingly good results. We share pre-trained models and our code based on the Timm library.

Code Repositories

rishikksh20/ResMLP-pytorch

pytorch

Mentioned in GitHub

rwightman/pytorch-image-models

pytorch

Mentioned in GitHub

lucidrains/res-mlp-pytorch

pytorch

Mentioned in GitHub

lalithjets/surgical_vqa

pytorch

Mentioned in GitHub

BR-IDL/PaddleViT/blob/main/image_classification/ResMLP

paddle

liuruiyang98/Jittor-MLP

jax

Mentioned in GitHub

facebookresearch/deit

Official

pytorch

martinsbruveris/tensorflow-image-models

Mentioned in GitHub

IMvision12/keras-vision-models

pytorch

Mentioned in GitHub

yeyinthtoon/tf2-resmlp

MindCode-4/code-13/tree/main/res_mlp_ms

mindspore

https://gitlab.com/birder/birder

pytorch

leondgarse/keras_cv_attention_models/tree/main/keras_cv_attention_models/mlp_family

Mayurji/Image-Classification-PyTorch

pytorch

Mentioned in GitHub

megvii-research/basecls/tree/main/zoo/public/resmlp

xmu-xiaoma666/External-Attention-pytorch

pytorch

Mentioned in GitHub

jaketae/res-mlp

pytorch

Mentioned in GitHub

leaderj1001/Bag-of-MLP

pytorch

Mentioned in GitHub

MindCode-4/code-8/tree/main/res_mlp_ms

mindspore

Benchmarks

Benchmark	Methodology	Metrics
fine-grained-image-classification-on-oxford	ResMLP-12	Accuracy: 97.4%
fine-grained-image-classification-on-oxford	ResMLP-24	Accuracy: 97.9%
fine-grained-image-classification-on-stanford	ResMLP-12	Accuracy: 84.6%
fine-grained-image-classification-on-stanford	ResMLP-24	Accuracy: 89.5%
image-classification-on-certificate	ResMLP-24	Percentage correct: 98.7 Top-1 Accuracy: 98.7
image-classification-on-certificate	ResMLP-12	Percentage correct: 98.1 Top-1 Accuracy: 98.1
image-classification-on-cifar-100	ResMLP-24	Percentage correct: 89.5
image-classification-on-cifar-100	ResMLP-12	Percentage correct: 87.0
image-classification-on-flowers-102	ResMLP12	Accuracy: 97.4
image-classification-on-flowers-102	ResMLP24	Accuracy: 97.9
image-classification-on-imagenet	ResMLP-12 (distilled, class-MLP)	GFLOPs: 3 Number of params: 17.7M Top 1 Accuracy: 78.6%
image-classification-on-imagenet	ResMLP-24	Top 1 Accuracy: 79.4%
image-classification-on-imagenet	ResMLP-S12	Number of params: 15.4M Top 1 Accuracy: 77.8%
image-classification-on-imagenet	ResMLP-36	Number of params: 45M Top 1 Accuracy: 79.7%
image-classification-on-imagenet	ResMLP-S24	GFLOPs: 6 Number of params: 30M Top 1 Accuracy: 80.8%
image-classification-on-imagenet	ResMLP-B24/8	Number of params: 116M Top 1 Accuracy: 83.6%
image-classification-on-imagenet-real	ResMLP-36	Accuracy: 85.6% Params: 45M
image-classification-on-imagenet-real	ResMLP-B24/8 (22k)	Top 1 Accuracy: 84.4%
image-classification-on-imagenet-real	ResMLP-12	Accuracy: 84.6% Params: 15M
image-classification-on-imagenet-real	ResMLP-24	Accuracy: 85.3% Params: 30M
image-classification-on-imagenet-v2	ResMLP-S24/16	Top 1 Accuracy: 69.8
image-classification-on-imagenet-v2	ResMLP-S12/16	Top 1 Accuracy: 66.0
image-classification-on-imagenet-v2	ResMLP-B24/8	Top 1 Accuracy: 73.4
image-classification-on-imagenet-v2	ResMLP-B24/8 22k	Top 1 Accuracy: 74.2
image-classification-on-inaturalist-2018	ResMLP-24	Top-1 Accuracy: 64.3
image-classification-on-inaturalist-2018	ResMLP-12	Top-1 Accuracy: 60.2
image-classification-on-inaturalist-2019	ResMLP-12	Top-1 Accuracy: 71.0
image-classification-on-inaturalist-2019	ResMLP-24	Top-1 Accuracy: 72.5
image-classification-on-stanford-cars	ResMLP-12	Accuracy: 84.6
image-classification-on-stanford-cars	ResMLP-24	Accuracy: 89.5
machine-translation-on-wmt2014-english-french	ResMLP-12	BLEU score: 40.6
machine-translation-on-wmt2014-english-french	ResMLP-6	BLEU score: 40.3
machine-translation-on-wmt2014-english-german	ResMLP-6	BLEU score: 26.4
machine-translation-on-wmt2014-english-german	ResMLP-12	BLEU score: 26.8
self-supervised-image-classification-on	DINO (ResMLP-24)	Number of Params: 30M Top 1 Accuracy: 72.8%
self-supervised-image-classification-on	DINO (ResMLP-12)	Number of Params: 15M Top 1 Accuracy: 67.5%

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding

Ready-to-use GPUs

Best Pricing

Get Started

Hyper Newsletters

Subscribe to our latest updates

We will deliver the latest updates of the week to your inbox at nine o'clock every Monday morning

Command Palette

ResMLP: Feedforward networks for image classification with data-efficient training

Hugo Touvron Piotr Bojanowski Mathilde Caron Matthieu Cord Alaaeldin El-Nouby Edouard Grave Gautier Izacard Armand Joulin Gabriel Synnaeve Jakob Verbeek1 more

Abstract

Code Repositories

Benchmarks

Build AI with AI

Hyper Newsletters

Hugo Touvron Piotr Bojanowski Mathilde Caron Matthieu Cord Alaaeldin El-Nouby Edouard Grave Gautier Izacard Armand Joulin Gabriel Synnaeve Jakob Verbeek