ML Research Wiki / Benchmarks / Domain Generalization / ImageNet-R

ImageNet-R

Domain Generalization Benchmark

Performance Over Time

📊 Showing 39 results | 📏 Metric: Top-1 Error Rate

Top Performing Models

Rank	Model	Paper	Top-1 Error Rate	Date	Code
1	Mixer-B/8-SAM	When Vision Transformers Outperform ResNets without Pre-training or Strong Data Augmentations	76.50	2021-06-03	📦 google-research/vision_transformer 📦 ttt496/VisionTransformer
2	ViT-B/16-SAM	When Vision Transformers Outperform ResNets without Pre-training or Strong Data Augmentations	73.60	2021-06-03	📦 google-research/vision_transformer 📦 ttt496/VisionTransformer
3	ResNet-152x2-SAM	When Vision Transformers Outperform ResNets without Pre-training or Strong Data Augmentations	71.90	2021-06-03	📦 google-research/vision_transformer 📦 ttt496/VisionTransformer
4	ResNet-50	Deep Residual Learning for Image Recognition	63.90	2015-12-10	📦 tensorflow/models 📦 tensorflow/models 📦 tensorflow/models
5	AugMix (ResNet-50)	AugMix: A Simple Data Processing Method to Improve Robustness and Uncertainty	58.90	2019-12-05	📦 rwightman/pytorch-image-models 📦 pytorch/vision 📦 keras-team/keras-cv
6	Stylized ImageNet (ResNet-50) 📚	ImageNet-trained CNNs are biased towards texture; increasing shape bias improves accuracy and robustness	58.50	2018-11-29	📦 rgeirhos/texture-vs-shape 📦 rgeirhos/Stylized-ImageNet 📦 LiYingwei/ShapeTextureDebiasedTraining
7	DeepAugment (ResNet-50)	The Many Faces of Robustness: A Critical Analysis of Out-of-Distribution Generalization	57.80	2020-06-29	📦 hendrycks/imagenet-r
8	PRIME (ResNet-50)	PRIME: A few primitives can boost robustness to common corruptions	57.10	2021-12-27	📦 amodas/PRIME-augmentations
9	RVT-Ti*	Towards Robust Vision Transformer	56.10	2021-05-17	📦 alibaba/easyrobust 📦 vtddggg/Robust-Vision-Transformer
10	PRIME with JSD (ResNet-50)	PRIME: A few primitives can boost robustness to common corruptions	53.70	2021-12-27	📦 amodas/PRIME-augmentations

All Papers (39)

When Vision Transformers Outperform ResNets without Pre-training or Strong Data Augmentations

2021

Mixer-B/8-SAM

google-research/vision_transformer ttt496/VisionTransformer

When Vision Transformers Outperform ResNets without Pre-training or Strong Data Augmentations

2021

ViT-B/16-SAM

google-research/vision_transformer ttt496/VisionTransformer

When Vision Transformers Outperform ResNets without Pre-training or Strong Data Augmentations

2021

ResNet-152x2-SAM

google-research/vision_transformer ttt496/VisionTransformer

Deep Residual Learning for Image Recognition

2015

ResNet-50

tensorflow/models tensorflow/models

AugMix: A Simple Data Processing Method to Improve Robustness and Uncertainty

2019

AugMix (ResNet-50)

rwightman/pytorch-image-models pytorch/vision

ImageNet-trained CNNs are biased towards texture; increasing shape bias improves accuracy and robustness

2018

Stylized ImageNet (ResNet-50)

rgeirhos/texture-vs-shape rgeirhos/Stylized-ImageNet

The Many Faces of Robustness: A Critical Analysis of Out-of-Distribution Generalization

2020

DeepAugment (ResNet-50)

hendrycks/imagenet-r

PRIME: A few primitives can boost robustness to common corruptions

2021

PRIME (ResNet-50)

amodas/PRIME-augmentations

Towards Robust Vision Transformer

2021

RVT-Ti*

alibaba/easyrobust vtddggg/Robust-Vision-Transformer

PRIME: A few primitives can boost robustness to common corruptions

2021

PRIME with JSD (ResNet-50)

amodas/PRIME-augmentations

The Many Faces of Robustness: A Critical Analysis of Out-of-Distribution Generalization

2020

DeepAugment+AugMix (ResNet-50)

hendrycks/imagenet-r

Towards Robust Vision Transformer

2021

RVT-S*

alibaba/easyrobust vtddggg/Robust-Vision-Transformer

Sequencer: Deep LSTM for Image Classification

2022

Sequencer2D-L

rwightman/pytorch-image-models timeseriesAI/tsai

Towards Robust Vision Transformer

2021

RVT-B*

alibaba/easyrobust vtddggg/Robust-Vision-Transformer

MetaFormer Baselines for Vision

2022

ConvFormer-B36

rwightman/pytorch-image-models facebookresearch/xformers

MetaFormer Baselines for Vision

2022

ConvFormer-B36 (384)

rwightman/pytorch-image-models facebookresearch/xformers

MetaFormer Baselines for Vision

2022

CAFormer-B36

rwightman/pytorch-image-models facebookresearch/xformers

Pyramid Adversarial Training Improves ViT Performance

2021

Pyramid Adversarial Training Improves ViT

google-research/scenic

MetaFormer Baselines for Vision

2022

CAFormer-B36 (384)

rwightman/pytorch-image-models facebookresearch/xformers

Discrete Representations Strengthen Vision Transformer Robustness

2021

DiscreteViT

alibaba/easyrobust

Vision Models Are More Robust And Fair When Pretrained On Uncurated Images Without Supervision

2022

SEER (RegNet10B)

facebookresearch/vissl

Fully Attentional Networks with Self-emerging Token Labeling

2024

FAN-L-Hybrid+STL

NVlabs/STL

Pyramid Adversarial Training Improves ViT Performance

2021

Pyramid Adversarial Training Improves ViT (Im21k)

google-research/scenic

Improving Vision Transformers by Revisiting High-frequency Components

2022

VOLO-D5+HAT

jiawangbai/HAT

Generalized Parametric Contrastive Learning

2022

GPaCo (ViT-L)

dvlab-research/parametric-contrastive-learning jiequancui/Parametric-Contrastive-Learning

Distilling Out-of-Distribution Robustness from Vision-Language Foundation Models

2023

Discrete Adversarial Distillation (ViT-B,224)

lapisrocks/DiscreteAdversarialDistillation

MetaFormer Baselines for Vision

2022

ConvFormer-B36 (IN21K)

rwightman/pytorch-image-models facebookresearch/xformers

Enhance the Visual Representation via Discrete Adversarial Training

2022

MAE+DAT (ViT-H)

alibaba/easyrobust

Masked Autoencoders Are Scalable Vision Learners

2021

MAE (ViT-H, 448)

facebookresearch/mae lightly-ai/lightly

MetaFormer Baselines for Vision

2022

ConvFormer-B36 (IN21K, 384)

rwightman/pytorch-image-models facebookresearch/xformers

A Whac-A-Mole Dilemma: Shortcuts Come in Multiples Where Mitigating One Amplifies Others

2022

LLE (ViT-H/14, MAE, Edge Aug)

facebookresearch/Whac-A-Mole

A ConvNet for the 2020s

2022

ConvNeXt-XL (Im21k, 384)

keras-team/keras rwightman/pytorch-image-models

MetaFormer Baselines for Vision

2022

CAFormer-B36 (IN21K)

rwightman/pytorch-image-models facebookresearch/xformers

A Whac-A-Mole Dilemma: Shortcuts Come in Multiples Where Mitigating One Amplifies Others

2022

LLE (ViT-B/16, SWAG, Edge Aug)

facebookresearch/Whac-A-Mole

MetaFormer Baselines for Vision

2022

CAFormer-B36 (IN21K, 384)

rwightman/pytorch-image-models facebookresearch/xformers

Understanding The Robustness in Vision Transformers

2022

FAN-Hybrid-L(IN-21K, 384))

nvlabs/fan NVlabs/STL

Context-Aware Robust Fine-Tuning

2022

CAR-FT (CLIP, ViT-L/14@336px)

Model soups: averaging weights of multiple fine-tuned models improves accuracy without increasing inference time

2022

Model soups (ViT-G/14)

mlfoundations/model-soups Burf/ModelSoups

Model soups: averaging weights of multiple fine-tuned models improves accuracy without increasing inference time

2022

Model soups (BASIC-L)

mlfoundations/model-soups Burf/ModelSoups

Model	Paper	Top-1 Error Rate	Date
Mixer-B/8-SAM	When Vision Transformers Outperform ResNets witho…	76.50	2021-06-03
ViT-B/16-SAM	When Vision Transformers Outperform ResNets witho…	73.60	2021-06-03
ResNet-152x2-SAM	When Vision Transformers Outperform ResNets witho…	71.90	2021-06-03
ResNet-50	Deep Residual Learning for Image Recognition	63.90	2015-12-10
AugMix (ResNet-50)	AugMix: A Simple Data Processing Method to Improv…	58.90	2019-12-05
Stylized ImageNet (ResNet-50)	ImageNet-trained CNNs are biased towards texture;…	58.50	2018-11-29
DeepAugment (ResNet-50)	The Many Faces of Robustness: A Critical Analysis…	57.80	2020-06-29
PRIME (ResNet-50)	PRIME: A few primitives can boost robustness to c…	57.10	2021-12-27
RVT-Ti*	Towards Robust Vision Transformer	56.10	2021-05-17
PRIME with JSD (ResNet-50)	PRIME: A few primitives can boost robustness to c…	53.70	2021-12-27
DeepAugment+AugMix (ResNet-50)	The Many Faces of Robustness: A Critical Analysis…	53.20	2020-06-29
RVT-S*	Towards Robust Vision Transformer	52.30	2021-05-17
Sequencer2D-L	Sequencer: Deep LSTM for Image Classification	51.90	2022-05-04
RVT-B*	Towards Robust Vision Transformer	51.30	2021-05-17
ConvFormer-B36	MetaFormer Baselines for Vision	48.90	2022-10-24
ConvFormer-B36 (384)	MetaFormer Baselines for Vision	47.80	2022-10-24
CAFormer-B36	MetaFormer Baselines for Vision	46.10	2022-10-24
Pyramid Adversarial Training Improves ViT	Pyramid Adversarial Training Improves ViT Perform…	46.08	2021-11-30
CAFormer-B36 (384)	MetaFormer Baselines for Vision	45.00	2022-10-24
DiscreteViT	Discrete Representations Strengthen Vision Transf…	44.74	2021-11-20
SEER (RegNet10B)	Vision Models Are More Robust And Fair When Pretr…	43.90	2022-02-16
FAN-L-Hybrid+STL	Fully Attentional Networks with Self-emerging Tok…	43.40	2024-01-08
Pyramid Adversarial Training Improves ViT (Im21k)	Pyramid Adversarial Training Improves ViT Perform…	42.16	2021-11-30
VOLO-D5+HAT	Improving Vision Transformers by Revisiting High-…	40.30	2022-04-03
GPaCo (ViT-L)	Generalized Parametric Contrastive Learning	39.70	2022-09-26
Discrete Adversarial Distillation (ViT-B,224)	Distilling Out-of-Distribution Robustness from Vi…	34.90	2023-11-02
ConvFormer-B36 (IN21K)	MetaFormer Baselines for Vision	34.70	2022-10-24
MAE+DAT (ViT-H)	Enhance the Visual Representation via Discrete Ad…	34.39	2022-09-16
MAE (ViT-H, 448)	Masked Autoencoders Are Scalable Vision Learners	33.50	2021-11-11
ConvFormer-B36 (IN21K, 384)	MetaFormer Baselines for Vision	33.50	2022-10-24
LLE (ViT-H/14, MAE, Edge Aug)	A Whac-A-Mole Dilemma: Shortcuts Come in Multiple…	33.10	2022-12-09
ConvNeXt-XL (Im21k, 384)	A ConvNet for the 2020s	31.80	2022-01-10
CAFormer-B36 (IN21K)	MetaFormer Baselines for Vision	31.70	2022-10-24
LLE (ViT-B/16, SWAG, Edge Aug)	A Whac-A-Mole Dilemma: Shortcuts Come in Multiple…	31.30	2022-12-09
CAFormer-B36 (IN21K, 384)	MetaFormer Baselines for Vision	29.60	2022-10-24
FAN-Hybrid-L(IN-21K, 384))	Understanding The Robustness in Vision Transforme…	28.90	2022-04-26
CAR-FT (CLIP, ViT-L/14@336px)	Context-Aware Robust Fine-Tuning	10.30	2022-11-29
Model soups (ViT-G/14)	Model soups: averaging weights of multiple fine-t…	4.54	2022-03-10
Model soups (BASIC-L)	Model soups: averaging weights of multiple fine-t…	3.90	2022-03-10

ImageNet-R

Performance Over Time

Edit Benchmark Results

Edit Result

Top Performing Models

All Papers (39)