ML Research Wiki / Benchmarks / Reading Comprehension / RACE

RACE

Reading Comprehension Benchmark

Performance Over Time

📊 Showing 24 results | 📏 Metric: Accuracy

Top Performing Models

Rank	Model	Paper	Accuracy	Date	Code
1	ALBERT (Ensemble)	Improving Machine Reading Comprehension with Single-choice Decision and Transfer Learning	91.40	2020-11-06	-
2	Megatron-BERT (ensemble)	Megatron-LM: Training Multi-Billion Parameter Language Models Using Model Parallelism	90.90	2019-09-17	📦 NVIDIA/Megatron-LM 📦 PaddlePaddle/PaddleNLP 📦 kingoflolz/mesh-transformer-jax
3	ALBERTxxlarge+DUMA(ensemble)	DUMA: Reading Comprehension with Transposition Thinking	89.80	2020-01-26	📦 pfZhu/duma_code 📦 iamNCJ/DUMA-pytorch-lightning 📦 RookieZB/duma_implementation_by_tf2
4	Megatron-BERT	Megatron-LM: Training Multi-Billion Parameter Language Models Using Model Parallelism	89.50	2019-09-17	📦 NVIDIA/Megatron-LM 📦 PaddlePaddle/PaddleNLP 📦 kingoflolz/mesh-transformer-jax
5	DeBERTalarge	DeBERTa: Decoding-enhanced BERT with Disentangled Attention	86.80	2020-06-05	📦 huggingface/transformers 📦 microsoft/DeBERTa 📦 osu-nlp-group/mind2web
6	B10-10-10	Funnel-Transformer: Filtering out Sequential Redundancy for Efficient Language Processing	85.70	2020-06-05	📦 huggingface/transformers 📦 laiguokun/Funnel-Transformer 📦 chfhf/funnel-paddle
7	XLNet	XLNet: Generalized Autoregressive Pretraining for Language Understanding	84.00	2019-06-19	📦 huggingface/transformers 📦 PaddlePaddle/PaddleNLP 📦 zihangdai/xlnet
8	RoBERTa	RoBERTa: A Robustly Optimized BERT Pretraining Approach	83.20	2019-07-26	📦 huggingface/transformers 📦 pytorch/fairseq 📦 PaddlePaddle/PaddleNLP
9	Orca 2-13B	Orca 2: Teaching Small Language Models How to Reason	82.87	2023-11-18	-
10	Orca 2-7B	Orca 2: Teaching Small Language Models How to Reason	80.79	2023-11-18	-

All Papers (24)

Improving Machine Reading Comprehension with Single-choice Decision and Transfer Learning

2020

ALBERT (Ensemble)

Megatron-LM: Training Multi-Billion Parameter Language Models Using Model Parallelism

2019

Megatron-BERT (ensemble)

NVIDIA/Megatron-LM PaddlePaddle/PaddleNLP

DUMA: Reading Comprehension with Transposition Thinking

2020

ALBERTxxlarge+DUMA(ensemble)

pfZhu/duma_code iamNCJ/DUMA-pytorch-lightning RookieZB/duma_implementation_by_tf2

Megatron-LM: Training Multi-Billion Parameter Language Models Using Model Parallelism

2019

Megatron-BERT

NVIDIA/Megatron-LM PaddlePaddle/PaddleNLP

DeBERTa: Decoding-enhanced BERT with Disentangled Attention

2020

DeBERTalarge

huggingface/transformers microsoft/DeBERTa

Funnel-Transformer: Filtering out Sequential Redundancy for Efficient Language Processing

2020

B10-10-10

huggingface/transformers laiguokun/Funnel-Transformer chfhf/funnel-paddle

XLNet: Generalized Autoregressive Pretraining for Language Understanding

2019

XLNet

huggingface/transformers PaddlePaddle/PaddleNLP

RoBERTa: A Robustly Optimized BERT Pretraining Approach

2019

RoBERTa

huggingface/transformers pytorch/fairseq

Orca 2: Teaching Small Language Models How to Reason

2023

Orca 2-13B

Orca 2: Teaching Small Language Models How to Reason

2023

Orca 2-7B

Hierarchical Learning for Generation with Long Source Sequences

2021

HAT (Encoder)

Language Models are Few-Shot Learners

2020

GPT-3 175B (0-shot)

ggml-org/llama.cpp ggerganov/llama.cpp

LLaMA: Open and Efficient Foundation Language Models

2023

LLaMA 65B (zero-shot)

huggingface/transformers ggml-org/llama.cpp

PaLM: Scaling Language Modeling with Pathways

2022

PaLM 540B (zero-shot)

lucidrains/CoCa-pytorch lucidrains/PaLM-pytorch

LLaMA: Open and Efficient Foundation Language Models

2023

LLaMA 33B (zero-shot)

huggingface/transformers ggml-org/llama.cpp

PaLM: Scaling Language Modeling with Pathways

2022

PaLM 62B (zero-shot)

lucidrains/CoCa-pytorch lucidrains/PaLM-pytorch

LLaMA: Open and Efficient Foundation Language Models

2023

LLaMA 13B (zero-shot)

huggingface/transformers ggml-org/llama.cpp

LLaMA: Open and Efficient Foundation Language Models

2023

LLaMA 7B (zero-shot)

huggingface/transformers ggml-org/llama.cpp

Language Models are Few-Shot Learners

2020

GPT-3 175B (zero-shot)

ggml-org/llama.cpp ggerganov/llama.cpp

PaLM: Scaling Language Modeling with Pathways

2022

PaLM 8B (zero-shot)

lucidrains/CoCa-pytorch lucidrains/PaLM-pytorch

BloombergGPT: A Large Language Model for Finance

2023

Bloomberg GPT (one-shot)

yangletliu/finlora open-finance-lab/finlora

BloombergGPT: A Large Language Model for Finance

2023

BLOOM 176B (one-shot)

yangletliu/finlora open-finance-lab/finlora

BloombergGPT: A Large Language Model for Finance

2023

OPT 66B (one-shot)

yangletliu/finlora open-finance-lab/finlora

BloombergGPT: A Large Language Model for Finance

2023

GPT-NeoX (one-shot)

yangletliu/finlora open-finance-lab/finlora

RACE

Performance Over Time

Edit Benchmark Results

Edit Result

Top Performing Models

All Papers (24)

Improving Machine Reading Comprehension with Single-choice Decision and Transfer Learning

Megatron-LM: Training Multi-Billion Parameter Language Models Using Model Parallelism

DUMA: Reading Comprehension with Transposition Thinking

Megatron-LM: Training Multi-Billion Parameter Language Models Using Model Parallelism

DeBERTa: Decoding-enhanced BERT with Disentangled Attention

Funnel-Transformer: Filtering out Sequential Redundancy for Efficient Language Processing

XLNet: Generalized Autoregressive Pretraining for Language Understanding

RoBERTa: A Robustly Optimized BERT Pretraining Approach

Orca 2: Teaching Small Language Models How to Reason

Orca 2: Teaching Small Language Models How to Reason

Hierarchical Learning for Generation with Long Source Sequences

Language Models are Few-Shot Learners

LLaMA: Open and Efficient Foundation Language Models

PaLM: Scaling Language Modeling with Pathways

LLaMA: Open and Efficient Foundation Language Models

PaLM: Scaling Language Modeling with Pathways

LLaMA: Open and Efficient Foundation Language Models

LLaMA: Open and Efficient Foundation Language Models

Language Models are Few-Shot Learners

PaLM: Scaling Language Modeling with Pathways

BloombergGPT: A Large Language Model for Finance

BloombergGPT: A Large Language Model for Finance

BloombergGPT: A Large Language Model for Finance

BloombergGPT: A Large Language Model for Finance

Model	Paper	Accuracy	Date
ALBERT (Ensemble)	Improving Machine Reading Comprehension with Sing…	91.40	2020-11-06
Megatron-BERT (ensemble)	Megatron-LM: Training Multi-Billion Parameter Lan…	90.90	2019-09-17
ALBERTxxlarge+DUMA(ensemble)	DUMA: Reading Comprehension with Transposition Th…	89.80	2020-01-26
Megatron-BERT	Megatron-LM: Training Multi-Billion Parameter Lan…	89.50	2019-09-17
DeBERTalarge	DeBERTa: Decoding-enhanced BERT with Disentangled…	86.80	2020-06-05
B10-10-10	Funnel-Transformer: Filtering out Sequential Redu…	85.70	2020-06-05
XLNet	XLNet: Generalized Autoregressive Pretraining for…	84.00	2019-06-19
RoBERTa	RoBERTa: A Robustly Optimized BERT Pretraining Ap…	83.20	2019-07-26
Orca 2-13B	Orca 2: Teaching Small Language Models How to Rea…	82.87	2023-11-18
Orca 2-7B	Orca 2: Teaching Small Language Models How to Rea…	80.79	2023-11-18
HAT (Encoder)	Hierarchical Learning for Generation with Long So…	67.30	2021-04-15
GPT-3 175B (0-shot)	Language Models are Few-Shot Learners	58.40	2020-05-28
LLaMA 65B (zero-shot)	LLaMA: Open and Efficient Foundation Language Mod…	51.60	2023-02-27
PaLM 540B (zero-shot)	PaLM: Scaling Language Modeling with Pathways	49.10	2022-04-05
LLaMA 33B (zero-shot)	LLaMA: Open and Efficient Foundation Language Mod…	48.30	2023-02-27
PaLM 62B (zero-shot)	PaLM: Scaling Language Modeling with Pathways	47.50	2022-04-05
LLaMA 13B (zero-shot)	LLaMA: Open and Efficient Foundation Language Mod…	47.20	2023-02-27
LLaMA 7B (zero-shot)	LLaMA: Open and Efficient Foundation Language Mod…	46.90	2023-02-27
GPT-3 175B (zero-shot)	Language Models are Few-Shot Learners	45.50	2020-05-28
PaLM 8B (zero-shot)	PaLM: Scaling Language Modeling with Pathways	42.30	2022-04-05
Bloomberg GPT (one-shot)	BloombergGPT: A Large Language Model for Finance	41.74	2023-03-30
BLOOM 176B (one-shot)	BloombergGPT: A Large Language Model for Finance	39.14	2023-03-30
OPT 66B (one-shot)	BloombergGPT: A Large Language Model for Finance	37.02	2023-03-30
GPT-NeoX (one-shot)	BloombergGPT: A Large Language Model for Finance	34.33	2023-03-30