ML Research Wiki / Benchmarks / Question Answering / Quora Question Pairs

Quora Question Pairs

Question Answering Benchmark

Performance Over Time

📊 Showing 19 results | 📏 Metric: Accuracy

Top Performing Models

Rank	Model	Paper	Accuracy	Date	Code
1	24hBERT	How to Train BERT with an Academic Budget	70.70	2021-04-15	📦 peteriz/academic-budget-bert 📦 IntelLabs/academic-budget-bert 📦 octanove/shiba 📦 yxzwang/normalized-information-payload
2	XLNet (single model)	XLNet: Generalized Autoregressive Pretraining for Language Understanding	0.00	2019-06-19	📦 huggingface/transformers 📦 PaddlePaddle/PaddleNLP 📦 zihangdai/xlnet
3	DeBERTa (large)	DeBERTa: Decoding-enhanced BERT with Disentangled Attention	0.00	2020-06-05	📦 huggingface/transformers 📦 microsoft/DeBERTa 📦 osu-nlp-group/mind2web
4	ALBERT	ALBERT: A Lite BERT for Self-supervised Learning of Language Representations	0.00	2019-09-26	📦 huggingface/transformers 📦 tensorflow/models 📦 PaddlePaddle/PaddleNLP
5	T5-11B	Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer	0.00	2019-10-23	📦 huggingface/transformers 📦 PaddlePaddle/PaddleNLP 📦 google-research/text-to-text-transfer-transformer
6	MLM+ subs+ del-span	CLEAR: Contrastive Learning for Sentence Representation	0.00	2020-12-31	-
7	RoBERTa (ensemble)	RoBERTa: A Robustly Optimized BERT Pretraining Approach	0.00	2019-07-26	📦 huggingface/transformers 📦 pytorch/fairseq 📦 PaddlePaddle/PaddleNLP
8	ERNIE 2.0 Large	ERNIE 2.0: A Continual Pre-training Framework for Language Understanding	0.00	2019-07-29	📦 PaddlePaddle/PaddleNLP 📦 PaddlePaddle/ERNIE 📦 DataScienceNigeria/ERNIE-2.0-from-Baidu-Inc.
9	ELECTRA	ELECTRA: Pre-training Text Encoders as Discriminators Rather Than Generators	0.00	2020-03-23	📦 huggingface/transformers 📦 tensorflow/models 📦 PaddlePaddle/PaddleNLP
10	T5-Large 770M	Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer	0.00	2019-10-23	📦 huggingface/transformers 📦 PaddlePaddle/PaddleNLP 📦 google-research/text-to-text-transfer-transformer

All Papers (19)

How to Train BERT with an Academic Budget

2021

24hBERT

peteriz/academic-budget-bert IntelLabs/academic-budget-bert

XLNet: Generalized Autoregressive Pretraining for Language Understanding

2019

XLNet (single model)

huggingface/transformers PaddlePaddle/PaddleNLP

DeBERTa: Decoding-enhanced BERT with Disentangled Attention

2020

DeBERTa (large)

huggingface/transformers microsoft/DeBERTa

ALBERT: A Lite BERT for Self-supervised Learning of Language Representations

2019

ALBERT

huggingface/transformers tensorflow/models

Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer

2019

T5-11B

huggingface/transformers PaddlePaddle/PaddleNLP

CLEAR: Contrastive Learning for Sentence Representation

2020

MLM+ subs+ del-span

RoBERTa: A Robustly Optimized BERT Pretraining Approach

2019

RoBERTa (ensemble)

huggingface/transformers pytorch/fairseq

ERNIE 2.0: A Continual Pre-training Framework for Language Understanding

2019

ERNIE 2.0 Large

PaddlePaddle/PaddleNLP PaddlePaddle/ERNIE DataScienceNigeria/ERNIE-2.0-from-Baidu-Inc.

ELECTRA: Pre-training Text Encoders as Discriminators Rather Than Generators

2020

ELECTRA

huggingface/transformers tensorflow/models

Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer

2019

T5-Large 770M

huggingface/transformers PaddlePaddle/PaddleNLP

ERNIE 2.0: A Continual Pre-training Framework for Language Understanding

2019

ERNIE 2.0 Base

PaddlePaddle/PaddleNLP PaddlePaddle/ERNIE DataScienceNigeria/ERNIE-2.0-from-Baidu-Inc.

Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer

2019

T5-3B

huggingface/transformers PaddlePaddle/PaddleNLP

Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer

2019

T5-Base

huggingface/transformers PaddlePaddle/PaddleNLP

Simple and Effective Text Matching with Richer Alignment Features

2019

RE2

alibaba-edu/simple-effective-text-matching hitvoice/RE2 alibaba-edu/simple-effective-text-matching-pytorch

DistilBERT, a distilled version of BERT: smaller, faster, cheaper and lighter

2019

DistilBERT 66M

huggingface/transformers PaddlePaddle/PaddleNLP

Big Bird: Transformers for Longer Sequences

2020

BigBird

huggingface/transformers tensorflow/models

Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer

2019

T5-Small

huggingface/transformers PaddlePaddle/PaddleNLP

Baseline Needs More Love: On Simple Word-Embedding-Based Models and Associated Pooling Mechanisms

2018

SWEM-concat

dinghanshen/SWEM nyk510/scdv-python

SqueezeBERT: What can computer vision teach NLP about efficient neural networks?

2020

SqueezeBERT

huggingface/transformers huggingface/transformers

Quora Question Pairs

Performance Over Time

Edit Benchmark Results

Edit Result

Top Performing Models

All Papers (19)

How to Train BERT with an Academic Budget

XLNet: Generalized Autoregressive Pretraining for Language Understanding

DeBERTa: Decoding-enhanced BERT with Disentangled Attention

ALBERT: A Lite BERT for Self-supervised Learning of Language Representations

Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer

CLEAR: Contrastive Learning for Sentence Representation

RoBERTa: A Robustly Optimized BERT Pretraining Approach

ERNIE 2.0: A Continual Pre-training Framework for Language Understanding

ELECTRA: Pre-training Text Encoders as Discriminators Rather Than Generators

Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer

ERNIE 2.0: A Continual Pre-training Framework for Language Understanding

Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer

Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer

Simple and Effective Text Matching with Richer Alignment Features

DistilBERT, a distilled version of BERT: smaller, faster, cheaper and lighter

Big Bird: Transformers for Longer Sequences

Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer

Baseline Needs More Love: On Simple Word-Embedding-Based Models and Associated Pooling Mechanisms

SqueezeBERT: What can computer vision teach NLP about efficient neural networks?

Model	Paper	Accuracy	Date
24hBERT	How to Train BERT with an Academic Budget	70.70	2021-04-15
XLNet (single model)	XLNet: Generalized Autoregressive Pretraining for…		2019-06-19
DeBERTa (large)	DeBERTa: Decoding-enhanced BERT with Disentangled…		2020-06-05
ALBERT	ALBERT: A Lite BERT for Self-supervised Learning …		2019-09-26
T5-11B	Exploring the Limits of Transfer Learning with a …		2019-10-23
MLM+ subs+ del-span	CLEAR: Contrastive Learning for Sentence Represen…		2020-12-31
RoBERTa (ensemble)	RoBERTa: A Robustly Optimized BERT Pretraining Ap…		2019-07-26
ERNIE 2.0 Large	ERNIE 2.0: A Continual Pre-training Framework for…		2019-07-29
ELECTRA	ELECTRA: Pre-training Text Encoders as Discrimina…		2020-03-23
T5-Large 770M	Exploring the Limits of Transfer Learning with a …		2019-10-23
ERNIE 2.0 Base	ERNIE 2.0: A Continual Pre-training Framework for…		2019-07-29
T5-3B	Exploring the Limits of Transfer Learning with a …		2019-10-23
T5-Base	Exploring the Limits of Transfer Learning with a …		2019-10-23
RE2	Simple and Effective Text Matching with Richer Al…		2019-08-01
DistilBERT 66M	DistilBERT, a distilled version of BERT: smaller,…		2019-10-02
BigBird	Big Bird: Transformers for Longer Sequences		2020-07-28
T5-Small	Exploring the Limits of Transfer Learning with a …		2019-10-23
SWEM-concat	Baseline Needs More Love: On Simple Word-Embeddin…		2018-05-24
SqueezeBERT	SqueezeBERT: What can computer vision teach NLP a…		2020-06-19