ML Research Wiki / Benchmarks / Bias Detection / StereoSet

StereoSet

Bias Detection Benchmark

Performance Over Time

📊 Showing 11 results | 📏 Metric: ICAT Score

Top Performing Models

Rank	Model	Paper	ICAT Score	Date	Code
1	GPT-2 (small)	StereoSet: Measuring stereotypical bias in pretrained language models	72.97	2020-04-20	📦 moinnadeem/StereoSet 📦 kanekomasahiro/evaluate_bias_in_mlm 📦 zalkikar/mlm-bias
2	XLNet (large)	StereoSet: Measuring stereotypical bias in pretrained language models	72.03	2020-04-20	📦 moinnadeem/StereoSet 📦 kanekomasahiro/evaluate_bias_in_mlm 📦 zalkikar/mlm-bias
3	GPT-2 (medium)	StereoSet: Measuring stereotypical bias in pretrained language models	71.73	2020-04-20	📦 moinnadeem/StereoSet 📦 kanekomasahiro/evaluate_bias_in_mlm 📦 zalkikar/mlm-bias
4	BERT (base)	StereoSet: Measuring stereotypical bias in pretrained language models	71.21	2020-04-20	📦 moinnadeem/StereoSet 📦 kanekomasahiro/evaluate_bias_in_mlm 📦 zalkikar/mlm-bias
5	GPT-2 (large)	StereoSet: Measuring stereotypical bias in pretrained language models	70.54	2020-04-20	📦 moinnadeem/StereoSet 📦 kanekomasahiro/evaluate_bias_in_mlm 📦 zalkikar/mlm-bias
6	BERT (large)	StereoSet: Measuring stereotypical bias in pretrained language models	69.89	2020-04-20	📦 moinnadeem/StereoSet 📦 kanekomasahiro/evaluate_bias_in_mlm 📦 zalkikar/mlm-bias
7	RoBERTa (base)	StereoSet: Measuring stereotypical bias in pretrained language models	67.50	2020-04-20	📦 moinnadeem/StereoSet 📦 kanekomasahiro/evaluate_bias_in_mlm 📦 zalkikar/mlm-bias
8	GAL 120B	Galactica: A Large Language Model for Science	65.60	2022-11-16	📦 paperswithcode/galai
9	XLNet (base)	StereoSet: Measuring stereotypical bias in pretrained language models	62.10	2020-04-20	📦 moinnadeem/StereoSet 📦 kanekomasahiro/evaluate_bias_in_mlm 📦 zalkikar/mlm-bias
10	GPT-3 (text-davinci-002)	Galactica: A Large Language Model for Science	60.80	2022-11-16	📦 paperswithcode/galai

All Papers (11)

StereoSet: Measuring stereotypical bias in pretrained language models

2020

GPT-2 (small)

moinnadeem/StereoSet kanekomasahiro/evaluate_bias_in_mlm zalkikar/mlm-bias

StereoSet: Measuring stereotypical bias in pretrained language models

2020

XLNet (large)

moinnadeem/StereoSet kanekomasahiro/evaluate_bias_in_mlm zalkikar/mlm-bias

StereoSet: Measuring stereotypical bias in pretrained language models

2020

GPT-2 (medium)

moinnadeem/StereoSet kanekomasahiro/evaluate_bias_in_mlm zalkikar/mlm-bias

StereoSet: Measuring stereotypical bias in pretrained language models

2020

BERT (base)

moinnadeem/StereoSet kanekomasahiro/evaluate_bias_in_mlm zalkikar/mlm-bias

StereoSet: Measuring stereotypical bias in pretrained language models

2020

GPT-2 (large)

moinnadeem/StereoSet kanekomasahiro/evaluate_bias_in_mlm zalkikar/mlm-bias

StereoSet: Measuring stereotypical bias in pretrained language models

2020

BERT (large)

moinnadeem/StereoSet kanekomasahiro/evaluate_bias_in_mlm zalkikar/mlm-bias

StereoSet: Measuring stereotypical bias in pretrained language models

2020

RoBERTa (base)

moinnadeem/StereoSet kanekomasahiro/evaluate_bias_in_mlm zalkikar/mlm-bias

Galactica: A Large Language Model for Science

2022

GAL 120B

paperswithcode/galai

StereoSet: Measuring stereotypical bias in pretrained language models

2020

XLNet (base)

moinnadeem/StereoSet kanekomasahiro/evaluate_bias_in_mlm zalkikar/mlm-bias

Galactica: A Large Language Model for Science

2022

GPT-3 (text-davinci-002)

paperswithcode/galai

Galactica: A Large Language Model for Science

2022

OPT 175B

paperswithcode/galai

StereoSet

Performance Over Time

Edit Benchmark Results

Edit Result

Top Performing Models

All Papers (11)

StereoSet: Measuring stereotypical bias in pretrained language models

StereoSet: Measuring stereotypical bias in pretrained language models

StereoSet: Measuring stereotypical bias in pretrained language models

StereoSet: Measuring stereotypical bias in pretrained language models

StereoSet: Measuring stereotypical bias in pretrained language models

StereoSet: Measuring stereotypical bias in pretrained language models

StereoSet: Measuring stereotypical bias in pretrained language models

Galactica: A Large Language Model for Science

StereoSet: Measuring stereotypical bias in pretrained language models

Galactica: A Large Language Model for Science

Galactica: A Large Language Model for Science

Model	Paper	ICAT Score	Date
GPT-2 (small)	StereoSet: Measuring stereotypical bias in pretra…	72.97	2020-04-20
XLNet (large)	StereoSet: Measuring stereotypical bias in pretra…	72.03	2020-04-20
GPT-2 (medium)	StereoSet: Measuring stereotypical bias in pretra…	71.73	2020-04-20
BERT (base)	StereoSet: Measuring stereotypical bias in pretra…	71.21	2020-04-20
GPT-2 (large)	StereoSet: Measuring stereotypical bias in pretra…	70.54	2020-04-20
BERT (large)	StereoSet: Measuring stereotypical bias in pretra…	69.89	2020-04-20
RoBERTa (base)	StereoSet: Measuring stereotypical bias in pretra…	67.50	2020-04-20
GAL 120B	Galactica: A Large Language Model for Science	65.60	2022-11-16
XLNet (base)	StereoSet: Measuring stereotypical bias in pretra…	62.10	2020-04-20
GPT-3 (text-davinci-002)	Galactica: A Large Language Model for Science	60.80	2022-11-16
OPT 175B	Galactica: A Large Language Model for Science	60.00	2022-11-16