ML Research Wiki / Benchmarks / Multimodal Reasoning / REBUS

REBUS

Multimodal Reasoning Benchmark

Performance Over Time

📊 Showing 8 results | 📏 Metric: Accuracy

Top Performing Models

Rank	Model	Paper	Accuracy	Date	Code
1	GPT-4V	REBUS: A Robust Evaluation Benchmark of Understanding Symbols	24.00	2024-01-11	📦 cvndsh/rebus
2	Gemini Pro	REBUS: A Robust Evaluation Benchmark of Understanding Symbols	13.20	2024-01-11	📦 cvndsh/rebus
3	LLaVa-1.5-13B	REBUS: A Robust Evaluation Benchmark of Understanding Symbols	1.80	2024-01-11	📦 cvndsh/rebus
4	LLaVa-1.5-7B	REBUS: A Robust Evaluation Benchmark of Understanding Symbols	1.50	2024-01-11	📦 cvndsh/rebus
5	BLIP2-FLAN-T5-XXL	REBUS: A Robust Evaluation Benchmark of Understanding Symbols	0.90	2024-01-11	📦 cvndsh/rebus
6	CogVLM	REBUS: A Robust Evaluation Benchmark of Understanding Symbols	0.90	2024-01-11	📦 cvndsh/rebus
7	QWEN	REBUS: A Robust Evaluation Benchmark of Understanding Symbols	0.90	2024-01-11	📦 cvndsh/rebus
8	InstructBLIP	REBUS: A Robust Evaluation Benchmark of Understanding Symbols	0.60	2024-01-11	📦 cvndsh/rebus

All Papers (8)

REBUS: A Robust Evaluation Benchmark of Understanding Symbols

2024

GPT-4V

cvndsh/rebus

REBUS: A Robust Evaluation Benchmark of Understanding Symbols

2024

Gemini Pro

cvndsh/rebus

REBUS: A Robust Evaluation Benchmark of Understanding Symbols

2024

LLaVa-1.5-13B

cvndsh/rebus

REBUS: A Robust Evaluation Benchmark of Understanding Symbols

2024

LLaVa-1.5-7B

cvndsh/rebus

REBUS: A Robust Evaluation Benchmark of Understanding Symbols

2024

BLIP2-FLAN-T5-XXL

cvndsh/rebus

REBUS: A Robust Evaluation Benchmark of Understanding Symbols

2024

CogVLM

cvndsh/rebus

REBUS: A Robust Evaluation Benchmark of Understanding Symbols

2024

QWEN

cvndsh/rebus

REBUS: A Robust Evaluation Benchmark of Understanding Symbols

2024

InstructBLIP

cvndsh/rebus

REBUS

Performance Over Time

Edit Benchmark Results

Edit Result

Top Performing Models

All Papers (8)

REBUS: A Robust Evaluation Benchmark of Understanding Symbols

REBUS: A Robust Evaluation Benchmark of Understanding Symbols

REBUS: A Robust Evaluation Benchmark of Understanding Symbols

REBUS: A Robust Evaluation Benchmark of Understanding Symbols

REBUS: A Robust Evaluation Benchmark of Understanding Symbols

REBUS: A Robust Evaluation Benchmark of Understanding Symbols

REBUS: A Robust Evaluation Benchmark of Understanding Symbols

REBUS: A Robust Evaluation Benchmark of Understanding Symbols

Model	Paper	Accuracy	Date
GPT-4V	REBUS: A Robust Evaluation Benchmark of Understan…	24.00	2024-01-11
Gemini Pro	REBUS: A Robust Evaluation Benchmark of Understan…	13.20	2024-01-11
LLaVa-1.5-13B	REBUS: A Robust Evaluation Benchmark of Understan…	1.80	2024-01-11
LLaVa-1.5-7B	REBUS: A Robust Evaluation Benchmark of Understan…	1.50	2024-01-11
BLIP2-FLAN-T5-XXL	REBUS: A Robust Evaluation Benchmark of Understan…	0.90	2024-01-11
CogVLM	REBUS: A Robust Evaluation Benchmark of Understan…	0.90	2024-01-11
QWEN	REBUS: A Robust Evaluation Benchmark of Understan…	0.90	2024-01-11
InstructBLIP	REBUS: A Robust Evaluation Benchmark of Understan…	0.60	2024-01-11