ML Research Wiki / Benchmarks / Visual Question Answering (VQA) / GRIT

GRIT

Visual Question Answering (VQA) Benchmark

Performance Over Time

📊 Showing 2 results | 📏 Metric: VQA (ablation)

Rank	Model	Paper	VQA (ablation)	Date	Code
1	Unified-IOXL	Unified-IO: A Unified Model for Vision, Language, and Multi-Modal Tasks	74.50	2022-06-17	-
2	GPV-2	Webly Supervised Concept Expansion for General Purpose Vision Models	63.20	2022-02-04	-

2022

Unified-IOXL

2022

GPV-2

Model	Paper	VQA (ablation)	Date	Actions
Unified-IOXL	Unified-IO: A Unified Model for Vision, Language,…	74.50	2022-06-17
GPV-2	Webly Supervised Concept Expansion for General Pu…	63.20	2022-02-04