ML Research Wiki / Benchmarks / Vision and Language Navigation / RxR

RxR

Vision and Language Navigation Benchmark

Performance Over Time

📊 Showing 6 results | 📏 Metric: ndtw

Rank	Model	Paper	ndtw	Date	Code
1	MARVAL 📚	A New Path: Scaling Vision-and-Language Navigation with Synthetic Instructions and Imitation Learning	66.76	2022-10-06	-
2	EnvEdit-PT 📚	EnvEdit: Environment Editing for Vision-and-Language Navigation	64.61	2022-03-29	📦 jialuli-luka/envedit
3	HAMT	History Aware Multimodal Transformer for Vision-and-Language Navigation	59.94	2021-10-25	📦 cshizhe/vln-hamt
4	CLEAR-CLIP 📚	How Much Can CLIP Benefit Vision-and-Language Tasks?	53.69	2021-07-13	📦 clip-vil/CLIP-ViL 📦 jianjieluo/openai-clip-feature 📦 facebookresearch/reliable_vqa 📦 gchhablani/multilingual-vqa
5	Monolingual Baseline	Room-Across-Room: Multilingual Vision-and-Language Navigation with Dense Spatiotemporal Grounding	41.05	2020-10-15	📦 jacobkrantz/VLN-CE 📦 google-research-datasets/RxR 📦 VegB/Diagnose_VLN
6	Multilingual Baseline	Room-Across-Room: Multilingual Vision-and-Language Navigation with Dense Spatiotemporal Grounding	36.81	2020-10-15	📦 jacobkrantz/VLN-CE 📦 google-research-datasets/RxR 📦 VegB/Diagnose_VLN

2022

MARVAL

2022

EnvEdit-PT

jialuli-luka/envedit

2021

HAMT

cshizhe/vln-hamt

2021

CLEAR-CLIP

clip-vil/CLIP-ViL jianjieluo/openai-clip-feature

2020

Monolingual Baseline

jacobkrantz/VLN-CE google-research-datasets/RxR VegB/Diagnose_VLN

2020

Multilingual Baseline

jacobkrantz/VLN-CE google-research-datasets/RxR VegB/Diagnose_VLN

Model	Paper	ndtw	Date
MARVAL	A New Path: Scaling Vision-and-Language Navigatio…	66.76	2022-10-06
EnvEdit-PT	EnvEdit: Environment Editing for Vision-and-Langu…	64.61	2022-03-29
HAMT	History Aware Multimodal Transformer for Vision-a…	59.94	2021-10-25
CLEAR-CLIP	How Much Can CLIP Benefit Vision-and-Language Tas…	53.69	2021-07-13
Monolingual Baseline	Room-Across-Room: Multilingual Vision-and-Languag…	41.05	2020-10-15
Multilingual Baseline	Room-Across-Room: Multilingual Vision-and-Languag…	36.81	2020-10-15