MSVD-Indonesian

Name: MSVD-Indonesian
Published: 2023-06-20
License: MIT License

Dataset Information

Modalities

Videos, Texts

Languages

Indonesian

Introduced

2023

License

MIT License

Contents

Overview
Associated Benchmarks
Recent Benchmark Submissions
Research Papers

Overview

MSVD-Indonesian is derived from the MSVD dataset, which is obtained with the help of a machine translation service. This dataset can be used for multimodal video-text tasks, including text-to-video retrieval, video-to-text retrieval, and video captioning. Same as the original English dataset, the MSVD-Indonesian dataset contains about 80k video-text pairs.

Variants: MSVD-Indonesian

Associated Benchmarks

This dataset is used in 3 benchmarks:

Video Captioning - Metrics: BLEU-4, CIDEr, METEOR, ROUGE-L
Video Retrieval - Metrics: text-to-video R@1, text-to-video R@5, text-to-video R@10, text-to-video Median Rank, text-to-video Mean Rank, video-to-text R@1, video-to-text R@5, video-to-text R@10, video-to-text Median Rank, video-to-text Mean Rank
Text to Video Retrieval - Metrics: R@1, R@5, R@10, Median Rank, Mean Rank

Recent Benchmark Submissions

Task	Model	Paper	Date
Video Captioning	VNS-GRU (Cross-Lingual)	MSVD-Indonesian: A Benchmark for Multimodal …	2023-06-20
Video Retrieval	X-CLIP (Cross-Lingual)	MSVD-Indonesian: A Benchmark for Multimodal …	2023-06-20
Text to Video Retrieval	X-CLIP (Cross-Lingual)	MSVD-Indonesian: A Benchmark for Multimodal …	2023-06-20

Research Papers

Recent papers with results on this dataset:

MSVD-Indonesian: A Benchmark for Multimodal Video-Text Tasks in Indonesian (2023) -

External Links:

Papers with Code Entry

MSVD-Indonesian

Overview edit

Associated Benchmarks

Recent Benchmark Submissions

Research Papers

Edit Dataset Information

Overview