AlpacaEval

Name: AlpacaEval
Published: 2023-05-22
License: Unknown

Dataset Information

Modalities

Texts

Languages

English

Introduced

2023

License

Unknown

Homepage

Official Website

Contents

Overview
Associated Benchmarks
Recent Benchmark Submissions
Research Papers

Overview

The AlpacaEval set contains 805 instructions form self-instruct, open-assistant, vicuna, koala, hh-rlhf. Those were selected so that the AlpacaEval ranking of models on the AlpacaEval set would be similar to the ranking on the Alpaca demo data.

Variants: AlpacaEval

Associated Benchmarks

This dataset is used in 2 benchmarks:

Text Generation - Metrics: win rate
Chatbot - Metrics: Average win rate

Recent Benchmark Submissions

Task	Model	Paper	Date
Chatbot	Yi 34B Chat	Yi: Open Foundation Models by …	2024-03-07

Research Papers

Recent papers with results on this dataset:

Yi: Open Foundation Models by 01.AI (2024) -

External Links:

AlpacaEval

Overview edit

Associated Benchmarks

Recent Benchmark Submissions

Research Papers

Edit Dataset Information

Overview