ML Research Wiki / Benchmarks / Logical Reasoning / LingOly

LingOly

Logical Reasoning Benchmark

Performance Over Time

📊 Showing 11 results | 📏 Metric: Delta_NoContext

Top Performing Models

Rank	Model	Paper	Date	Code
1	Claude Opus	LINGOLY: A Benchmark of Olympiad-Level Linguistic Reasoning Puzzles in Low-Resource and Extinct Languages	2024-06-10	📦 am-bean/lingOly
2	GPT-4o	LINGOLY: A Benchmark of Olympiad-Level Linguistic Reasoning Puzzles in Low-Resource and Extinct Languages	2024-06-10	📦 am-bean/lingOly
3	Gemini 1.5 Pro	LINGOLY: A Benchmark of Olympiad-Level Linguistic Reasoning Puzzles in Low-Resource and Extinct Languages	2024-06-10	📦 am-bean/lingOly
4	GPT-4	LINGOLY: A Benchmark of Olympiad-Level Linguistic Reasoning Puzzles in Low-Resource and Extinct Languages	2024-06-10	📦 am-bean/lingOly
5	Command R+	LINGOLY: A Benchmark of Olympiad-Level Linguistic Reasoning Puzzles in Low-Resource and Extinct Languages	2024-06-10	📦 am-bean/lingOly
6	GPT-3.5	LINGOLY: A Benchmark of Olympiad-Level Linguistic Reasoning Puzzles in Low-Resource and Extinct Languages	2024-06-10	📦 am-bean/lingOly
7	Mixtral 8x7B	LINGOLY: A Benchmark of Olympiad-Level Linguistic Reasoning Puzzles in Low-Resource and Extinct Languages	2024-06-10	📦 am-bean/lingOly
8	Llama 3 8B	LINGOLY: A Benchmark of Olympiad-Level Linguistic Reasoning Puzzles in Low-Resource and Extinct Languages	2024-06-10	📦 am-bean/lingOly
9	Llama 3 70B	LINGOLY: A Benchmark of Olympiad-Level Linguistic Reasoning Puzzles in Low-Resource and Extinct Languages	2024-06-10	📦 am-bean/lingOly
10	Gemma 7B	LINGOLY: A Benchmark of Olympiad-Level Linguistic Reasoning Puzzles in Low-Resource and Extinct Languages	2024-06-10	📦 am-bean/lingOly

All Papers (11)

LINGOLY: A Benchmark of Olympiad-Level Linguistic Reasoning Puzzles in Low-Resource and Extinct Languages

2024

Claude Opus

am-bean/lingOly

LINGOLY: A Benchmark of Olympiad-Level Linguistic Reasoning Puzzles in Low-Resource and Extinct Languages

2024

GPT-4o

am-bean/lingOly

LINGOLY: A Benchmark of Olympiad-Level Linguistic Reasoning Puzzles in Low-Resource and Extinct Languages

2024

Gemini 1.5 Pro

am-bean/lingOly

LINGOLY: A Benchmark of Olympiad-Level Linguistic Reasoning Puzzles in Low-Resource and Extinct Languages

2024

GPT-4

am-bean/lingOly

LINGOLY: A Benchmark of Olympiad-Level Linguistic Reasoning Puzzles in Low-Resource and Extinct Languages

2024

Command R+

am-bean/lingOly

LINGOLY: A Benchmark of Olympiad-Level Linguistic Reasoning Puzzles in Low-Resource and Extinct Languages

2024

GPT-3.5

am-bean/lingOly

LINGOLY: A Benchmark of Olympiad-Level Linguistic Reasoning Puzzles in Low-Resource and Extinct Languages

2024

Mixtral 8x7B

am-bean/lingOly

LINGOLY: A Benchmark of Olympiad-Level Linguistic Reasoning Puzzles in Low-Resource and Extinct Languages

2024

Llama 3 8B

am-bean/lingOly

LINGOLY: A Benchmark of Olympiad-Level Linguistic Reasoning Puzzles in Low-Resource and Extinct Languages

2024

Llama 3 70B

am-bean/lingOly

LINGOLY: A Benchmark of Olympiad-Level Linguistic Reasoning Puzzles in Low-Resource and Extinct Languages

2024

Gemma 7B

am-bean/lingOly

LINGOLY: A Benchmark of Olympiad-Level Linguistic Reasoning Puzzles in Low-Resource and Extinct Languages

2024

Llama 2 70B

am-bean/lingOly

LingOly

Performance Over Time

Edit Benchmark Results

Edit Result

Top Performing Models

All Papers (11)

LINGOLY: A Benchmark of Olympiad-Level Linguistic Reasoning Puzzles in Low-Resource and Extinct Languages

LINGOLY: A Benchmark of Olympiad-Level Linguistic Reasoning Puzzles in Low-Resource and Extinct Languages

LINGOLY: A Benchmark of Olympiad-Level Linguistic Reasoning Puzzles in Low-Resource and Extinct Languages

LINGOLY: A Benchmark of Olympiad-Level Linguistic Reasoning Puzzles in Low-Resource and Extinct Languages

LINGOLY: A Benchmark of Olympiad-Level Linguistic Reasoning Puzzles in Low-Resource and Extinct Languages

LINGOLY: A Benchmark of Olympiad-Level Linguistic Reasoning Puzzles in Low-Resource and Extinct Languages

LINGOLY: A Benchmark of Olympiad-Level Linguistic Reasoning Puzzles in Low-Resource and Extinct Languages

LINGOLY: A Benchmark of Olympiad-Level Linguistic Reasoning Puzzles in Low-Resource and Extinct Languages

LINGOLY: A Benchmark of Olympiad-Level Linguistic Reasoning Puzzles in Low-Resource and Extinct Languages

LINGOLY: A Benchmark of Olympiad-Level Linguistic Reasoning Puzzles in Low-Resource and Extinct Languages

LINGOLY: A Benchmark of Olympiad-Level Linguistic Reasoning Puzzles in Low-Resource and Extinct Languages

Model	Paper	Date
Claude Opus	LINGOLY: A Benchmark of Olympiad-Level Linguistic…	2024-06-10
GPT-4o	LINGOLY: A Benchmark of Olympiad-Level Linguistic…	2024-06-10
Gemini 1.5 Pro	LINGOLY: A Benchmark of Olympiad-Level Linguistic…	2024-06-10
GPT-4	LINGOLY: A Benchmark of Olympiad-Level Linguistic…	2024-06-10
Command R+	LINGOLY: A Benchmark of Olympiad-Level Linguistic…	2024-06-10
GPT-3.5	LINGOLY: A Benchmark of Olympiad-Level Linguistic…	2024-06-10
Mixtral 8x7B	LINGOLY: A Benchmark of Olympiad-Level Linguistic…	2024-06-10
Llama 3 8B	LINGOLY: A Benchmark of Olympiad-Level Linguistic…	2024-06-10
Llama 3 70B	LINGOLY: A Benchmark of Olympiad-Level Linguistic…	2024-06-10
Gemma 7B	LINGOLY: A Benchmark of Olympiad-Level Linguistic…	2024-06-10
Llama 2 70B	LINGOLY: A Benchmark of Olympiad-Level Linguistic…	2024-06-10