ML Research Wiki / Benchmarks / Key Information Extraction / SROIE

SROIE

Key Information Extraction Benchmark

Performance Over Time

📊 Showing 5 results | 📏 Metric: F1

Rank	Model	Paper	F1	Date	Code
1	LayoutLMv2LARGE (Excluding OCR mismatch)	LayoutLMv2: Multi-modal Pre-training for Visually-Rich Document Understanding	97.81	2020-12-29	📦 huggingface/transformers 📦 PaddlePaddle/PaddleOCR 📦 microsoft/unilm
2	RORE (GeoLayoutLM)	Modeling Layout Reading Order as Ordering Relations for Visually-rich Document Understanding	96.97	2024-09-29	📦 chongzhangFDU/ROOR
3	LayoutLMv2LARGE	LayoutLMv2: Multi-modal Pre-training for Visually-Rich Document Understanding	96.61	2020-12-29	📦 huggingface/transformers 📦 PaddlePaddle/PaddleOCR 📦 microsoft/unilm
4	LayoutLMv2BASE	LayoutLMv2: Multi-modal Pre-training for Visually-Rich Document Understanding	96.25	2020-12-29	📦 huggingface/transformers 📦 PaddlePaddle/PaddleOCR 📦 microsoft/unilm
5	ChatGPT 3.5 SpatialFormat	LAPDoc: Layout-Aware Prompting for Documents	77.00	2024-02-15	-

2020

LayoutLMv2LARGE (Excluding OCR mismatch)

huggingface/transformers PaddlePaddle/PaddleOCR

2024

RORE (GeoLayoutLM)

chongzhangFDU/ROOR

2020

LayoutLMv2LARGE

huggingface/transformers PaddlePaddle/PaddleOCR

2020

LayoutLMv2BASE

huggingface/transformers PaddlePaddle/PaddleOCR

2024

ChatGPT 3.5 SpatialFormat

Model	Paper	F1	Date
LayoutLMv2LARGE (Excluding OCR mismatch)	LayoutLMv2: Multi-modal Pre-training for Visually…	97.81	2020-12-29
RORE (GeoLayoutLM)	Modeling Layout Reading Order as Ordering Relatio…	96.97	2024-09-29
LayoutLMv2LARGE	LayoutLMv2: Multi-modal Pre-training for Visually…	96.61	2020-12-29
LayoutLMv2BASE	LayoutLMv2: Multi-modal Pre-training for Visually…	96.25	2020-12-29
ChatGPT 3.5 SpatialFormat	LAPDoc: Layout-Aware Prompting for Documents	77.00	2024-02-15