ML Research Wiki / Benchmarks / Program Repair / HumanEvalPack

HumanEvalPack

Program Repair Benchmark

Performance Over Time

📊 Showing 1 results | 📏 Metric: Pass@1

Rank	Model	Paper	Pass@1	Date	Code
1	MGDebugger (DeepSeek-Coder-V2-Lite)	From Code to Correctness: Closing the Last Mile of Code Generation with Hierarchical Debugging	97.60	2024-10-02	📦 YerbaPage/MGDebugger

2024

MGDebugger (DeepSeek-Coder-V2-Lite)

YerbaPage/MGDebugger