ML Research Wiki / Benchmarks / Zero-Shot Learning / MedConceptsQA

MedConceptsQA

Zero-Shot Learning Benchmark

Performance Over Time

📊 Showing 12 results | 📏 Metric: Accuracy

Top Performing Models

Rank	Model	Paper	Accuracy	Date	Code
1	gpt-4-0125-preview	GPT-4 Technical Report	52.49	2023-03-15	📦 openai/evals 📦 shmsw25/factscore 📦 unispac/visual-adversarial-examples-jailbreak-large-language-models
2	gpt-3.5-turbo	Language Models are Few-Shot Learners	37.06	2020-05-28	📦 ggml-org/llama.cpp 📦 ggerganov/llama.cpp 📦 karpathy/llm.c
3	dmis-lab/biobert-v1.1	BioBERT: a pre-trained biomedical language representation model for biomedical text mining	26.15	2019-01-25	📦 dmis-lab/biobert 📦 EmilyAlsentzer/clinicalBERT 📦 naver/biobert-pretrained
4	meta-llama/Meta-Llama-3-8B-Instruct	LLaMA: Open and Efficient Foundation Language Models	25.84	2023-02-27	📦 huggingface/transformers 📦 ggml-org/llama.cpp 📦 ggerganov/llama.cpp
5	epfl-llm/meditron-7b	MEDITRON-70B: Scaling Medical Pretraining for Large Language Models	25.75	2023-11-27	📦 epfllm/meditron
6	dmis-lab/meerkat-7b-v1.0	Small Language Models Learn Enhanced Reasoning Skills from Medical Textbooks	25.68	2024-03-30	-
7	HuggingFaceH4/zephyr-7b-beta	Zephyr: Direct Distillation of LM Alignment	25.54	2023-10-25	📦 huggingface/alignment-handbook 📦 Savannah120/alignment-handbook-PoFT
8	epfl-llm/meditron-70b	MEDITRON-70B: Scaling Medical Pretraining for Large Language Models	25.36	2023-11-27	📦 epfllm/meditron
9	yikuan8/Clinical-Longformer	Clinical-Longformer and Clinical-BigBird: Transformers for long clinical sequences	25.04	2022-01-27	📦 luoyuanlab/clinical-longformer
10	UFNLP/gatortron-medium	GatorTron: A Large Clinical Language Model to Unlock Patient Information from Unstructured Electronic Health Records	24.86	2022-02-02	-

All Papers (12)

GPT-4 Technical Report

2023

gpt-4-0125-preview

openai/evals shmsw25/factscore

Language Models are Few-Shot Learners

2020

gpt-3.5-turbo

ggml-org/llama.cpp ggerganov/llama.cpp

BioBERT: a pre-trained biomedical language representation model for biomedical text mining

2019

dmis-lab/biobert-v1.1

dmis-lab/biobert EmilyAlsentzer/clinicalBERT

LLaMA: Open and Efficient Foundation Language Models

2023

meta-llama/Meta-Llama-3-8B-Instruct

huggingface/transformers ggml-org/llama.cpp

MEDITRON-70B: Scaling Medical Pretraining for Large Language Models

2023

epfl-llm/meditron-7b

epfllm/meditron

Small Language Models Learn Enhanced Reasoning Skills from Medical Textbooks

2024

dmis-lab/meerkat-7b-v1.0

Zephyr: Direct Distillation of LM Alignment

2023

HuggingFaceH4/zephyr-7b-beta

huggingface/alignment-handbook Savannah120/alignment-handbook-PoFT

MEDITRON-70B: Scaling Medical Pretraining for Large Language Models

2023

epfl-llm/meditron-70b

epfllm/meditron

Clinical-Longformer and Clinical-BigBird: Transformers for long clinical sequences

2022

yikuan8/Clinical-Longformer

luoyuanlab/clinical-longformer

GatorTron: A Large Clinical Language Model to Unlock Patient Information from Unstructured Electronic Health Records

2022

UFNLP/gatortron-medium

BioMedGPT: Open Multimodal Generative Pre-trained Transformer for BioMedicine

2023

PharMolix/BioMedGPT-LM-7B

pharmolix/openbiomed

BioMistral: A Collection of Open-Source Pretrained Large Language Models for Medical Domains

2024

BioMistral/BioMistral-7B-DARE

biomistral/biomistral

MedConceptsQA

Performance Over Time

Edit Benchmark Results

Edit Result

Top Performing Models

All Papers (12)

GPT-4 Technical Report

Language Models are Few-Shot Learners

BioBERT: a pre-trained biomedical language representation model for biomedical text mining

LLaMA: Open and Efficient Foundation Language Models

MEDITRON-70B: Scaling Medical Pretraining for Large Language Models

Small Language Models Learn Enhanced Reasoning Skills from Medical Textbooks

Zephyr: Direct Distillation of LM Alignment

MEDITRON-70B: Scaling Medical Pretraining for Large Language Models

Clinical-Longformer and Clinical-BigBird: Transformers for long clinical sequences

GatorTron: A Large Clinical Language Model to Unlock Patient Information from Unstructured Electronic Health Records

BioMedGPT: Open Multimodal Generative Pre-trained Transformer for BioMedicine

BioMistral: A Collection of Open-Source Pretrained Large Language Models for Medical Domains

Model	Paper	Accuracy	Date
gpt-4-0125-preview	GPT-4 Technical Report	52.49	2023-03-15
gpt-3.5-turbo	Language Models are Few-Shot Learners	37.06	2020-05-28
dmis-lab/biobert-v1.1	BioBERT: a pre-trained biomedical language repres…	26.15	2019-01-25
meta-llama/Meta-Llama-3-8B-Instruct	LLaMA: Open and Efficient Foundation Language Mod…	25.84	2023-02-27
epfl-llm/meditron-7b	MEDITRON-70B: Scaling Medical Pretraining for Lar…	25.75	2023-11-27
dmis-lab/meerkat-7b-v1.0	Small Language Models Learn Enhanced Reasoning Sk…	25.68	2024-03-30
HuggingFaceH4/zephyr-7b-beta	Zephyr: Direct Distillation of LM Alignment	25.54	2023-10-25
epfl-llm/meditron-70b	MEDITRON-70B: Scaling Medical Pretraining for Lar…	25.36	2023-11-27
yikuan8/Clinical-Longformer	Clinical-Longformer and Clinical-BigBird: Transfo…	25.04	2022-01-27
UFNLP/gatortron-medium	GatorTron: A Large Clinical Language Model to Unl…	24.86	2022-02-02
PharMolix/BioMedGPT-LM-7B	BioMedGPT: Open Multimodal Generative Pre-trained…	24.75	2023-08-18
BioMistral/BioMistral-7B-DARE	BioMistral: A Collection of Open-Source Pretraine…	24.57	2024-02-15