Edit Models filters

Model Tree

Apps

Docker Model Runner

Inference Providers

OVHcloud AI Endpoints

HF Inference API

Misc

Inference Endpoints

text-generation-inference

Eval Results (legacy)

text-embeddings-inference

4-bit precision

8-bit precision

Mixture of Experts

Carbon Emissions

Models

31

Base only

Active filters: prm, trl

qgallouedec/Qwen2-0.5B-Reward

Token Classification • 0.5B • Updated Sep 14, 2025 • 5

plaguss/Qwen2.5-Math-7B-PRM-0.1

Token Classification • 7B • Updated Dec 13, 2024 • 2

plaguss/Qwen2.5-Math-7B-Instruct-PRM-0.1

Token Classification • 7B • Updated Dec 13, 2024 • 1

plaguss/Qwen2.5-Math-1.5B-Instruct-PRM-0.1

Token Classification • 2B • Updated Jan 8, 2025 • 3

HuggingFaceH4/Qwen2.5-Math-1.5B-Instruct-PRM-0.2

Token Classification • 2B • Updated Jan 9, 2025 • 57

HuggingFaceH4/Qwen2.5-Math-7B-Instruct-PRM-0.2

Token Classification • 7B • Updated Jan 9, 2025 • 5

MikeMpapa/trase-prm

Token Classification • 66.4M • Updated Jan 15, 2025 • 2

MikeMpapa/TraseSystem-orm-codeblob-verifier

Token Classification • 0.5B • Updated Jan 17, 2025 • 11

smohammadi/Qwen2.5-3B-MathShepherd

Token Classification • 3B • Updated Jan 22, 2025 • 8

axolotl-ai-co/Qwen2.5-Math-PRM-7B

Token Classification • 7B • Updated Feb 18, 2025 • 3 • 1

alothomas/Qwen2.5-0.5B-PRM-RAD-balanced-V3

Token Classification • 0.5B • Updated Feb 22, 2025 • 59

alothomas/Qwen2.5-3B-PRM-RAD-balanced-V3

Token Classification • 3B • Updated Feb 22, 2025 • 4

alothomas/Qwen2.5-0.5B-PRM-RAD-balanced-V4

Token Classification • 0.5B • Updated Feb 23, 2025 • 10

alothomas/Qwen2.5-0.5B-PRM-RAD-balanced-150k

Token Classification • 0.5B • Updated Mar 3, 2025 • 18

alothomas/Qwen2.5-3B-PRM-RAD-balanced-150k

Token Classification • 3B • Updated Mar 4, 2025 • 11

hzy/Qwen2.5-Math-7B-Instruct-PRM-Modified-math_shepherd

Token Classification • 7B • Updated Mar 10, 2025 • 6

jacopo-minniti/uats-value-model

Token Classification • 2B • Updated Aug 19, 2025 • 6

jacopo-minniti/Qwen2.5-Math-7B-PUM

Token Classification • 7B • Updated Aug 26, 2025 • 5

jacopo-minniti/Qwen2.5-Math-7B-PUM-half_entropy

Token Classification • 7B • Updated Aug 30, 2025 • 3

jacopo-minniti/Qwen2.5-Math-7B-PUM-soft-classification

2B • Updated Sep 14, 2025

alothomas/Qwen2.5-0.5B-PRM-RAD-balanced-150k-LastStepOnly

Token Classification • 0.5B • Updated Sep 24, 2025

jacopo-minniti/Qwen2.5-Math-1.5B-PUM-variance

2B • Updated Sep 25, 2025 • 1

jacopo-minniti/Qwen2.5-Math-1.5B-PUM-binary-variance

Token Classification • 2B • Updated Oct 6, 2025 • 2

jacopo-minniti/Qwen2.5-Math-1.5B-PUM-entropy_binary

Token Classification • 2B • Updated Oct 14, 2025 • 5

yungshun317/qwen2.5-0.5B-prm-mathshepherd

Token Classification • 0.5B • Updated Oct 30, 2025 • 3

jacopo-minniti/R1-Qwen-MMLU-1.5B-PUM-Variance

2B • Updated Dec 8, 2025 • 1

jacopo-minniti/R1-Qwen-MMLU-1.5B-PRM

2B • Updated Dec 8, 2025

jacopo-minniti/R1-Qwen-MMLU-1.5B-PRM-Regression

2B • Updated Nov 18, 2025 • 2

yinyil/stage2

Updated Dec 16, 2025

ZaandaTeika/Qwen2.5-Math-7B-Instruct-SHARP-PRM800K-Classifier

Token Classification • 7B • Updated Dec 30, 2025 • 3