arXiv cs.CL·28 May 2026

MERIT: Matching Expertise via Rubric-Informed Training for Reviewer Assignment

Signal

Hype

In three linesMERIT is a two-stage framework for large-scale reviewer assignment. A 4B parameter model trained via RL assesses submission-reviewer fit using expertise rubrics guided by an LLM judge, then distills predictions into an embedding-based retriever. Outperforms larger general-purpose LLMs on LR-Bench and CMU Gold dataset.

Read source

Your take?

Reinforcement learning Papers Benchmarks Tools

Summary generated by Claude — human-verified

MERIT: Matching Expertise via Rubric-Informed Training for Reviewer Assignment

Other angles on this story