arXiv cs.AI·19 mai 2026

Prompt Compression in Diffusion Large Language Models: Evaluating LLMLingua-2 on LLaDA

Signal

Hype

En 3 lignesÉtude de la compression de prompts sur LLaDA, un DLLM de 8B paramètres, utilisant LLMLingua-2. Évaluation sur GSM8K, DUC2004, ShareGPT avec ratio 2× montre que la préservation sémantique ne garantit pas la stabilité en modèles diffusion : le raisonnement mathématique se dégrade fortement tandis que la résumé reste robuste. Les méthodes de compression autorégressives ne transfèrent pas uniformément aux DLLMs.

Lire la source

Ton avis ?

Prompt engineering Benchmarks Raisonnement Évaluations

Résumé généré par Claude — vérifié par l'humain

Prompt Compression in Diffusion Large Language Models: Evaluating LLMLingua-2 on LLaDA

Autres angles sur ce sujet