Retour au feed
arXiv cs.CL·

Text-Preserving Lossy Text Compression: A Study of Strategic Deletion and LLM Reconstruction

Signal
75
Hype
15
En 3 lignesÉtude de compression textuelle lossy où un encodeur supprime stratégiquement des parties du texte et un LLM reconstruit le contenu original. Benchmark de 6 stratégies de suppression (uniforme, fréquence, entropie, optimisation LP, hybrides) sur BBC News. WordFreq offre le meilleur rapport coût/performance ; les méthodes sémantiques brillent en compression modérée ; QLoRA fine-tuning rivalise avec Gemini 2.0 Flash.
Lire la source
Ton avis ?
BenchmarksRaisonnementFine-tuningPapers

Résumé généré par Claude — vérifié par l'humain