arXiv cs.AI·19 mai 2026

Balancing Knowledge Distillation for Imbalance Learning with Bilevel Optimization

Signal

Hype

En 3 lignesBiKD propose un framework bilevel pour équilibrer dynamiquement les pertes hard et soft en distillation de connaissance sur données déséquilibrées. Un réseau de génération de poids produit des pondérations adaptatives par échantillon, guidé par un ensemble de validation équilibré. Expériences sur CIFAR-10/100 long-tailed montrent des gains sur les méthodes récentes.

Lire la source

Ton avis ?

Fine-tuning Benchmarks Papers

Résumé généré par Claude — vérifié par l'humain

Balancing Knowledge Distillation for Imbalance Learning with Bilevel Optimization

Autres angles sur ce sujet