Retour au feed
Hugging Face Blog·

🇵🇭 FilBench - Can LLMs Understand and Generate Filipino?

Signal
75
Hype
20
En 3 lignesFilBench est un benchmark pour évaluer la compréhension et la génération du Filipino par les LLMs. Le dataset couvre tâches de classification, QA et génération en Filipino et anglais. Résultats montrent des lacunes significatives chez les modèles majeurs.
Lire la source
Ton avis ?
BenchmarksÉvaluations

Résumé généré par Claude — vérifié par l'humain