🇵🇭 FilBench - Can LLMs Understand and Generate Filipino?
Signal
75
Hype
20
En 3 lignesFilBench est un benchmark pour évaluer la compréhension et la génération du Filipino par les LLMs. Le dataset couvre tâches de classification, QA et génération en Filipino et anglais. Résultats montrent des lacunes significatives chez les modèles majeurs.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain