MMLU (Massive Multitask Language Understanding) évalue les compétences linguistiques générales, MATH teste précisément les capacités de raisonnement mathématique, MathVista mesure la compréhension ...
Certains résultats ont été masqués, car ils peuvent vous être inaccessibles.
Afficher les résultats inaccessibles