Évaluation de Fluid LM par @vjhofmann et @allen_ai #COLM2025 J'ai déjà recommandé cet article, il est excellent. Avec la difficulté au niveau des éléments (modèle IRT), vous pouvez estimer la *capacité latente* d'un modèle plutôt que sa performance brute en lui fournissant des échantillons qui maximisent le gain d'information.