Benchmarking Fluid LM di @vjhofmann e @allen_ai #COLM2025 Ho già promosso questo documento, è fantastico. Con la difficoltà a livello di elemento (modello IRT) puoi stimare la *capacità latente* di un modello piuttosto che le prestazioni grezze fornendogli campioni che massimizzano il guadagno informativo.