Порівняльний аналіз рідини LM з @vjhofmann та @allen_ai #COLM2025 Я вже шилив цей папір, він чудовий. За допомогою рівня складності елемента (модель IRT) ви можете оцінити *латентну здатність* моделі, а не необроблену продуктивність, надаючи їй зразки, які максимізують отримання інформації