📢 Публікуємо нашу останню статтю
Обрано для воркшопу @AAAI '26.
Ми показуємо, що здатність LLM прогнозувати реальні питання з ринків прогнозування (наприклад, полімаркет) суттєво відрізняється залежно від категорії.
👉 Наш метод показує, що, хоча додавання новин допомагає, воно також додає певні режими відмов, такі як дрейф визначення, упередженість недавності та анкорування чуток
📢 Випуск нашої останньої статті
Обрано для участі в @NeurIPSConf семінарі з ефективного міркування!
Показано, що оптимальним методом масштабування часу тестування є ітеративне уточнення за допомогою послідовних кроків.
👉 Наш метод перевершує голосування більшістю голосів паралельними ланцюгами в 95% конфігурацій з підвищенням точності до 46,7% при узгоджених обчисленнях.