📢 Publicando nuestro último artículo
Seleccionado para @AAAI taller del 26.
Mostramos que la capacidad de predicción de los LLMs sobre preguntas reales de mercados de predicción (como Polymarket) varía significativamente según la categoría.
👉 Nuestro método muestra que, aunque la adición de noticias ayuda, también añade ciertos modos de fallo como la deriva de definición, el sesgo de recientecencia y el anclaje de rumores
📢 Publicando nuestro último artículo
¡Seleccionado para @NeurIPSConf taller sobre razonamiento eficiente!
Mostramos que el método óptimo de escalado del tiempo de prueba es el refinamiento iterativo a través de pasos secuenciales.
👉 Nuestro método supera la votación mayoritaria por cadenas paralelas en el 95% de las configuraciones con ganancias de precisión de hasta el 46,7% en el cómputo emparejado.