📢 Merilis makalah terbaru kami
Terpilih untuk lokakarya @AAAI '26.
Kami menunjukkan bahwa kemampuan peramalan LLM pada pertanyaan dunia nyata dari pasar prediksi (seperti polymarket) bervariasi secara signifikan menurut kategori.
👉 Metode kami menunjukkan bahwa meskipun penambahan berita membantu, itu juga menambahkan mode kegagalan tertentu seperti penyimpangan definisi, bias terkini, dan penahan rumor
📢 Merilis makalah terbaru kami
Terpilih untuk lokakarya @NeurIPSConf tentang penalaran yang efisien!
Kami menunjukkan bahwa metode penskalaan waktu pengujian yang optimal adalah penyempurnaan berulang melalui langkah-langkah berurutan.
👉 Metode kami mengalahkan pemungutan suara mayoritas berdasarkan rantai paralel dalam 95% konfigurasi dengan perolehan akurasi hingga 46,7% pada komputasi yang cocok.