📢 Phát hành tài liệu mới nhất của chúng tôi
Được chọn cho hội thảo @AAAI '26.
Chúng tôi chỉ ra rằng khả năng dự đoán của LLMs đối với các câu hỏi thực tế từ các thị trường dự đoán (như polymarket) thay đổi đáng kể theo từng loại.
👉 Phương pháp của chúng tôi cho thấy rằng trong khi việc thêm tin tức có ích, nó cũng tạo ra một số chế độ thất bại nhất định như trôi định nghĩa, thiên lệch gần đây và neo tin đồn.
📢 Phát hành tài liệu mới nhất của chúng tôi
Được chọn cho hội thảo @NeurIPSConf về lý luận hiệu quả!
Chúng tôi cho thấy rằng phương pháp tối ưu để mở rộng thời gian kiểm tra là tinh chỉnh lặp đi lặp lại qua các bước tuần tự.
👉 Phương pháp của chúng tôi vượt trội hơn so với bỏ phiếu đa số bằng các chuỗi song song trong 95% các cấu hình với mức tăng độ chính xác lên tới 46.7% tại các tính toán tương ứng.