📢 En son makalemizi yayımlıyor
@AAAI '26 atölyesi için seçildi.
LLM'lerin tahmin piyasalarından (örneğin polimarket) alınan gerçek dünya sorularında tahmin yeteneğinin kategoriye göre önemli ölçüde değiştiğini gösteriyoruz.
👉 Yöntemimiz, haber eklemenin yardımcı olduğunu ancak tanım kaygısı, güncel yanlılık ve söylenti sabitleme gibi bazı başarısızlık modlarını da ekliyor
📢 En son makalemizi yayınlıyoruz
Etkili akıl yürütme üzerine @NeurIPSConf atölye çalışması için seçildi!
Optimum test süresi ölçeklendirme yönteminin sıralı adımlarla yinelemeli olarak iyileştirme olduğunu gösteriyoruz.
👉 Yöntemimiz, eşleşen hesaplamada %95'ye varan doğruluk kazanımlarıyla yapılandırmaların %46.7'inde paralel zincirler tarafından çoğunluk oylamasını geride bırakıyor.