Trend Olan Konular
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Vay! DeepSeekMath-V2
Yine Jeneratör-Doğrulayıcı mimarisi!
... Kendi kendini doğrulanabilir matematiksel akıl yürütmeye doğru, doğru ve sadık bir LLM tabanlı doğrulayıcıyı teorem ispatı için nasıl eğitileceğini araştırıyoruz. Daha sonra doğrulayıcıyı ödül modeli olarak kullanarak bir ispat üretecini eğitiyoruz ve üreticiyi, kendi kanıtlarında mümkün olduğunca çok sorunu tespit edip çözmeye teşvik ediyoruz, sonra bunları kesinleştiriyoruz. Jeneratör güçlendikçe üretim-doğrulama boşluğunu korumak için, doğrulama hesaplamasını yeni, doğrulaması zor kanıtları otomatik olarak etiketleyecek şekilde ölçeklendirmeyi öneriyoruz ve doğrulamayı daha da geliştirmek için eğitim verisi oluşturuyoruz. Ortaya çıkan modelimiz DeepSeekMath-V2, güçlü teorem kanıtlama yetenekleri gösteriyor; IMO 2025 ve CMO 2024'te altın seviye puanlar ve ölçekli test zamanı hesaplamasıyla Putnam 2024'te neredeyse kusursuz 118/120 puan elde ediyor. Daha çok çalışma olsa da, bu sonuçlar kendini doğrulanabilir matematiksel akıl yürütmenin daha yetenekli matematiksel yapay zeka sistemlerinin geliştirilmesine yardımcı olabilecek uygulanabilir bir araştırma yönü olduğunu gösteriyor.

En İyiler
Sıralama
Takip Listesi

