DApp-butik | Web3-hubb för evenemang och spel

Trendande ämnen

Oj! DeepSeekMath-V2 Generator-verifierar-arkitektur igen! ... Mot självverifierbar matematisk resonemang undersöker vi hur man tränar en noggrann och trogen verifierare baserad på LLM för teorembevis. Vi tränar sedan en bevisgenerator med verifieraren som belöningsmodell, och uppmuntrar generatorn att identifiera och lösa så många problem som möjligt i sina egna bevis innan de slutför. För att upprätthålla generationsverifieringsgapet när generatorn blir starkare föreslår vi att verifieringsberäkningen automatiskt märks nya svårverifierade bevis, vilket skapar träningsdata för att ytterligare förbättra verifieraren. Vår resulterande modell, DeepSeekMath-V2, visar starka teorembevisande egenskaper och uppnår guldpoäng på IMO 2025 och CMO 2024 samt nästan perfekta 118/120 på Putnam 2024 med skalad testtidsberäkning. Även om mycket arbete återstår tyder dessa resultat på att självverifierbart matematiskt resonemang är en genomförbar forskningsinriktning som kan hjälpa till att utveckla mer kapabla matematiska AI-system.

Topp

Rankning

Favoriter