Rubriques tendance
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
J'ai adopté une approche similaire de Générateur-Vérificateur pour l'utilisation de modèles dans la recherche en physique théorique.
Les experts humains à la pointe de la science peuvent améliorer les modèles Vérificateurs au point que l'opération autonome est extrêmement solide même sur des problèmes de recherche du monde réel (pas seulement des problèmes mathématiques artificiels = des problèmes bien posés qui peuvent être résolus dans un temps fini par des humains).
DeepSeekMathV2
Synergie entre le Générateur et le Vérificateur
Le générateur de preuves et le vérificateur forment une boucle de rétroaction auto-améliorante. À mesure que le générateur produit des preuves de plus en plus complexes, celles-ci mettent au défi le vérificateur, exposant des faiblesses qui deviennent de nouvelles données d'entraînement. Au départ, des experts humains guidaient le réentraînement du vérificateur en examinant ses problèmes signalés — un processus rendu efficace en générant plusieurs tentatives de vérification par preuve. Cette "méta-vérification" (vérification des résultats du vérificateur plutôt que des preuves directement) s'est avérée à la fois plus facile pour les humains et plus apprenable pour les LLMs.
En augmentant le nombre d'analyses du vérificateur et en s'entraînant sur ces annotations assistées par IA, le vérificateur a finalement atteint un niveau de fiabilité où l'intervention humaine n'était plus nécessaire lors des dernières exécutions — fermant ainsi la boucle entre la génération de preuves automatisée et la vérification.

28 nov. 2025
Wow ! DeepSeekMath-V2
Architecture Générateur-Vérificateur à nouveau !
... Vers un raisonnement mathématique auto-vérifiable, nous étudions comment former un vérificateur basé sur LLM précis et fidèle pour la démonstration de théorèmes. Nous formons ensuite un générateur de preuves en utilisant le vérificateur comme modèle de récompense, et incitons le générateur à identifier et résoudre autant de problèmes que possible dans ses propres preuves avant de les finaliser. Pour maintenir l'écart génération-vérification à mesure que le générateur devient plus fort, nous proposons de mettre à l'échelle le calcul de vérification pour étiqueter automatiquement de nouvelles preuves difficiles à vérifier, créant ainsi des données d'entraînement pour améliorer davantage le vérificateur. Notre modèle résultant, DeepSeekMath-V2, démontre de fortes capacités de démonstration de théorèmes, atteignant des scores de niveau or sur l'IMO 2025 et le CMO 2024 et un presque parfait 118/120 sur le Putnam 2024 avec un calcul de test à l'échelle. Bien qu'il reste beaucoup de travail, ces résultats suggèrent que le raisonnement mathématique auto-vérifiable est une direction de recherche faisable qui pourrait aider à développer des systèmes d'IA mathématiques plus capables.

Cela décrit la transition d'un pipeline de Générateur-Vérificateur de base utilisant des modèles prêts à l'emploi, vers un pipeline dans lequel le Vérificateur lui-même a été amélioré grâce à des données d'entraînement d'experts humains utilisées dans la méta-vérification.

5,53K
Meilleurs
Classement
Favoris
