Tópicos populares
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Caramba… A Meta pode ter acabado de resolver a IA autoaperfeiçoada 🤯
O seu novo artigo SPICE (Auto-Jogo em Ambientes de Corpus) basicamente transforma um modelo de linguagem no seu próprio professor sem humanos, sem rótulos, sem conjuntos de dados, apenas a internet como seu campo de treinamento.
Aqui está a reviravolta: uma cópia do modelo torna-se um Desafiante que vasculha documentos reais para criar problemas de raciocínio difíceis e fundamentados em fatos. Outra cópia torna-se o Raciocinador, tentando resolvê-los sem acesso à fonte.
Eles competem, aprendem e evoluem juntos, um currículo automático com fundamentação no mundo real, para que nunca colapsem em alucinações.
Os resultados são insanos:
+9.1% em benchmarks de raciocínio com Qwen3-4B
+11.9% com OctoThinker-8B
e supera todos os métodos de auto-jogo anteriores, como R-Zero e Absolute Zero.
Isto muda o jogo na autoaperfeiçoamento da IA.
Em vez de girar em torno de lixo sintético, o SPICE cresce minerando conhecimento real - um sistema de circuito fechado com inteligência de mundo aberto.
Se isso escalar, podemos estar olhando para o modelo de referência para modelos de raciocínio autônomos e autoevolutivos.

Top
Classificação
Favoritos

