Caramba… A Meta pode ter acabado de resolver a IA autoaperfeiçoada 🤯 O seu novo artigo SPICE (Auto-Jogo em Ambientes de Corpus) basicamente transforma um modelo de linguagem no seu próprio professor sem humanos, sem rótulos, sem conjuntos de dados, apenas a internet como seu campo de treinamento. Aqui está a reviravolta: uma cópia do modelo torna-se um Desafiante que vasculha documentos reais para criar problemas de raciocínio difíceis e fundamentados em fatos. Outra cópia torna-se o Raciocinador, tentando resolvê-los sem acesso à fonte. Eles competem, aprendem e evoluem juntos, um currículo automático com fundamentação no mundo real, para que nunca colapsem em alucinações. Os resultados são insanos: +9.1% em benchmarks de raciocínio com Qwen3-4B +11.9% com OctoThinker-8B e supera todos os métodos de auto-jogo anteriores, como R-Zero e Absolute Zero. Isto muda o jogo na autoaperfeiçoamento da IA. Em vez de girar em torno de lixo sintético, o SPICE cresce minerando conhecimento real - um sistema de circuito fechado com inteligência de mundo aberto. Se isso escalar, podemos estar olhando para o modelo de referência para modelos de raciocínio autônomos e autoevolutivos.