.@NVIDIA acaba de realizar uma jogada incrível usando um pequeno modelo de 4B que superou sistemas muito maiores no ARC AGI 2, 29,72% / $0,20 por tarefa! Ao se apoiar em dados sintéticos e treinamento em tempo de teste em vez de escalar à força bruta, a equipe NVARC provou que um design inteligente pode superar a contagem bruta de parâmetros. É um sinal empolgante de que o raciocínio eficiente e adaptativo pode ser a verdadeira fronteira no progresso da AGI - não apenas modelos cada vez maiores. •29,72% de precisão no quadro de líderes oficial do ARC-AGI-2 • Usa um modelo de 4B parâmetros que supera modelos muito maiores e mais caros no mesmo benchmark. • O custo de inferência é de apenas $0,20 por tarefa, possibilitado por dados sintéticos, treinamento em tempo de teste e ferramentas NVIDIA NeMo.
@nvidia Edit: desculpe, a pontuação é 27,64%, cometi um erro. Mas ainda assim é incrivelmente impressionante
29,6K