A IA pode realmente automatizar trabalhos? @Scale_AI e @ai_risks estão lançando o Índice de Trabalho Remoto (RLI), o primeiro benchmark e tabela de classificação pública que testa o quão bem os agentes de IA podem concluir o trabalho freelance real e pago em domínios como engenharia de software, design, arquitetura, análise de dados e muito mais. Os primeiros resultados mostram os limites dos modelos atuais. O principal agente de IA completou apenas 2,5% dos trabalhos freelance reais melhor do que os humanos. A IA é poderosa, mas ainda não confiável o suficiente para substituir a mão de obra qualificada. O RLI nos dá uma maneira transparente de acompanhar o progresso ao longo do tempo e trazer clareza ao futuro do trabalho.