A IA pode realmente automatizar empregos? @Scale_AI e @ai_risks estão lançando o Índice de Trabalho Remoto (RLI), o primeiro benchmark e leaderboard público que testa quão bem os agentes de IA podem completar trabalhos freelance reais e pagos em domínios como engenharia de software, design, arquitetura, análise de dados e mais. Os resultados iniciais mostram os limites dos modelos atuais. O melhor agente de IA completou apenas 2,5% dos trabalhos freelance reais melhor do que os humanos. A IA é poderosa, mas ainda não é confiável o suficiente para substituir mão de obra qualificada. O RLI nos dá uma maneira transparente de acompanhar o progresso ao longo do tempo e trazer clareza para o futuro do trabalho.