L'AI può davvero automatizzare i lavori? @Scale_AI e @ai_risks stanno lanciando il Remote Labor Index (RLI), il primo benchmark e classifica pubblica che testa quanto bene gli agenti AI possono completare lavori freelance reali e retribuiti in settori come ingegneria del software, design, architettura, analisi dei dati e altro ancora. I primi risultati mostrano i limiti dei modelli attuali. Il miglior agente AI ha completato solo il 2,5% dei lavori freelance reali meglio degli esseri umani. L'AI è potente, ma non è ancora abbastanza affidabile da sostituire il lavoro qualificato. L'RLI ci offre un modo trasparente per monitorare i progressi nel tempo e portare chiarezza sul futuro del lavoro.