Czy AI naprawdę może zautomatyzować pracę? @Scale_AI i @ai_risks uruchamiają Indeks Pracy Zdalnej (RLI), pierwszy wskaźnik i publiczna tabela wyników, która testuje, jak dobrze agenci AI mogą wykonywać prawdziwą, płatną pracę freelance w takich dziedzinach jak inżynieria oprogramowania, projektowanie, architektura, analiza danych i inne. Wczesne wyniki pokazują ograniczenia dzisiejszych modeli. Najlepszy agent AI wykonał tylko 2,5% prawdziwych zleceń freelance lepiej niż ludzie. AI jest potężne, ale jeszcze nie wystarczająco niezawodne, aby zastąpić wykwalifikowaną siłę roboczą. RLI daje nam przejrzysty sposób śledzenia postępów w czasie i wprowadza jasność w przyszłość pracy.