Kann KI tatsächlich Jobs automatisieren? @Scale_AI und @ai_risks starten den Remote Labor Index (RLI), den ersten Benchmark und die öffentliche Rangliste, die testet, wie gut KI-Agenten echte, bezahlte Freiberuflerarbeiten in Bereichen wie Softwareentwicklung, Design, Architektur, Datenanalyse und mehr abschließen können. Frühe Ergebnisse zeigen die Grenzen der heutigen Modelle. Der beste KI-Agent hat nur 2,5 % der echten Freiberuflerjobs besser als Menschen abgeschlossen. KI ist mächtig, aber noch nicht zuverlässig genug, um qualifizierte Arbeitskräfte zu ersetzen. Der RLI bietet uns eine transparente Möglichkeit, den Fortschritt im Laufe der Zeit zu verfolgen und Klarheit über die Zukunft der Arbeit zu schaffen.