Ini sangat menarik! ScaleAI dan AI Risks baru saja merilis Indeks Tenaga Kerja Jarak Jauh (RLI) - Tolok ukur Indeks Tenaga Kerja Jarak Jauh (RLI) baru Scale AI mengungkapkan bahwa bahkan agen AI paling canggih pun hampir tidak dapat melakukan pekerjaan jarak jauh dunia nyata dengan kualitas profesional. - Yang berkinerja terbaik, Manus, hanya mencapai tingkat otomatisasi 2,5%, yang berarti hampir semua proyek masih membutuhkan keahlian manusia. -Namun papan peringkat menunjukkan kemajuan yang stabil di seluruh model seperti Claude Sonnet 4.5, GPT-5, dan Gemini 2.5 Pro, mengisyaratkan bahwa otomatisasi penuh mungkin maju melalui penyempurnaan bertahap daripada lompatan.