Це дуже цікаво! ScaleAI та AI Risk щойно оприлюднили Індекс віддаленої праці (RLI) - Новий бенчмарк Remote Labor Index (RLI) від Scale AI показує, що навіть найпросунутіші агенти штучного інтелекту ледве можуть виконувати реальну віддалену роботу з професійною якістю. - Найефективніший розробник, Manus, досяг лише 2,5% автоматизації, що означає, що майже всі проекти все ще вимагали людського досвіду. Тим не менш, таблиця лідерів демонструє стабільний прогрес у таких моделях, як Claude Sonnet 4.5, GPT-5 і Gemini 2.5 Pro, натякаючи, що повна автоматизація може рухатися вперед завдяки поступовим удосконаленням, а не стрибкам.