Магазин DApp | Центр Web3 для подій та ігор

Актуальні теми

Cooper

Claude Opus 4.5: повний огляд Це найкращий реліз моделі за довгий довгий час, коли йдеться про програмування. Мене вражає, наскільки це добре. Я не бачив такого великого покращення з часу оригінального релізу GPT-4-0314 Головне покращення — вони нарешті зрозуміли, як правильно «мислити». Він більше не допускає жахливих логічних помилок у своєму мисленні. Проблеми на кшталт «Добре, я зараз проведу тести. <Тести не проходять> Чудово! Тести проходять.» — це вже не актуально. Це узагальнюється практично на ВСЮ логіку, коли йдеться про код — він надзвичайно рідко, якщо взагалі, робить помилки. Наступна велика віха: він більше не пише код-помилки! Це величезна справа. З Codex можна змусити його писати робочий код. Але він пише жахливий код — марні функції, погані абстракції тощо. Це прикро, бо це працює короткочасно, але в довгостроковій модель загнане себе в глухий кут, де більше не зможе працювати з кодом, який написала сама. З Opus це не так. Він не лише пише елегантний код, а й вміє рефакторити slop-код у не-slop код. Він глибоко розуміє кодову базу і може знаходити елегантні рішення, які не є просто «механічними» рефакторингами. Він дуже автономний і незалежний. Він сам по собі, коли виникають проблеми, створює мінімальні відтворювані приклади, намагається розділити помилку, а потім виправляє її, не застрягаючи в кролячих норах. Навіть якщо помилка в якійсь непов'язаній частині коду — коді, який він навіть сам не написав!! Він також РОБИТЬ САМЕ ТЕ, ЩО ВИ КАЖЕТЕ, БЕЗ УПЕРЕДЖЕННЯ! Це дуже важливо!! Використання Codex — це, по суті, гра в режим «вдар крота», де він розуміє, чого ти хочеш, але це надто складно, тому він винагороджує і зникає у поганому рішення, яке ти не хочеш. Opus справді вирішує проблему і вирішує її належним чином, навіть якщо це складно. Розуміння довгого контексту майже ідеальне. У поєднанні з механізмом ущільнення, доступним у Claude Code за замовчуванням, ви фактично можете вести нескінченно довгу розмову, де він розуміє все, що всередині, без жодних погіршень. Щодо дизайну, досліджень, створення нових ідей. Він кращий, але не зовсім на рівні експерта-людини. Він може запропонувати рішення, які я вважаю хорошим дизайном, але поки що не може «мислити з порталами». Втім, це був значний прогрес порівняно з тим, що було раніше, якого практично не було. Усе це я зібрав, тестуючи його за останні кілька днів, де завдання полягає в тому, щоб написати інтерпретатор для мови, яку ми розробляли на ходу. Це дуже нішевий дизайн, схожий на Self і Smalltalk, але ми будуємо мову всередині самої мови. Це призводить до надзвичайно складних ситуацій, коли ви намагаєтеся визначити, як працюють функції — всередині мови — хоча у вас ще немає функцій! І він досі чудово справляється зі своєю роботою. Іноді я навіть не зовсім розумію, що саме прошу зробити, але Opus розуміє, і робить це добре. Коротко; DR: Це Sonnet 3.5 2025 року. Спробуй. Роби це зараз

Найкращі

Рейтинг

Вибране