Магазин DApp | Web3-центр мероприятий и игр

Актуальные темы

Alex Albert

Клод Релингс @AnthropicAI. Мнение мое!

Opus 4.5: 7.5-8/10 полезно. Я наконец-то доверяю этой модели писать за меня, и она действительно имеет хорошее суждение/вкус относительно того, что важно. Что касается кодирования, кажется, что она может работать вечно и не застревать в одних и тех же циклах кодирования, как предыдущие модели. Некоторые вещи все еще не идеальны: память, использование компьютера, создание документов, проактивность и т. д., но есть четкое понимание того, как их улучшить (некоторые инновации в UX продукта также необходимы). На данный момент кажется, что мы всего в нескольких поколениях моделей от достижения 10/10 для меня.

Отличный обзор Opus 4.5 >"Кратко: это Sonnet 3.5 2025 года. Попробуйте. Сделайте это сейчас"

Claude Opus 4.5: полный обзор Это лучшее обновление модели за долгое время, когда речь идет о программировании. Меня поражает, насколько это хорошо. Я не видел такого значительного улучшения с момента оригинального релиза gpt-4-0314. Основное улучшение заключается в том, что они наконец-то научили его правильно "думать". Теперь он больше не делает ужасных логических ошибок в своем мышлении. Проблемы вроде "Хорошо, я сейчас запущу тесты. <Тесты провалились> Отлично! Тесты прошли." больше не существуют. Это обобщается на все логические задачи, когда речь идет о мышлении о коде - он крайне редко, если вообще когда-либо, делает ошибки. Следующая большая веха: он больше не пишет неаккуратный код! Это огромно. С Codex вы можете заставить его написать работающий код. Но он пишет ужасный код - бесполезные функции, плохие абстракции и т.д. Это плохо, потому что он работает в краткосрочной перспективе, но в долгосрочной модели она застрянет в углу, где не сможет работать с кодом, который сама же написала. С Opus это не так. Он не только пишет элегантный код, но и знает, как рефакторить неаккуратный код в аккуратный. Он глубоко понимает кодовую базу и может находить элегантные решения, которые не являются просто "механическими" рефакторингами. Он очень автономен и независим. Он сам, сталкиваясь с проблемами, создаст минимальные воспроизводимые примеры, попытается определить, откуда возникает ошибка, а затем исправит ее, не застревая в бесконечных циклах. Даже если ошибка находится в какой-то несвязанной части кода -- коде, который он даже не писал сам!! Он также ДЕЛАЕТ ТО, ЧТО ВЫ ГОВОРИТЕ, БЕЗ УПРОЩЕНИЙ! Это огромно!!! Использование Codex - это, по сути, игра в "бить крота", где он понимает, что вы хотите, но это слишком сложно, поэтому он находит обходные пути к плохому решению, которое вам не нужно. Opus действительно решает проблему и решает ее правильно, даже если это сложно. Долгое понимание контекста практически идеально. В сочетании с механизмом сжатия, доступным в Claude Code по умолчанию, вы можете вести бесконечно длинный разговор, где он понимает все, что в нем, без деградации. Что касается дизайна, исследований, выработки новых идей. Он лучше, но еще не на уровне эксперта-человека. Он может предложить решения, которые я бы считал хорошим дизайном, но он еще не может "думать с порталами". Тем не менее, это хорошее улучшение по сравнению с тем, что у нас было раньше, что было практически несуществующим. Все вышеперечисленное я собрал, тестируя его в течение последних нескольких дней, где задача заключалась в написании интерпретатора для языка, который мы разрабатывали на лету. Это очень нишевый дизайн, похожий на Self и Smalltalk, за исключением того, что мы строим язык внутри самого языка. Это приводит к чрезвычайно сложным сценариям, когда вы пытаетесь определить, как работают функции -- внутри языка -- когда у вас еще нет функций! И он все равно справляется великолепно. Иногда я даже не полностью понимаю, что прошу его сделать, но Opus понимает, и он делает это хорошо. Кратко: это Sonnet 3.5 2025 года. Попробуйте. Сделайте это сейчас.

Топ

Рейтинг

Избранное