Актуальные темы
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Claude Opus 4.5: полный обзор
Это лучшее обновление модели за долгое время, когда речь идет о программировании. Меня поражает, насколько это хорошо. Я не видел такого значительного улучшения с момента оригинального релиза gpt-4-0314.
Основное улучшение заключается в том, что они наконец-то научили его правильно "думать".
Теперь он больше не делает ужасных логических ошибок в своем мышлении.
Проблемы вроде "Хорошо, я сейчас запущу тесты. <Тесты провалились> Отлично! Тесты прошли." больше не существуют.
Это обобщается на все логические задачи, когда речь идет о мышлении о коде - он крайне редко, если вообще когда-либо, делает ошибки.
Следующая большая веха: он больше не пишет неаккуратный код! Это огромно. С Codex вы можете заставить его написать работающий код. Но он пишет ужасный код - бесполезные функции, плохие абстракции и т.д. Это плохо, потому что он работает в краткосрочной перспективе, но в долгосрочной модели она застрянет в углу, где не сможет работать с кодом, который сама же написала.
С Opus это не так. Он не только пишет элегантный код, но и знает, как рефакторить неаккуратный код в аккуратный. Он глубоко понимает кодовую базу и может находить элегантные решения, которые не являются просто "механическими" рефакторингами.
Он очень автономен и независим. Он сам, сталкиваясь с проблемами, создаст минимальные воспроизводимые примеры, попытается определить, откуда возникает ошибка, а затем исправит ее, не застревая в бесконечных циклах. Даже если ошибка находится в какой-то несвязанной части кода -- коде, который он даже не писал сам!!
Он также ДЕЛАЕТ ТО, ЧТО ВЫ ГОВОРИТЕ, БЕЗ УПРОЩЕНИЙ! Это огромно!!! Использование Codex - это, по сути, игра в "бить крота", где он понимает, что вы хотите, но это слишком сложно, поэтому он находит обходные пути к плохому решению, которое вам не нужно.
Opus действительно решает проблему и решает ее правильно, даже если это сложно.
Долгое понимание контекста практически идеально. В сочетании с механизмом сжатия, доступным в Claude Code по умолчанию, вы можете вести бесконечно длинный разговор, где он понимает все, что в нем, без деградации.
Что касается дизайна, исследований, выработки новых идей. Он лучше, но еще не на уровне эксперта-человека. Он может предложить решения, которые я бы считал хорошим дизайном, но он еще не может "думать с порталами". Тем не менее, это хорошее улучшение по сравнению с тем, что у нас было раньше, что было практически несуществующим.
Все вышеперечисленное я собрал, тестируя его в течение последних нескольких дней, где задача заключалась в написании интерпретатора для языка, который мы разрабатывали на лету. Это очень нишевый дизайн, похожий на Self и Smalltalk, за исключением того, что мы строим язык внутри самого языка. Это приводит к чрезвычайно сложным сценариям, когда вы пытаетесь определить, как работают функции -- внутри языка -- когда у вас еще нет функций! И он все равно справляется великолепно. Иногда я даже не полностью понимаю, что прошу его сделать, но Opus понимает, и он делает это хорошо.
Кратко: это Sonnet 3.5 2025 года. Попробуйте. Сделайте это сейчас.
Топ
Рейтинг
Избранное

