Актуальные темы
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Alex Albert
Клод Релингс @AnthropicAI. Мнение мое!
Opus 4.5: 7.5-8/10 полезно.
Я наконец-то доверяю этой модели писать за меня, и она действительно имеет хорошее суждение/вкус относительно того, что важно.
Что касается кодирования, кажется, что она может работать вечно и не застревать в одних и тех же циклах кодирования, как предыдущие модели.
Некоторые вещи все еще не идеальны: память, использование компьютера, создание документов, проактивность и т. д., но есть четкое понимание того, как их улучшить (некоторые инновации в UX продукта также необходимы).
На данный момент кажется, что мы всего в нескольких поколениях моделей от достижения 10/10 для меня.

Alex Albert16 янв. 2025 г.
Claude 2: переписал несколько писем для меня, исправил грамматику в документах. 1.5/10 полезно.
3 Opus: первая модель, с которой я чувствовал, что могу разумно общаться, помогла с небольшим кодированием/скриптами. 3/10 полезно.
3.5 Sonnet: начал экспериментировать с проектами кодирования от начала до конца, может быть, немного жизненных советов здесь и там. 4/10 полезно.
Новая 3.5 Sonnet: чаще всего лучше кодирует, чем я, много жизненных советов/консультаций, первая модель, которой я доверяю в рекомендациях по здоровью/фитнесу, использую изображения в/мультимодальных задачах гораздо больше, я обращаюсь к ней в первую очередь для большинства своих рабочих задач. 5.5/10 полезно. С внешними интеграциями (MCP и т.д.) это, вероятно, 6.5/10 полезно.
Это развитие произошло всего за год, что безумно думать. 10/10 полезно по этой шкале было бы, по сути, невероятно мудрым и знающим жизненным помощником с полным контекстом о вас и ваших делах. Мы скоро туда доберемся.
181,75K
Отличный обзор Opus 4.5
>"Кратко: это Sonnet 3.5 2025 года. Попробуйте. Сделайте это сейчас"

Cooper29 нояб. 2025 г.
Claude Opus 4.5: полный обзор
Это лучшее обновление модели за долгое время, когда речь идет о программировании. Меня поражает, насколько это хорошо. Я не видел такого значительного улучшения с момента оригинального релиза gpt-4-0314.
Основное улучшение заключается в том, что они наконец-то научили его правильно "думать".
Теперь он больше не делает ужасных логических ошибок в своем мышлении.
Проблемы вроде "Хорошо, я сейчас запущу тесты. <Тесты провалились> Отлично! Тесты прошли." больше не существуют.
Это обобщается на все логические задачи, когда речь идет о мышлении о коде - он крайне редко, если вообще когда-либо, делает ошибки.
Следующая большая веха: он больше не пишет неаккуратный код! Это огромно. С Codex вы можете заставить его написать работающий код. Но он пишет ужасный код - бесполезные функции, плохие абстракции и т.д. Это плохо, потому что он работает в краткосрочной перспективе, но в долгосрочной модели она застрянет в углу, где не сможет работать с кодом, который сама же написала.
С Opus это не так. Он не только пишет элегантный код, но и знает, как рефакторить неаккуратный код в аккуратный. Он глубоко понимает кодовую базу и может находить элегантные решения, которые не являются просто "механическими" рефакторингами.
Он очень автономен и независим. Он сам, сталкиваясь с проблемами, создаст минимальные воспроизводимые примеры, попытается определить, откуда возникает ошибка, а затем исправит ее, не застревая в бесконечных циклах. Даже если ошибка находится в какой-то несвязанной части кода -- коде, который он даже не писал сам!!
Он также ДЕЛАЕТ ТО, ЧТО ВЫ ГОВОРИТЕ, БЕЗ УПРОЩЕНИЙ! Это огромно!!! Использование Codex - это, по сути, игра в "бить крота", где он понимает, что вы хотите, но это слишком сложно, поэтому он находит обходные пути к плохому решению, которое вам не нужно.
Opus действительно решает проблему и решает ее правильно, даже если это сложно.
Долгое понимание контекста практически идеально. В сочетании с механизмом сжатия, доступным в Claude Code по умолчанию, вы можете вести бесконечно длинный разговор, где он понимает все, что в нем, без деградации.
Что касается дизайна, исследований, выработки новых идей. Он лучше, но еще не на уровне эксперта-человека. Он может предложить решения, которые я бы считал хорошим дизайном, но он еще не может "думать с порталами". Тем не менее, это хорошее улучшение по сравнению с тем, что у нас было раньше, что было практически несуществующим.
Все вышеперечисленное я собрал, тестируя его в течение последних нескольких дней, где задача заключалась в написании интерпретатора для языка, который мы разрабатывали на лету. Это очень нишевый дизайн, похожий на Self и Smalltalk, за исключением того, что мы строим язык внутри самого языка. Это приводит к чрезвычайно сложным сценариям, когда вы пытаетесь определить, как работают функции -- внутри языка -- когда у вас еще нет функций! И он все равно справляется великолепно. Иногда я даже не полностью понимаю, что прошу его сделать, но Opus понимает, и он делает это хорошо.
Кратко: это Sonnet 3.5 2025 года. Попробуйте. Сделайте это сейчас.
180,51K
Топ
Рейтинг
Избранное
