クロード 作品4.5:完全レビュー これはプログラミングに関しては、ここ最近で最高のモデルリリースです。その良さには驚かされます。GPT-4-0314のオリジナルリリース以来、これほど大きな改善を見たことがありません 主な進歩は、ついに「正しく考える」方法を考え始めたことです。 もはや恐ろしい論理的誤りを考えることはない。 例えば「わかりました、今からテストをします。<テスト不合格>素晴らしい!「テストが通る」というものはもう存在しません。 これはコードについて考える際のほぼすべての論理に一般化されます。ミスをすることはほとんどありません。 次の大きな節目:もはや雑なコードを書かなくなりました!これは大きなことです。Codexなら、動くコードを書かせることができます。しかし、コードはひどいものを書いています。役に立たない関数や悪い抽象化などです。これは短期間では機能しますが、長期的には自分で書いたコードで動けなくなるという点で残念です。 しかしOpusはそうではありません。洗練されたコードを書くだけでなく、スロップコードを非スロップコードにリファクタリングする方法も知っています。コードベースを深く理解しており、単なる「機械的」なリファクタリングではない洗練された解決策を見出すことができます。 とても自律的で独立しています。問題に直面した際には、最小限の再現可能な例を作り、エラーの発生源を二分化しようと試み、深みに陥ることなく修正します。たとえエラーがコードの別の部分、つまり自分で書いたわけでもないコードにあったとしても!! しかも、言われたことを正確に実行し、手を抜くことなく!これは大きなことです!!Codexを使うのは基本的にモグラ叩きのようなもので、あなたが何をしてほしいかは理解してくれるけれど難しすぎるので、報酬ハッキングで入り込んできて、望まない解決策を提示してくる。 『Opus』は難しくても問題に取り組み、きちんと解決しています。 長い文脈理解はほぼ完璧です。Claude Codeでデフォルトで利用可能なコンパクト化機構と組み合わせることで、内部のすべてを分解せずに無限に長い会話ができます。 デザインやリサーチ、新しいアイデアを考えることに関しては。少しは良くなりましたが、専門家レベルの人間レベルには及びません。私が良いデザインと考える解決策を提案することはできますが、まだ「ポータルで考える」ことはできません。それでも、以前はほとんど存在しなかったものよりは良い改善でした。 ここ数日テストして得た内容は、即興で設計していた言語のインタプリタを書く作業でした。これは非常にニッチな設計で、SelfやSmalltalkに似ていますが、言語自体の中に言語を構築しています。そのため、まだ関数を持っていないのに、言語内で関数の仕組みを定義しようと非常に難しい状況になります!そして今でも素晴らしい仕事をしています。時には自分が何を求めているのか完全には理解できないこともありますが、Opusは理解していて、うまくやってくれます。 要約:DR:2025年のソネット3.5です。試してみてください。今すぐやれ