Opus 4.5: 7.5-8/10 membantu. Saya akhirnya mempercayai model ini untuk menulis untuk saya dan sebenarnya memiliki penilaian/selera yang baik tentang apa yang penting. Untuk pengkodean, rasanya bisa bekerja selamanya dan tidak terjebak dalam putaran malapetaka pengkodean getaran yang sama seperti model sebelumnya. Beberapa hal masih belum sempurna: memori, penggunaan komputer, pembuatan dokumen, proaktivitas, dll tetapi ada garis pandang yang jelas untuk perbaikannya (beberapa inovasi UX produk juga diperlukan di sini). Pada titik ini rasanya seperti kita hanya beberapa generasi model lagi untuk mendekati 10/10 bagi saya.