Opus 4.5: 7.5-8/10 útil. Finalmente confio nesse modelo para escrever para mim e ele realmente tem bom julgamento/gosto sobre o que importa. Para programação, parece que pode funcionar para sempre e não ficar preso no mesmo ciclo de doom coding que os modelos anteriores. Algumas coisas ainda não são perfeitas: memória, uso do computador, criação de documentos, proatividade, etc., mas há uma linha de visão clara para melhorias nessas áreas (algumas inovações em UX do produto também são necessárias aqui). Neste ponto, parece que estamos a poucas gerações de modelos de chegar perto de um 10/10 para mim.