Opus 4.5: 7.5-8/10 pomocne. W końcu ufam temu modelowi, aby pisał za mnie i rzeczywiście ma dobry osąd/gust co do tego, co jest ważne. Jeśli chodzi o kodowanie, wydaje się, że może pracować w nieskończoność i nie utknie w tych samych pętlach kodowania jak wcześniejsze modele. Niektóre rzeczy wciąż nie są idealne: pamięć, użycie komputera, tworzenie dokumentów, proaktywność itp., ale widać wyraźną perspektywę na poprawę w tych obszarach (wymagane są również innowacje w UX produktu). W tym momencie wydaje się, że jesteśmy tylko kilka generacji modeli od osiągnięcia 10/10 dla mnie.