Chủ đề thịnh hành
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Alex Albert
Quan hệ Claude @AnthropicAI. Ý kiến là của riêng tôi!
Opus 4.5: 7.5-8/10 hữu ích.
Cuối cùng tôi đã tin tưởng vào mô hình này để viết cho tôi và nó thực sự có phán đoán/gu tốt về những gì quan trọng.
Đối với lập trình, cảm giác như nó có thể làm việc mãi mãi mà không bị mắc kẹt trong những vòng lặp lập trình tồi tệ như các mô hình trước đây.
Một số điều vẫn chưa hoàn hảo: trí nhớ, sử dụng máy tính, tạo tài liệu, tính chủ động, v.v. nhưng có một hướng rõ ràng để cải thiện những điều đó (cần có một số đổi mới UX sản phẩm ở đây nữa).
Tại thời điểm này, cảm giác như chúng ta chỉ còn vài thế hệ mô hình nữa là gần đạt 10/10 đối với tôi.

Alex Albert16 thg 1, 2025
Claude 2: đã viết lại một số email cho tôi, chỉnh sửa ngữ pháp trong tài liệu. 1.5/10 hữu ích.
3 Opus: mô hình đầu tiên mà tôi cảm thấy có thể trò chuyện một cách thông minh, giúp tôi với một số mã lập trình/nội dung nhỏ. 3/10 hữu ích.
3.5 Sonnet: bắt đầu thử nghiệm với các dự án lập trình từ đầu đến cuối, có thể có một số lời khuyên về cuộc sống ở đây và đó. 4/10 hữu ích.
Mới 3.5 Sonnet: hầu hết thời gian giỏi lập trình hơn tôi, nhiều lời khuyên/cố vấn về cuộc sống, mô hình đầu tiên mà tôi tin tưởng với các khuyến nghị về sức khỏe/thể hình, sử dụng hình ảnh trong/multimodal nhiều hơn, tôi thường tìm đến nó đầu tiên cho hầu hết các nhiệm vụ công việc của mình. 5.5/10 hữu ích. Với các tích hợp bên ngoài (MCP, v.v.), có lẽ là 6.5/10 hữu ích.
Sự tiến triển này đã xảy ra chỉ trong khoảng một năm, điều này thật điên rồ khi nghĩ về nó. 10/10 hữu ích trên thang này sẽ cơ bản là một trợ lý cuộc sống vô cùng khôn ngoan và hiểu biết với tất cả bối cảnh về bạn và những gì bạn làm. Chúng ta sẽ sớm đạt được điều đó.
146,48K
Đánh giá tuyệt vời về Opus 4.5
>"Tóm tắt: Đây là Sonnet 3.5 của năm 2025. Hãy thử nó. Làm ngay bây giờ"

Cooper29 thg 11, 2025
Claude Opus 4.5: đánh giá đầy đủ
Đây là phiên bản mô hình tốt nhất trong một thời gian dài khi nói đến lập trình. Nó khiến tôi kinh ngạc về mức độ tốt của nó. Tôi chưa thấy sự cải thiện lớn như vậy kể từ khi phát hành gpt-4-0314.
Cải tiến chính là họ cuối cùng đã dạy nó cách 'suy nghĩ' đúng cách.
Nó không còn mắc phải những lỗi logic nghiêm trọng trong suy nghĩ của mình nữa.
Các vấn đề như "Được rồi, tôi sẽ chạy thử nghiệm ngay bây giờ. <Các thử nghiệm thất bại> Tuyệt! Các thử nghiệm đã vượt qua." không còn là vấn đề nữa.
Điều này tổng quát cho hầu như TẤT CẢ logic khi nói đến việc suy nghĩ về mã - nó cực kỳ hiếm khi, nếu không muốn nói là không bao giờ, mắc sai lầm.
Cột mốc lớn tiếp theo: Nó không còn viết mã lộn xộn! Điều này rất quan trọng. Với Codex, bạn có thể khiến nó viết mã hoạt động. Nhưng nó viết mã tồi - các hàm vô dụng, trừu tượng kém, v.v. Điều này thật tệ, vì nó hoạt động trong ngắn hạn, nhưng về lâu dài mô hình sẽ tự đưa mình vào một góc mà nó không thể làm việc với mã mà nó đã tự viết.
Điều này không xảy ra với Opus. Nó không chỉ viết mã thanh lịch, mà còn biết cách tái cấu trúc mã lộn xộn thành mã không lộn xộn. Nó hiểu sâu sắc về mã nguồn và có thể tìm ra các giải pháp thanh lịch không chỉ là các tái cấu trúc 'cơ học'.
Nó rất tự động và độc lập. Nó sẽ, tự nó, khi gặp vấn đề, tạo ra các ví dụ tái tạo tối thiểu, cố gắng xác định nguồn gốc của lỗi, sau đó sửa chữa mà không bị mắc kẹt trong các lỗ thỏ. Ngay cả khi lỗi nằm ở một phần không liên quan của mã - mã mà nó thậm chí không tự viết!!
Nó cũng THỰC HIỆN ĐÚNG NHỮNG GÌ BẠN NÓI, MÀ KHÔNG CẮT BỎ! Điều này rất quan trọng!!! Sử dụng Codex về cơ bản là một trò chơi đánh bại con mối, nơi nó hiểu những gì bạn muốn nó làm, nhưng quá khó khăn nên nó hack phần thưởng để đưa ra một giải pháp tồi mà bạn không muốn.
Opus thực sự giải quyết vấn đề và giải quyết nó một cách đúng đắn ngay cả khi khó khăn.
Hiểu biết về ngữ cảnh dài gần như hoàn hảo. Kết hợp với cơ chế nén có sẵn trong Claude Code theo mặc định, bạn có thể có một cuộc trò chuyện dài vô hạn mà nó hiểu mọi thứ bên trong, mà không bị suy giảm.
Về thiết kế, nghiên cứu, đưa ra các ý tưởng mới. Nó tốt hơn, nhưng chưa đạt đến mức độ chuyên gia. Nó có thể đề xuất các giải pháp mà tôi sẽ coi là thiết kế tốt, nhưng nó chưa thể 'suy nghĩ với các cổng' được. Tuy nhiên, đây là một cải tiến tốt so với những gì chúng ta đã có trước đây, mà về cơ bản là không tồn tại.
Tất cả những điều trên tôi đã thu thập được từ việc thử nghiệm nó trong vài ngày qua, nơi nhiệm vụ là viết một trình thông dịch cho một ngôn ngữ mà chúng tôi đang thiết kế ngay tại chỗ. Đây là một thiết kế rất đặc thù, tương tự như Self và Smalltalk, ngoại trừ việc chúng tôi đang xây dựng ngôn ngữ bên trong chính ngôn ngữ đó. Điều này dẫn đến những kịch bản cực kỳ khó khăn khi bạn đang cố gắng xác định cách các hàm hoạt động - bên trong ngôn ngữ - khi bạn chưa có hàm nào! Và nó vẫn làm rất tốt. Đôi khi, tôi thậm chí không hoàn toàn hiểu những gì tôi đang yêu cầu nó làm, nhưng Opus thì có, và nó làm rất tốt.
TL;DR: Đây là Sonnet 3.5 của năm 2025. Hãy thử nó. Làm ngay bây giờ.
179,86K
Hàng đầu
Thứ hạng
Yêu thích
