Đáng chú ý. Trung Quốc lại một lần nữa…
Artificial Analysis
Artificial Analysis05:10 7 thg 11
MoonshotAI đã phát hành Kimi K2 Thinking, một biến thể lý luận mới của Kimi K2 đạt vị trí #1 trong bảng xếp hạng Tau2 Bench Telecom agentic và có khả năng là mô hình trọng số mở hàng đầu mới. Kimi K2 Thinking là một trong những mô hình trọng số mở lớn nhất từ trước đến nay, với 1T tham số tổng cộng và 32B hoạt động. K2 Thinking là bản phát hành mô hình lý luận đầu tiên trong gia đình mô hình Kimi K2 của @Kimi_Moonshot, sau các mô hình Kimi K2 Instruct không lý luận được phát hành trước đó vào tháng 7 và tháng 9 năm 2025. Những điểm chính: ➤ Hiệu suất mạnh mẽ trên các nhiệm vụ agentic: Kimi K2 Thinking đạt 93% trong 𝜏²-Bench Telecom, một bảng xếp hạng công cụ sử dụng agentic nơi mô hình hoạt động như một đại diện dịch vụ khách hàng. Đây là điểm số cao nhất mà chúng tôi đã đo lường độc lập. Việc sử dụng công cụ trong các bối cảnh agentic dài hạn là một điểm mạnh của Kimi K2 Instruct và có vẻ như biến thể Thinking mới này đã đạt được những tiến bộ đáng kể. ➤ Biến thể lý luận của Kimi K2 Instruct: Mô hình, như tên gọi của nó, là một biến thể lý luận của Kimi K2 Instruct. Mô hình có cùng kiến trúc và số lượng tham số (mặc dù độ chính xác khác nhau) như Kimi K2 Instruct và giống như K2 Instruct chỉ hỗ trợ văn bản như một phương thức đầu vào (và đầu ra). ➤ 1T tham số nhưng INT4 thay vì FP8: Khác với các bản phát hành Kimi K2 Instruct trước đó của Moonshot sử dụng độ chính xác FP8, mô hình này đã được phát hành một cách tự nhiên với độ chính xác INT4. Moonshot đã sử dụng đào tạo nhận thức lượng tử trong giai đoạn sau đào tạo để đạt được điều này. Tác động của điều này là K2 Thinking chỉ ~594GB, so với hơn 1TB cho K2 Instruct và K2 Instruct 0905 - điều này chuyển thành lợi ích về hiệu suất cho suy diễn và đào tạo. Một lý do tiềm năng cho INT4 là các GPU NVIDIA trước Blackwell không hỗ trợ FP4, khiến INT4 trở nên phù hợp hơn để đạt được lợi ích về hiệu suất trên phần cứng cũ hơn. Bộ chỉ số phân tích trí tuệ nhân tạo đầy đủ của chúng tôi đang trong quá trình hoàn thiện và chúng tôi sẽ cung cấp cập nhật ngay khi chúng hoàn tất.
Các nhà đầu tư lớn trong @Kimi_Moonshot : Alibaba (sở hữu 40%), Tencent, Meituan, Ant Group, Hongshan … và Microsoft đã tham gia!
3,6K