Topik trending
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Luar biasa. Cina lagi...

7 Nov, 05.10
MoonshotAI telah merilis Kimi K2 Thinking, varian penalaran baru dari Kimi K2 yang mencapai #1 dalam tolok ukur agen Tau2 Bench Telecom dan berpotensi menjadi model bobot terbuka terkemuka baru
Kimi K2 Thinking adalah salah satu model bobot terbuka terbesar yang pernah ada, pada parameter total 1T dengan 32B aktif. K2 Thinking adalah rilis model penalaran pertama dalam keluarga model Kimi K2 @Kimi_Moonshot, mengikuti model Kimi K2 Instruct non-penalaran yang dirilis sebelumnya pada Juli dan September 2025.
Kesimpulan utama:
➤ Kinerja yang kuat pada tugas agen: Kimi K2 Thinking mencapai 93% dalam τ²-Bench Telecom, tolok ukur penggunaan alat agen di mana model bertindak sebagai agen layanan pelanggan. Ini adalah skor tertinggi yang kami ukur secara independen. Penggunaan alat dalam konteks agen cakrawala panjang adalah kekuatan Kimi K2 Instruct dan tampaknya varian Thinking baru ini menghasilkan keuntungan besar
➤ Varian penalaran dari Kimi K2 Instruksi: Model, sesuai penamaannya, adalah varian penalaran dari Kimi K2 Instruct. Model ini memiliki arsitektur yang sama dan jumlah parameter yang sama (meskipun presisi yang berbeda) seperti Kimi K2 Instruct dan seperti K2 Instruct hanya mendukung teks sebagai modalitas input (dan output)
➤ Parameter 1T tetapi INT4 alih-alih FP8: Tidak seperti rilis Kimi K2 Instruct Moonshot sebelumnya yang menggunakan presisi FP8, model ini telah dirilis secara asli dalam presisi INT4. Moonshot menggunakan pelatihan sadar kuantisasi pada fase pasca-pelatihan untuk mencapai hal ini. Dampaknya adalah bahwa K2 Thinking hanya ~594GB, dibandingkan dengan lebih dari 1TB untuk K2 Instruct dan K2 Instruct 0905 - yang diterjemahkan ke dalam peningkatan efisiensi untuk inferensi dan pelatihan. Alasan potensial untuk INT4 adalah bahwa GPU NVIDIA pra-Blackwell tidak memiliki dukungan untuk FP4, membuat INT4 lebih cocok untuk mencapai peningkatan efisiensi pada perangkat keras sebelumnya.
Set lengkap tolok ukur Indeks Kecerdasan Analisis Buatan kami sedang berlangsung dan kami akan memberikan pembaruan segera setelah selesai.

Investor utama di @Kimi_Moonshot :
Alibaba (40% pemilik), Tencent, Meituan, Ant Group, Hongshan ... dan Microsoft berpartisipasi!
3,22K
Teratas
Peringkat
Favorit

