Trend Olan Konular
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
MoonshotAI, Tau2 Bench Telecom aracılık kıyaslamasında #1'e ulaşan ve potansiyel olarak yeni lider açık ağırlık modeli olan Kimi K2'nin yeni bir akıl yürütme çeşidi olan Kimi K2 Thinking'i piyasaya sürdü
Kimi K2 Thinking, 1B aktif ile 32T toplam parametrelerde şimdiye kadarki en büyük açık ağırlık modellerinden biridir. K2 Thinking, daha önce Temmuz ve Eylül 2025'te piyasaya sürülen akıl yürütmeyen Kimi K2 Instruct modellerinin ardından, @Kimi_Moonshot'nin Kimi K2 model ailesindeki ilk akıl yürütme modeli sürümüdür.
Önemli çıkarımlar:
➤ Aracılık görevlerinde güçlü performans: Kimi K2 Thinking, modelin müşteri hizmetleri temsilcisi olarak hareket ettiği aracılık aracı kullanım karşılaştırması olan τ²-Bench Telecom'da %93'e ulaşıyor. Bu, bağımsız olarak ölçtüğümüz en yüksek puandır. Uzun ufuklu ajan bağlamlarında araç kullanımı Kimi K2 Instruct'ın güçlü yönlerinden biriydi ve görünüşe göre bu yeni Düşünme varyantı önemli kazanımlar sağlıyor
➤ Kimi K2 Instruct'ın akıl yürütme varyantı: Model, ismine göre, Kimi K2 Instruct'ın bir akıl yürütme çeşididir. Model, Kimi K2 Instruct ile aynı mimariye ve aynı sayıda parametreye (farklı hassasiyete rağmen) sahiptir ve K2 Intutor gibi yalnızca metni bir giriş (ve çıkış) modalitesi olarak destekler
➤ 1T parametreleri ancak FP8 yerine INT4: Moonshot'ın FP8 hassasiyetini kullanan önceki Kimi K2 Instruct sürümlerinin aksine, bu model yerel olarak INT4 hassasiyetinde piyasaya sürüldü. Moonshot bunu başarmak için eğitim sonrası aşamada nicelemeye duyarlı eğitim kullandı. Bunun etkisi, K2 Instruct ve K2 Instruct 0905 için 1 TB'ın biraz üzerinde olan K2 Thinking'in yalnızca ~594 GB olmasıdır - bu da çıkarım ve eğitim için verimlilik kazanımları anlamına gelir. INT4'ün olası bir nedeni, Blackwell öncesi NVIDIA GPU'ların FP4 desteğine sahip olmamasıdır, bu da INT4'ü daha önceki donanımlarda verimlilik kazanımları elde etmek için daha uygun hale getirir.
Yapay Analiz Zeka Endeksi kıyaslamalarımızın tamamı devam ediyor ve tamamlanır tamamlanmaz bir güncelleme sağlayacağız.

En İyiler
Sıralama
Takip Listesi

