Popularne tematy
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Niezwykłe. Chiny znowu…

7 lis, 05:10
MoonshotAI wydało Kimi K2 Thinking, nową wariantę rozumowania Kimi K2, która osiągnęła #1 w benchmarku Tau2 Bench Telecom agentic i potencjalnie jest nowym wiodącym modelem z otwartymi wagami.
Kimi K2 Thinking jest jednym z największych modeli z otwartymi wagami w historii, z 1T całkowitych parametrów i 32B aktywnych. K2 Thinking jest pierwszym modelem rozumującym w rodzinie modeli Kimi K2 @Kimi_Moonshot, po modelach Kimi K2 Instruct, które nie były modelami rozumującymi, wydanych wcześniej w lipcu i wrześniu 2025 roku.
Kluczowe wnioski:
➤ Silna wydajność w zadaniach agentic: Kimi K2 Thinking osiąga 93% w 𝜏²-Bench Telecom, benchmarku narzędziowym, w którym model działa jako agent obsługi klienta. To najwyższy wynik, jaki niezależnie zmierzyliśmy. Użycie narzędzi w długoterminowych kontekstach agentic było mocną stroną Kimi K2 Instruct i wydaje się, że ta nowa wariant rozumujący osiąga znaczne zyski.
➤ Wariant rozumujący Kimi K2 Instruct: Model, zgodnie z jego nazwą, jest wariantem rozumującym Kimi K2 Instruct. Model ma tę samą architekturę i tę samą liczbę parametrów (choć o innej precyzji) co Kimi K2 Instruct i podobnie jak K2 Instruct obsługuje tylko tekst jako modalność wejściową (i wyjściową).
➤ 1T parametrów, ale INT4 zamiast FP8: W przeciwieństwie do wcześniejszych wydań Kimi K2 Instruct Moonshot, które używały precyzji FP8, ten model został wydany natywnie w precyzji INT4. Moonshot użył treningu świadomego kwantyzacji w fazie po treningu, aby to osiągnąć. Wpływ tego jest taki, że K2 Thinking zajmuje tylko ~594GB, w porównaniu do nieco ponad 1TB dla K2 Instruct i K2 Instruct 0905 - co przekłada się na zyski wydajnościowe w zakresie wnioskowania i treningu. Potencjalnym powodem dla INT4 jest to, że karty graficzne NVIDIA sprzed Blackwell nie obsługują FP4, co sprawia, że INT4 jest bardziej odpowiednie do osiągania zysków wydajnościowych na wcześniejszym sprzęcie.
Nasz pełny zestaw benchmarków Artificial Analysis Intelligence Index jest w toku i dostarczymy aktualizację, gdy tylko będą one zakończone.

Główni inwestorzy w @Kimi_Moonshot :
Alibaba (właściciel 40%), Tencent, Meituan, Ant Group, Hongshan … oraz Microsoft wzięli udział!
3,6K
Najlepsze
Ranking
Ulubione

