Topik trending
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Ahmad
Peneliti AI & Insinyur Perangkat Lunak, dalam misi untuk membangun klaster GPU DGX B200
BARANG BERBAHAYA
> lebih dari 20 juta percakapan ChatGPT
> sekarang menjadi bukti... seorang hakim baru saja memerintahkan
> OpenAI untuk menyerahkannya dalam gugatan
jika ada yang pernah berteriak
> Beli GPU
> menjalankan AI Anda secara lokal
> melindungi data sialan Anda
ini di sini


Adam Eisgrau4 Des, 02.12
BREAKING: @OpenAI harus menyetel lebih dari 20 juta+ log obrolan kepada penggugat, Hakim Ona Wang telah memutuskan dalam Perintah 9 halaman yang baru saja dikeluarkan:

519,02K
sinyal yang sangat bearish
> perekrutan potensial menang & makan
> terjadi baik karena kemurahan hati
> atau keputusasaan
>Dalam hal ini yang terakhir
Mark Zuckerberg akan dikenang karena
> mempekerjakan Alexandr Wang,
> menjadikannya bos Yann LeCun &
> menghancurkan FAIR
memuncak dengan Llama3 ig


Yuchen Jin3 Des, 02.47
Mark Chen dari OpenAI:
- "Meta mengejar setengah dari bawahan langsung saya dan mereka semua menolak."
- "Meta memiliki modal $10 miliar per tahun untuk digunakan untuk bakat."
- "Zuck memasak dengan tangan dan mengantarkan sup kepada orang-orang yang dia coba pekerjakan dari OpenAI."
Perang bakat AI yang gila.
13,57K
> menjadi arcee
> melihat sekeliling
> menyadari bahwa MoE perbatasan bobot terbuka pada dasarnya adalah monopoli Qwen/DeepSeek
> memutuskan "tidak, kami membangun sendiri"
> prapelatihan end-to-end yang sebenarnya
> di tanah AS
> memperkenalkan Trinitas
> Nano (6B MoE) dan Mini (26B MoE)
> bobot terbuka, Apache 2.0
> gratis di OpenRouter untuk saat ini
> Nano: model kepribadian dengan 800M parameter aktif
> Mini: model penalaran dengan 3B aktif
> Besar: berlatih sekarang di 2048 B300 karena mengapa tidak
> masa depan sudah jelas
Model > tidak akan menjadi peralatan statis
> mereka akan menjadi sistem yang tumbuh
> beradaptasi
> belajar dari pengguna Anda
> melatih ulang dari penggunaan langsung
> Anda tidak dapat melakukannya jika Anda tidak memiliki beban
> atau loop pelatihan
> Begitu Arcee membalik meja
> memutuskan untuk melatih semuanya sendiri
> langkah 1: AFM-4.5B
> token yang dikuratori 8T
> dilatih dengan DatologyAI
> eksperimen "bisakah kita melakukan ini"
> jawaban: ya
> juga: matematika dan kode masih menyakitkan
> tetap melanjutkan
> langkah 2: Trinity Nano & Mini
> langsung melompat ke tanah perbatasan Kementerian Pertahanan
> 56 lapisan, 128 ahli
> perutean sigmoid, ahli bersama, tidak ada kerugian aux
> perhatian terjaga, norma QK, kueri yang dikelompokkan
> pola lokal/global
> pengoptimal muon
> pelatihan BF16 pada 512 H200
> seluruh spesial Dion/TorchTitan/HSDP
> panjang konteks?
> Nano berlatih pada 256k (menyimpulkan pada 128k)
> Mini berlatih di 128k
> data?
> token 10T di 3 fase
> lebar → tajam → BATANG berat
> Datology mengeluarkan selang pemadam kebakaran sintetis
> Prime Intellect menjaga kluster H100 tetap hidup
> dan ya
> melatih MoE pada skala ini adalah rasa sakit
> "tidak ada cara yang sopan untuk mengatakannya," rasa sakit
> token 20T untuk Trinity Large
> H100 2048 menghasilkan data sintetis
> 2048 B300 melatih model sebenarnya
> (debugging adalah gaya hidup btw)
> tapi di sinilah itu menjadi menyenangkan
> karena Anda memiliki pra-pelatihan
> Anda memiliki semua yang ada di hulu "produk"
> asal data
> tujuan
> penyimpangan perilaku
> pelatihan ulang di lokasi
> sistem berumur panjang sejati
> bukan api penyucian API-sebagai-dependensi
> jadi apa selanjutnya?
> Trinity Besar
> Parameter 420B
> 13 miliar aktif per token
> terbuka penuh
> menargetkan Jan 2026
> momen di mana "American MoE" menjadi Thing™
> Nano + Mini adalah pemanasan
> model yang sebenarnya dapat Anda gunakan sekarang
> unduh
> tuan rumah
> menyempurnakan
> istirahat
> melaporkan bug
> membentuk pelatihan Besar
> lingkaran komunitas tidak terkunci
> jika Anda peduli dengan beban terbuka
> atau tentang tidak mengalihdayakan seluruh tumpukan Anda ke laboratorium kotak hitam
> Trinity pada dasarnya adalah lemparan sarung tangan
> ambil Nano + Mini di Hugging Face
> atau jalankan di OpenRouter
> menguji mereka
> menemukan retakan
> mengirim umpan balik
> intinya adalah kepemilikan
Saya suka Arcee, mereka membangun model ini sehingga Anda tidak perlu menyewa kecerdasan Anda dari orang lain

27,59K
Teratas
Peringkat
Favorit

