Populární témata
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Andrej Karpathy
Stavební @EurekaLabsAI. Dříve ředitel AI @ Tesla, zakládající tým @ OpenAI, CS231n/PhD @ Stanford. Rád trénuji velké hluboké neuronové sítě.
Včera jsem hrál Gemini 3 přes předběžný přístup. Několik myšlenek –
Nejprve obvykle doporučuji opatrnost u veřejných benchmarků, protože podle mě je docela možné je překonat. Jde o disciplínu a sebekontrolu týmu (který je mezitím silně motivován k jinému účelu), aby se nepřecvičil testovými sadami pomocí složitých gymnastik nad daty sousedními s testovými sadami v prostoru pro zakládání dokumentů. Realisticky, protože to dělají všichni ostatní, je tlak na to vysoký.
Jdi si promluvit s modelem. Promluvte si s ostatními modely (Jezděte na LLM cyklu – používejte každý den jiný LLM). Včera jsem měl pozitivní počáteční dojem v osobnosti, psaní, programování vibrace, humoru atd., velmi solidní potenciál pro každodenní jízdu, jasně tier 1 LLM, gratuluji týmu!
V následujících dnech/týdnech jsem nejvíc zvědavý a hledám soubor místo soukromých hodnocení, které si teď spousta lidí/organizací vytváří sama a občas zde píše.
646,49K
Začínám si zvykat číst všechno (blogy, články, kapitoly v knihách,...) pomocí LLM. Obvykle je první krok manuální, pak druhý "vysvětli/shrni", třetí otázka a odpověď. Obvykle nakonec dosáhnu lepšího/hlubšího porozumění, než kdybych se posunul dál. Roste mezi nejvýznamnější případy použití.
Na druhou stranu, pokud jste spisovatel, který se snaží něco vysvětlit nebo sdělit, můžeme častěji vidět méně myšlení typu "píšu to pro jiného člověka" a více "píšu to pro LLM". Protože jakmile LLM "pochopí", může svou myšlenku cílit, personalizovat a nabídnout svému uživateli.
1,01M
Sdílení zajímavého nedávného rozhovoru o dopadu umělé inteligence na ekonomiku.
Umělá inteligence byla srovnávána s různými historickými precedenty: elektřinou, průmyslovou revolucí atd., myslím, že nejsilnější analogií je umělá inteligence jako nové výpočetní paradigma (Software 2.0), protože obě jsou v zásadě o automatizaci digitálního zpracování informací.
Pokud byste měli předpovědět dopad výpočetní techniky na trh práce v 80. letech, nejprediktivnějším rysem úkolu/zakázky, na který byste se podívali, je, do jaké míry je její algoritmus fixní, tj. pouze mechanicky transformujete informace podle rutinních, snadno specifikovatelných pravidel (např. psaní na klávesnici, účetnictví, lidské kalkulačky atd.)? Tehdy to byla třída programů, které nám výpočetní schopnosti té doby umožňovaly psát (ručně, ručně).
S umělou inteligencí jsme nyní schopni psát nové programy, o kterých bychom nikdy dříve nemohli doufat, že je napíšeme ručně. Děláme to tak, že specifikujeme cíle (např. přesnost klasifikace, funkce odměny) a prohledáváme prostor programu pomocí gradientního sestupu, abychom našli neuronové sítě, které dobře fungují proti tomuto cíli. Toto je můj příspěvek na blogu o Softwaru 2.0 z doby před nějakou dobou. V tomto novém programovacím paradigmatu je tedy novou nejprediktivnější funkcí, na kterou je třeba se zaměřit, ověřitelnost. Pokud je úkol/úloha ověřitelná, pak je optimalizovatelná přímo nebo prostřednictvím zpětnovazebního učení a neuronovou síť lze trénovat tak, aby fungovala extrémně dobře. Jde o to, do jaké míry dokáže umělá inteligence něco "nacvičit". Prostředí musí být resetovatelné (můžete začít nový pokus), efektivní (lze provést mnoho pokusů) a odměňitelné (existuje nějaký automatizovaný proces, který odměňuje každý konkrétní pokus, který byl proveden).
Čím více je úkol/úloha ověřitelná, tím více je přístupná automatizaci v novém programovacím paradigmatu. Pokud není ověřitelná, musí vypadnout z neuronové magie zobecnění držíme palce, nebo slabšími prostředky jako je imitace. To je to, co pohání "zubatou" hranici pokroku v LLM. Úkoly, které jsou ověřitelné, se vyvíjejí rychle, a to i mimo schopnosti špičkových odborníků (např. matematika, kód, množství času stráveného sledováním videí, cokoli, co vypadá jako hádanky se správnými odpověďmi), zatímco mnoho jiných ve srovnání s nimi zaostává (kreativní, strategické, úkoly, které kombinují znalosti z reálného světa, stav, kontext a zdravý rozum).
Software 1.0 snadno automatizuje to, co můžete specifikovat.
Software 2.0 snadno automatizuje to, co můžete ověřit.
1,98M
Top
Hodnocení
Oblíbené

