Jag startar min "SVG av en katt som rider en drake"-benchmark. (inspirerad av @simonw:s Pelican Riding Bicycle Benchmark) Claude Opus 4.5 får Gemini 3 Pro & GPT 5.1 Pro & Grok 4.1 att se ut som leksaker.
Kan inte fatta att GPT 5.1 Pro tänkte på 7 minuter och 40 sekunder för det här skitet 🤣
Jag börjar ifrågasätta värdet av denna benchmark, SVG:n ändras mycket varje gång jag kör den! Ett nytt försök och Gemini 3 Pro genererade denna förvånansvärt söta anime-inspirerade drake.
3,9K