Es gibt etwas Befriedigendes und zugleich Seltsames, wenn ein LLM berichtet, dass es 37 von 41 fehlgeschlagenen Tests (eine Verbesserung um 90 %) behoben hat und dann fragt, was als Nächstes zu tun ist, und "Vorwärts!" korrekt interpretiert.
23,05K