Es war eine interessante Reise, die konventionelle Nomenklatur des maschinellen Lernens zu beobachten, die allmählich ihre Bedeutung verliert. Früher gab es TRAIN und TEST und alles war einfach. Jetzt trainieren wir im Universum. Und wir testen auch im Universum. Manipulieren wir unsere Benchmarks? Extrapolieren oder interpolieren wir? Wenn ein Modell auf dem gesamten Internet trainiert wird, aber einen einzigen neuen Satz generiert, kombiniert es dann nur Phrasen von Reddit oder schreibt es etwas wirklich Neues? Es fühlt sich an, als würden uns die Worte fehlen, um die Systeme, die wir gebaut haben, überhaupt zu beschreiben.