Это было интересное путешествие, наблюдая, как традиционная номенклатура машинного обучения постепенно теряет всякий смысл. Раньше были TRAIN и TEST, и все было просто. Теперь мы обучаем на вселенной. И мы тоже тестируем на вселенной. Мы манипулируем нашими эталонами? Мы экстраполируем или интерполируем? Если модель обучена на всем интернете, но генерирует одно новое предложение, это просто сочетание фраз с Reddit или она действительно пишет что-то новое? Кажется, у нас не хватает слов, чтобы даже описать системы, которые мы построили.
89,63K