很高興看到更多完全開放的後訓練食譜(這是一個多模態推理)。 後訓練數據如此稀少令人驚訝,因為其影響的機會是巨大的。很多人會嘗試,而簡單的數據方法仍然可以在SOTA上有所改善。