🚀 Apresentando o X-VLA; o novo modelo de Visão-Linguagem-Ação com soft-prompt do LeRobot. O X-VLA foi construído para escalar em muitas incorporações: diferentes robôs, câmaras, espaços de ação e ambientes, todos geridos por uma única estrutura de transformador unificada. - Generalista entre robôs (Franka, WidowX, Agibot, sim + real) - IDs de domínio de soft-prompt permitem que o modelo se adapte a novo hardware com pequenas incorporações aprendíveis - Correspondência de fluxo + núcleo de transformador para controle suave e contínuo a 50 Hz - Pré-treinado em um conjunto de dados de incorporações mistas abrangendo mais de 7 plataformas e tarefas diversas - Ajuste fino em qualquer conjunto de dados usando um dos 6 pontos de verificação que fornecemos de forma padrão.