🚀 介绍 X-VLA;LeRobot 的新软提示视觉-语言-动作模型。 X-VLA 旨在跨越多种体现进行扩展:不同的机器人、相机、动作空间和环境,所有这些都由一个统一的变换器主干处理。 - 在机器人之间的通用性(Franka、WidowX、Agibot、模拟 + 真实) - 软提示领域 ID 使模型能够通过微小的可学习嵌入适应新硬件 - 流匹配 + 变换器核心实现平滑、连续的 50 Hz 控制 - 在跨越 7 个以上平台和多样任务的混合体现数据集上进行预训练 - 使用我们提供的 6 个检查点中的任意一个在任何数据集上进行微调。