🚀 Giới thiệu X-VLA; mô hình Vision-Language-Action mới của LeRobot với soft-prompt. X-VLA được xây dựng để mở rộng trên nhiều hình thức: các robot khác nhau, camera, không gian hành động và môi trường, tất cả đều được xử lý bởi một backbone transformer thống nhất. - Chuyên gia đa năng trên các robot (Franka, WidowX, Agibot, mô phỏng + thực tế) - Các ID miền soft-prompt cho phép mô hình thích ứng với phần cứng mới với các embedding có thể học nhỏ gọn - Khớp dòng + lõi transformer cho điều khiển mượt mà, liên tục 50 Hz - Được huấn luyện trước trên một tập dữ liệu hỗn hợp hình thức trải dài trên 7+ nền tảng và các nhiệm vụ đa dạng - Tinh chỉnh trên bất kỳ tập dữ liệu nào bằng cách sử dụng một trong 6 điểm kiểm tra mà chúng tôi cung cấp sẵn.