تعد استراتيجية مزرعة Teleop مفيدة لتعلم بدائيات التلاعب ولكن يتم طهيها على المدى الطويل لأن السياسات تحتاج إلى بيانات أقل لكل بيئة لأنها تتحسن ثم تكون عالقا في المصنع