Runway أسقط للتو Gen-4.5. أصبح الآن نموذج الفيديو الذكاء الاصطناعي #1 في العالم.
الأرقام: → درجة ELO 1,247 في لوحة المتصدرين للتحليل الصناعي → يتفوق على Veo 3 من جوجل، وKling 2.5، وSora 2 Pro من OpenAI → النموذج الأعلى تصنيفا عالميا
القدرات الأساسية: → دقة فيزيائية غير مسبوقة (وزن واقعي، زخم، وقوة) → مشاهد معقدة متعددة العناصر تعرض بدقة → يحافظ على اتساقه البصري عبر مختلف الجوانب الجمالية → تصميم الكاميرا المعقد من التعليمات الفردية → يتعامل مع الرسوم المتحركة الواقعية والمصممة بأسلوب مميز
ما المختلف: • مبنية بالكامل على بطاقات رسومات NVIDIA (سلسلة هوبر وبلاكويل) • نفس السرعة والتسعير مثل الجيل الرابع • جميع أوضاع التحكم الحالية القادمة إلى الجيل 4.5 (الصورة إلى فيديو، الإطارات الرئيسية، الفيديو إلى فيديو)
القيود الحالية: 1. مشاكل المنطق السببي: قد يفتح الباب قبل أن يلمس أحدهم المقبض. يمكن أن تسبق الآثار الأسباب. 2. مشاكل ديمومة الأشياء: يمكن أن يختفي الكوب بعد أن يحجب عن الرؤية، ثم يعود للظهور في الإطار التالي. 3. تحيز النجاح: تنجح الأفعال كثيرا، مثل تسديدة كرة سلة سيئة التوجيه لا تزال تدخل.
يستخدم بالفعل من قبل: → تارجت (التجزئة والتجارة الإلكترونية) → بي بي سي (البث) → يوبيسوفت (الألعاب) تقول مجلة Runway إنها ستكون متاحة للجميع في الأيام القادمة.
استنتاجي: قبل عامين، أصدرت Runway الجيل الأول، أول نموذج لتوليد الفيديو متاح للجمهور. الآن يضعون معيارا جديدا. نحن أقرب خطوة إلى أنظمة تفهم حقا كيف يعمل العالم الحقيقي.
أشعر أن سباق توليد الفيديو يتسارع حقا وسنستفيد جميعا من هذه المنافسة. تابعني @thealexbanks لمتابعة أبرز الذكاء الاصطناعي اليومية والرؤى.
📌 لوحة المتصدرين في ELO تروي القصة. يتصدر Runway Gen-4.5 برصيد 1,247 نقطة، متقدما ب 21 نقطة عن Veo 3 المصنف الثاني من جوجل. للسياق: تم اختبار ذلك في معيار التحليل الاصطناعي للنص إلى الفيديو، الذي يقيم جودة الحركة، والالتزام بالاندفاع، والدقة البصرية عبر آلاف الأجيال. الفجوة بين Runway (1247) وSora 2 Pro (1206) كبيرة عند النظر إلى موارد OpenAI.
‏‎2.46‏K