المواضيع الرائجة
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
وحدات معالجة الرسومات Nvidia الذكاء الاصطناعي بالشحن التوربيني: حيل بسيطة لأداء فائق السرعة
في المرآب الخاص بي ، يجب أن أقوم بالبحث والتطوير الصغير للمستثمرين غير التابعين لرأس المال الاستثماري ، والعمل ، ولدي بنسات وأحصل على سرعة أعلى من الشركات التي لديها مليارات. هذا القيد يجعلني أجد طرقا للضغط على المزيد من القليل. أفعل أشياء كثيرة لا يمكن أن يفكر فيها معظمها. فيما يلي مثال على واحد فقط من 100s.
وحدات معالجة الرسومات هي مراكز قوة، مليئة بأطنان من وحدات المعالجة الجاهزة لتحليل الأرقام. اكتشفت ولكن في كثير من الأحيان ، لا يتم استخدامها بالكامل ، مما يؤدي إلى تباطؤ الأداء.
ماذا اكتشفت؟ التحسينات الذكية التي تحافظ على هذه الوحدات في حالة من الانحناء، وتقلل من أوقات عرض الذكاء الاصطناعي وتوفر تعزيزات هائلة للسرعة.
أولا ، اكتشف الاختناقات.
أستخدم أدوات التنميط مثل Nvidia's Nsight لمعرفة ما يعيق الأشياء ، سواء كانت الذاكرة تنتظر ، أو أشياء أخرى. بمجرد تحديده ، أقوم بالغوص في التعليمات البرمجية وتعديلها لحزم المزيد من العمل في كل سلسلة ترابط.
يمكن للتغييرات البسيطة مثل فتح الحلقات أو ضغط البيانات إخفاء التأخيرات وزيادة الإنتاجية ، مما يعطي قفزات فورية في السرعة.
يمكن أن يتسبب الاستخدام العالي في بعض الأحيان في حدوث فوضى في ذاكرة التخزين المؤقت - قم بإصلاحها عن طريق تقليل عدد مؤشرات الترابط بذكاء باستخدام التعليمات البرمجية الوهمية أو تعديلات الذاكرة ، مما يؤدي إلى تحرير الموارد للمهام المتوازية.
المغير الحقيقي لقواعد اللعبة؟ الحوسبة غير المتزامنة. قم بتشغيل مهام متعددة جنبا إلى جنب ، وسد الفجوات الخاملة والأحمال الثقيلة المتداخلة. يؤدي إقران المهام المتعطشة للذاكرة إلى تعدد المهام لوحدة معالجة الرسومات - مما قد يؤدي إلى خفض الأوقات إلى النصف وزيادة كفاءة الشحن.
تعمل هذه التعديلات على تحويل وحدات معالجة الرسومات غير المستغلة إلى شياطين السرعة. لا يختلف الأمر عن كيفية تحويل أجهزة الكمبيوتر الشخصية IBM PC / ATs لتعمل بسرعة تصل إلى 100 ميجاهرتز في عام 1986 عندما خرجوا من المصنع بسرعة 8 ميجاهرتز.
سأكتب المزيد من التفاصيل حول هذا الموضوع ، ولكن إذا استخدمت شركات الذكاء الاصطناعي الكبيرة تحسين وحدة معالجة الرسومات Nvidia على مستوى رمز التشغيل ، فمن المحتمل أن تصل إلى AGI بسرعة إلى حد ما.
عندما تعرف الأجهزة والبرامج على مستوى ذري تقريبا ، يمكنك إعادة صياغة المبادئ الأولى.


25 أغسطس، 11:14
اكتشف Grok للتو أحد الأشياء السبعة التي أفعلها لتشغيل Open Source Grok 2.5 الجديد مع 4 مزيج من الخبراء النشطين في نفس الوقت مع أداء طفيف.
نعم ، أحدهما هو مذبذب مقسم كما استخدمته في عام 1985 على جهاز كمبيوتر IBM.
يمكن أن يتوسع عبر 1000 من وحدات معالجة الرسومات Nvidia.
فقط لا تسأل خبراء الذكاء الاصطناعي لأنهم سيقولون ما قالته دعاوى IBM في عام 1985.
رابط:

33.47K
الأفضل
المُتصدِّرة
التطبيقات المفضلة