المواضيع الرائجة
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Ruben Hassid
ورقة جديدة: النماذج الكبيرة مذهلة في شرح الأمور وسيئة جدا في تنفيذها.
اسأل نموذجا عن "كيف" يقارن رقمين عشريين، وسيعطيك خوارزمية مثالية خطوة بخطوة.
اطلب منه فعلا "إجراء" المقارنة... وفجأة "9.11 أكبر من 9.9 لأن 90 أكبر من 11."
يسمي الباحثون هذا "متلازمة انقسام الدماغ الحاسوبي". تطور نماذج اللغة الكبيرة مسارا واحدا لشرح الإجراء، ومسارا مختلفا تماما لتنفيذه.
هاتان المساران يعيشان في أجزاء مختلفة من هندسة النموذج (كما هو موضح في مخططات t-SNE في الصفحات 14–16 من هذه الورقة) ولا يتحدثان مع بعضهما البعض.
لهذا السبب يمكن للنموذج أن يعلمك القسمة الطويلة لكنه لا يستطيع القيام بذلك بشكل موثوق.
أو لماذا يمكنه صياغة قواعد منطقية لكنه يفشل في الاستدلال الأساسي.
أو لماذا ينتج لغة لا تشوبها شائبة وتفكيرا هشا.
الشرح هو استرجاع النمط.
التنفيذ هو حساب.
تتفوق نماذج اللغة الكبيرة في الأول وتكافح بشكل أساسي مع الثانية.
في أعماق العمارة، تدمج الفروع معا معاني يفصلها البشر.
تقدم الورقة مثالا مضحكا: "9.11" أقرب إلى "11 سبتمبر" منه إلى "تسعة فاصل أحد عشر" لأن التضمين الرمزي يعادل متوسطا عبر كل سياق رأوه. ذلك "التلوث السياقي" يجعل التفكير الرمزي النظيف مستحيلا.
علاوة على ذلك...
المحولات يمكنها فقط إنتاج "متوسطات موزونة" لما رأوه. لا يمكنهم توليد قيم رمزية جديدة مثل "3354" من "43 × 78" باستخدام الرياضيات الفعلية.
تدخلت شبكات التغذية المقدمة لديهم، لكن شبكات التغذية الخلفية خطية جزئيا، مما يعني أنها حرفيا لا تستطيع تنفيذ حسابات دقيقة. أفضل ما يمكنهم فعله هو تقريب أو حفظ الأنماط (كما هو مثبت رسميا في الملحق أ).
وبالتالي، يبدون كفؤين، لكنهم يتصرفون بشكل غير كفء.
يمكن لنماذج اللغة الكبيرة وصف خوارزمية الضرب بشكل مثالي لأنها رأت ملايين التفسيرات. لكن عندما يطلب منهم "تنفيذ" الخوارزمية، يعودون إلى قواعد إكمال النمط، أو بعبارة أخرى، شظايا من حسابات نصف متذكرة، موجهة بثقة.
هذا التمييز مهم لأن الناس يخلطون بين "الإنتاج الشبيه بالفهم" والكفاءة.
النموذج الذي يقدم شرحا مفصلا لكيفية حل لغز منطقي "يشعر" بالذكاء.
لكن كما تظهر التجارب عبر الحساب، والتفكير العلاقي، والمهام الرمزية، فإن مسار التعليمات هذا لا يرتبط أبدا بمسار التنفيذ. هما متباينتان هندسيا؛ حتى التفسيرات المثالية لا تحسن التنفيذ.
وهذا هو الدرس الحقيقي لأي شخص يبني باستخدام نماذج اللغة الكبيرة:
"استخدمهم كمنتقدين، لا كآلات حاسبة."
إذا كنت تريد رؤية، إطارا، منظورا، تشخيصا، تفسيرا... نماذج اللغة الكبيرة جيدة بشكل مذهل.
إذا كنت تريد منطقا متعدد الخطوات صحيحا أو دقة رمزية: التوجيه إلى أداة، أو نظام منظم، أو بنية هجينة.
بعبارة أخرى:
نماذج اللغة الكبيرة رائعة في إخبارك *كيف* تفعل الأمر.
لكنهم لا يزالون بحاجة إلى شيء آخر ل"يفعل" الشيء فعليا.
يمكنك قراءة الورقة كاملة هنا:

11.3K
يقول إيلون ماسك إن العمل سيكون "اختياريا" قريبا.
ستقضي الروبوتات والذكاء الذكاء الاصطناعي على الوظائف غير المادية ، مما يخلق "دخلا عالميا مرتفعا" حيث يحصل الجميع على ما يريدون.
لكن ورقة ييل تظهر أن الاقتصاد وراء تنبؤاته أكثر وحشية بكثير مما يقترح.
أنا أتحدث عن الورقة بعنوان "لن نفتقد".
ويخلص إلى ما يلي:
"يمكن أن يتوقف نصف القوى العاملة عن العمل غدا ولن يتزحزح الناتج المحلي الإجمالي."
أي أن البشر يصبحون بلا معنى اقتصاديا.
تقسم الورقة جميع الأعمال إلى فئتين:
1) عنق الزجاجة العمل
هذا العمل ضروري للنمو. إنتاج الطاقة والخدمات اللوجستية والاكتشافات العلمية والبنية التحتية. لا يمكن للاقتصاد أن ينمو ما لم يتسع هذا العمل.
2) أعمال الملحقات
إنه غير ضروري. الفنون والضيافة والعلاج والأكل الفاخر. من الجيد أن يكون لديك ، لكنه ليس مطلوبا للنمو.
يتولى AGI بشكل منهجي كل ما هو بالغ الأهمية للمهام.
تظل بعض أعمال الملحقات بشرية ، ليس لأن الذكاء الاصطناعي العام لا يستطيع القيام بذلك ، ولكن لأن لدينا عمالا فائضا ولا يستحق الحساب.
بمعنى آخر ، سيعتمد راتبك المستقبلي على التكلفة الحسابية لتكرار عملك.
نظرا لأن الحوسبة تصبح أرخص بشكل كبير ، ينخفض سقف راتبك.
ينمو الاقتصاد ، وتزداد الإنتاجية ، لكن قيمتك مرتبطة بانخفاض تكاليف التكنولوجيا.
خلصت ورقة جامعة ييل إلى ما يلي:
وتتقارب حصة العمالة من الناتج المحلي الإجمالي إلى الصفر. جميع تدفقات الدخل إلى مالكي الموارد الحسابية.
تحدد سرعة الانتقال مدى الألم الذي يحصل عليه.
إذا تطورت التكنولوجيا بشكل أسرع من مقاييس الحوسبة ، فإننا نحصل على اضطراب خشن ، حيث يتلقى بعض العمال أقساط ضخمة قبل أن ينعطل.
إذا ارتقت الحوسبة بشكل أسرع ، فإننا نحصل على انخفاض تدريجي يمكن التنبؤ به في الأجور.
في رأيي ، هناك مفارقة غاب عنها ماسك هنا.
العمل "اختياري" هو وهم.
يحتاج البشر إلى العمل ، ربما ليس من أجل البقاء ، ولكن لغرض.
السؤال الوجودي هو:
هل سيظل الناس يختارون العمل عندما يكون الأمر بلا معنى اقتصاديا ... ومتى لا تهم مساهمتك للتقدم أو الازدهار؟
42.71K
حظر ChatGPT للتو المشورة الطبية والقانونية
لم يعد بإمكانه تقديم الاستشارات التي تتطلب ترخيصا مهنيا ، مثل المشورة الطبية أو القانونية أو المالية.
هذا تصحيح مفرط هائل جعل الإنترنت أقل أمانا أثناء التظاهر بحماية الناس.
تخيل الأم العازبة في المناطق الريفية التي لا تستطيع تحمل تكلفة زيارة طبيب الأمراض الجلدية بقيمة 200 دولار للتعرف على طفح طفلها.
كان بإمكانها استخدام ChatGPT ، وتوجيهها نحو العلاجات المحتملة ، وتوفير المال ورحلة طويلة.
هناك العديد من هذه الحالات للأشخاص الذين يستخدمون GPT لتشخيص مشاكلهم الصحية قبل أن يتمكن الأطباء من ذلك.
(يمكنك العثور عليها على Reddit)
ول الاسف...
لا تميز سياسة OpenAI الجديدة بين "استبدال الرعاية المهنية" و "تحسين الوصول إلى المعلومات".
يحظر كليهما.
قضيتهم هي جنون العظمة في المسؤولية.
إنهم يحمون أنفسهم من الدعاوى القضائية.
وفي الوقت نفسه ، فقد الأشخاص الذين يفتقرون إلى الوصول إلى الرعاية الصحية أو الموارد القانونية أو محو الأمية الطبية الأساسية أداتهم التي يمكن الوصول إليها.
انظر ، لقد جئت من عائلة من الأطباء.
أمي صيدلانية ، وأختي طبيبة أمراض الجهاز الهضمي ، وزوجها طبيب مسالك بولية ، وأخي طبيب أسنان.
أعلم أن الذكاء الاصطناعي بشكل مباشر لن يحل محلهم.
لن "يوقف" هذا الحظر الاستبدال ويخطئ النقطة تماما.
يمنع هذا الحظر الوصول إلى المعلومات الأساسية التي تساعد الناس على معرفة متى يحتاجون إلى طبيب حقيقي.
ضع في اعتبارك العبثية لثانية.
يمكن ل ChatGPT كتابة رمز يدير محطات نووية ، لكنه لا يمكنه إخبارك بموعد رؤية الطبيب لألم الصدر.
سيكون النهج الأفضل بكثير هو وجود إخلاء مسؤولية واضح ودرجات ثقة وحدود صريحة ("هذا إعلامي وليس تشخيصيا").
بدلا من ذلك ، اختارت OpenAI خيار حظر كل شيء يتطلب ترخيصا.
النتيجة غير المقصودة لهذا الفعل هي أن
لن يتوقف الناس عن طرح هذه الأسئلة.
(أعلم أنني لن أفعل)
سيستخدمون فقط مصادر أسوأ مثل المنتديات الصحية غير المنظمة ، ومواقع الويب السطحية ، أو سيتجنبون الحصول على المساعدة تماما.
من المضحك كيف أن كل محاولة لجعل الإنترنت "أكثر أمانا" تجعله أقل أمانا.


35.98K
الأفضل
المُتصدِّرة
التطبيقات المفضلة

