Post by Amr jniat

Full stack and Ai engineer

🚨 هل لاحظت أن ChatGPT أصبح أقل ذكاءً مما كان عليه سابقًا؟ ربما جرّبت نفس الـ Prompt الذي كنت تستخدمه قبل أشهر، لكن النتائج لم تعد بنفس الجودة. النصوص أصبحت أكثر تشابهًا. الأفكار أصبحت أكثر تحفظًا. وحتى الإنترنت نفسه بدأ يبدو وكأنه يكرر نفس المحتوى مرارًا وتكرارًا. إذا كنت تعتقد أن المشكلة فيك... فربما تكون مخطئًا. 📚 باحثون من جامعتي University of Oxford وUniversity of Cambridge نشروا دراسة علمية كشفت ظاهرة تُعرف باسم: ⚠️ Model Collapse (انهيار النماذج) ببساطة: عندما يتم تدريب الذكاء الاصطناعي على محتوى تم إنتاجه بواسطة ذكاء اصطناعي آخر، تبدأ جودة النماذج في التدهور تدريجيًا مع كل جيل جديد. كيف يحدث ذلك؟ اليوم، الإنترنت يمتلئ بالمحتوى الذي تولده أنظمة الذكاء الاصطناعي: ✍️ مقالات 📰 أخبار ⭐ مراجعات 💬 تعليقات 📱 منشورات وسائل التواصل الاجتماعي ثم تأتي شركات الذكاء الاصطناعي لتجمع هذه البيانات من الإنترنت وتستخدمها لتدريب النماذج الجديدة. وهنا تبدأ المشكلة... النموذج الجديد يتعلم من مخرجات النموذج السابق. ومع كل دورة تدريبية يتم فقدان جزء من المعلومات الأصلية. لكن المثير للقلق أن أول ما يختفي ليس المعلومات العادية... بل الأفكار النادرة. 💡 الأفكار الإبداعية 💡 وجهات النظر المختلفة 💡 الأساليب غير التقليدية 💡 المحتوى الإنساني الحقيقي الباحثون أطلقوا على هذه الفئة اسم: 🔸 "ذيول التوزيع" (Distribution Tails) وهي أول ضحايا الانهيار. ما الذي يبقى بعد ذلك؟ ✔️ المحتوى المتوسط ✔️ الأفكار المتوقعة ✔️ الإجابات الآمنة ✔️ النصوص المتشابهة ثم يتم تدريب جيل جديد على هذا المحتوى المُسطّح... فيصبح أكثر تسطحًا. ثم جيل آخر.. حتى تبدأ النماذج في فقدان فهمها للعالم الحقيقي. 🔴 نتائج الدراسة كانت صادمة: 🔹 الجيل الأول: يمتلك تنوعًا كبيرًا ويشبه الكتابة البشرية. 🔹 الجيل الثالث: يبدأ في تكرار نفسه. 🔹 الجيل الخامس: تختفي الكلمات والأفكار النادرة. 🔹 الجيل التاسع: تبدأ النماذج بإنتاج محتوى ضعيف أو غير منطقي. ولم يقتصر الأمر على نماذج اللغة فقط. الباحثون اختبروا: 🔸 نماذج اللغة الكبيرة (LLMs) 🔸 مولدات الصور 🔸 النماذج الإحصائية وكانت النتيجة نفسها في كل مرة: ⚠️ الانهيار يحدث للجميع. حتى عندما احتفظ الباحثون بنسبة 10٪ من البيانات البشرية الأصلية في كل جيل... استمر الانهيار. كان أبطأ فقط. لكنه لم يتوقف. 👨‍🔬 وقال الباحث المشارك Ross Anderson: "نماذج اللغة الكبيرة تشبه النار... أداة مفيدة للغاية، لكنها تلوث البيئة" لكن هذا التلوث غير مرئي لا يمكنك معرفة ما إذا كانت الجملة التي تقرأها كتبها إنسان أم ذكاء اصطناعي ولا يستطيع الذكاء الاصطناعي نفسه معرفة ذلك عندما يتدرب على هذه البيانات وهنا يكمن الخطر الحقيقي 🌍 الإنترنت الذي نشأنا عليه كان مليئًا بالأفكار الغريبة والمختلفة والإنسانية أما إذا استمرت دورة "الذكاء الاصطناعي يتعلم من الذكاء الاصطناعي"، فقد نجد أنفسنا أمام عالم رقمي مليء بنسخ متشابهة من نفس الأفكار ونفس الأسلوب ونفس الصوت وهذا ما يجعل Model Collapse ليس مجرد مشكلة تقنية بل مشكلة ثقافية قد تغيّر شكل المعرفة على الإنترنت بالكامل. ⁉️ هل تعتقد أن جودة ChatGPT وأدوات الذكاء الاصطناعي تراجعت فعلًا خلال العامين الماضيين؟ أم أن النماذج أصبحت أكثر تحفظًا فقط؟ شارك رأيك في التعليقات 👇 #الذكاء_الاصطناعي #ChatGPT #AI #MachineLearning #DataScience #LLM #ArtificialIntelligence #DeepLearning #علوم_البيانات #تعلم_الآلة #تحليل_البيانات #تقنية #Technology #GenerativeAI