مايكروسوفت تدرب نموذج ذكاء اصطناعي جديد كبير بما يكفي لينافس نماذج LLM الكبرى
تعمل مايكروسوفت على تطوير نموذج لغوي كبير جديد (LLM) يحمل الاسم الرمزي MAI-1، ولديه القدرة على منافسة نموذجي LLM اللذين طورتهما Google وOpenAI. وهذه أول مرة تُطور مايكروسوفت نموذج LLM بهذا الحجم منذ استثمارها مليارات الدولارات في OpenAI لتحصل على حقوق استخدام تقنيتها في مجموعة برامج الإنتاجية التي توفرها مايكروسوفت.
تطوير MAI-1 يشرف عليه مصطفى سليمان، المؤسس المشارك لشركة DeepMind المملوكة لـ Google وشركة Inflection، وفقًا لتقرير نشرته شركة The Information. وفي مارس 2024، استحوذت مايكروسوفت على عدد من موظفي Inflection في صفقة بقيمة 650 مليون دولار.
وفقًا للتقرير الذي صدر في 6 مايو، سيحتوي MAI-1 على نحو 500 مليار من المُعلِّمات، ما يضعه بين التريليون مُعلِّمة التي ورد أنها مستخدمة في نموذج GPT-4 التابع لـ OpenAI والـ 70 مليار مُعلِّمة في نموذج Meta Llama 3 AI. ومن المتوقع أيضًا أن يكون “أكبر بكثير” وأغلى من نموذجي الذكاء الاصطناعي مفتوحَي المصدر الأصغر حجمًا السابقين من مايكروسوفت (Phi-3 و WizardLM-2) لأنه سيتطلب مزيدًا من القدرة الحاسوبية وبيانات التدريب.
وفي حين أن MAI-1 قد يستفيد من التقنيات وبيانات التدريب من شركة Inflection، فإنه يظل متميزًا عن أي نماذج أو تقنيات أنتجتها OpenAI أو Inflection. فوفقًا لموظفي مايكروسوفت الذين هم على دراية بالمشروع، MAI-1 هو نموذج LLM جديد تمامًا مطور داخليًا في مايكروسوفت.
لم تعلن مايكروسوفت بعد عن الهدف الدقيق من MAI-1، واستخدامه الدقيق سيعتمد على أدائه. وفي هذه الأثناء، خصصت الشركة مجموعة كبيرة من الخوادم بوحدات معالجة رسومات من Nvidia تستخدم كميات كبيرة من البيانات من مصادر مختلفة لتحسين النموذج.
ووفقًا للتقارير، اعتمادًا على معدل تقدُّم المشروع، قد تعرض الشركة MAI-1 في مؤتمر مطوري Build في وقت لاحق من هذا الشهر، لكن هذا غير مؤكد.
اترك تعليقًا
إلغاء