
Image by lucabravo, from Freepik
باحثون يبنون نموذج الذكاء الصناعي بـ 50 دولارًا ينافس OpenAI وDeepSeek
تمكنت مجموعة من الباحثين في مجال الذكاء الصناعي من جامعة ستانفورد وجامعة واشنطن من تدريب نموذج للذكاء الصناعي ذو أداء عالي بتكلفة أقل من 50 دولارًا للحوسبة السحابية، وفقاً لـ ورقة بحثية صدرت الجمعة الماضية، كما أفادت لأول مرة TechCrunch.
في عجلة من أمرك؟ إليك الحقائق السريعة!
- قام الباحثون بتدريب نموذج الذكاء الصناعي للتفكير بأقل من 50 دولار كتكلفة للحوسبة السحابية.
- يؤدي النموذج، s1، بنفس مستوى أداء نموذج OpenAI الذي يدعى o1 ونموذج DeepSeek المعروف بـ R1.
- s1 مفتوح المصدر ومتوفر على GitHub مع بيانات التدريب والكود الخاص به.
تعمل النموذج، المسمى s1، بمستوى يضاهي الذكاء الاصطناعي المتقدم في التفكير مثل o1 الخاص بـ OpenAI و R1 الخاص بـ DeepSeek في اختبارات الرياضيات والبرمجة. وهو متاح بحرية على GitHub، بالإضافة إلى بيانات التدريب والرمز.
لتطوير s1، بدأ الباحثون بنموذج AI موجود مسبقًا وقاموا بتنقيحه باستخدام عملية تسمى التقطير. هذه الطريقة تستخرج مهارات التفكير من AI أكثر تقدمًا عن طريق التدريب على إجاباته.
كشف الفريق أنه تم تقطير s1 من نموذج Google’s Gemini 2.0 Flash Thinking العملي التجريبي.
قامت مجموعة من الباحثين ببناء نموذج الذكاء الاصطناعي المفتوح المصدر الذي ينافس OpenAI’s o1-preview في حل المشكلات الرياضية والمنطقية الصعبة. سرهم؟ خدعة بسيطة تعطي الذكاء الاصطناعي وقتًا أطول للتفكير قبل الإجابة.
هذه الطريقة، التي تُطلق عليها “إجبار الميزانية”، تعمل من خلال جعل الذكاء الاصطناعي يتخذ خطوات إضافية عند حل المشكلات بدلاً من الإسراع إلى الإجابة. من خلال منح نفسه وقتًا أطول، يمكن للذكاء الاصطناعي التحقق مرة أخرى من عمله وتحسين الدقة.
لقد قام الفريق بتدريب نموذجهم، الذي يُطلق عليه اسم s1-32B، باستخدام فقط 1000 سؤال مثالي مختار بعناية مع شرح خطوة بخطوة.
بالرغم من هذا العدد الصغير من البيانات، فقد أظهر النموذج أداءً أفضل من o1-preview الخاص بـ OpenAI في اختبارات الرياضيات المعقدة، مثل MATH وAIME24، وقد تحسنت النتائج بنسبة تصل إلى 27٪. حتى أنه تمكن من تعزيز درجته الخاصة في اختبار من 50٪ إلى 57٪ فقط من خلال التفكير لفترة أطول قبل الإجابة النهائية – دون أي تدريب إضافي.
هذا أمر كبير الأهمية لأن معظم التحسينات في الذكاء الصناعي تعتمد على كميات ضخمة من بيانات التدريب الجديدة. بدلاً من ذلك، تشير هذه الدراسة إلى أن العديد من نماذج الذكاء الصناعي تحتوي بالفعل على مهارات استدلال قوية مخفية داخلها – فهي تحتاج فقط إلى التقنيات الصحيحة لاكتشافها.
كما اختبرت الدراسة طرق مختلفة لتمديد وقت التفكير للذكاء الصناعي. تضمنت أحد الطرق السماح للذكاء الصناعي بتحسين إجاباته خطوة بخطوة، بينما تضمنت الأخرى أن يولد عدة إجابات ممكنة في وقت واحد ويختار الأفضل. كانت الطريقة الأفضل هي استخدام مزيج من الطريقتين، وذلك باستخدام عملية اتخاذ القرار على شكل شجرة.
بينما تتواجد القيود في هذه التقنية، مثل مساحة ذاكرة الذكاء الاصطناعي المخصصة للحسابات، يعتقد الباحثون أن مزيدًا من التعديلات قد يعزز قدراتها أكثر. كما يقترحون أن تعلم التعزيز، وهو الأسلوب الذي يتعلم من خلاله الذكاء الاصطناعي من التجربة والخطأ، قد يجعل التفكير في وقت الاختبار أكثر ذكاءً.
من خلال جعل نموذجهم وأبحاثهم متاحة بحرية، يأمل الفريق في تشجيع تطوير الذكاء الاصطناعي المفتوح والشفاف أكثر، مساعدة الآخرين في بناء أنظمة ذكاء اصطناعي أكثر ذكاءً وموثوقية.
اترك تعليقًا
إلغاء