
Photo by Sebastien Bonneval on Unsplash
باحثون أمريكيون يبنون نموذجًا متقدمًا للتفكير بأقل من 50 دولار
باحثو الذكاء الصناعي من جامعة واشنطن وستانفورد قاموا بتدريب نموذج الذكاء الصناعي للتفكير باقل من 50 دولار – في رصيد الحوسبة السحابية – يدعى s1. أصدر الفريق ورقة بحثية بعنوان s1: Simple test-time scaling، تتضمن تفاصيل أكثر عن منهجيتهم يوم الاثنين هذا.
في عجلة من أمرك؟ ها هي الحقائق السريعة!
- أجرى باحثو الذكاء الصناعي من جامعة واشنطن وستانفورد تدريبًا على نموذج التفكير الذكي الصناعي مقابل أقل من 50 دولار وشاركوا بنتائج بحثهم هذا الاثنين.
- استخدموا تقنية التقطير، ونطاق توقيت الاختبار، وأسلوب التنعيم الإشرافي، مع مجموعة بيانات تتألف من 1000 سؤال.
- يقدم النموذج s1 أداءً مماثلاً لـ DeepSeek R1 و OpenAI o1.
وفقًا لـتك كرانش، يتميز النموذج الجديد بأداء مشابه للنماذج المتقدمة مثل R1 لـDeepSeek، أو o1 لـ OpenAI وهو متاح على GitHub.
لتطوير نموذج الذكاء الصناعي، قام الباحثون بتطبيق عملية تعرف بالتقطير – حيث يقدم نموذج الذكاء الصناعي الأكبر بيانات لنموذج أصغر – مستمدين قدرات التفكير من جوجل جيمناي 2.0 فلاش ثينكينج إكسبريمنتال.
هذه العملية تكتسب شعبية في صناعة الذكاء الصناعي حيث تدعي OpenAI أن DeepSeek استخدمت العملية، بدون إذن، لتطوير نموذجها المتقدم للتفكير. الباحثون من مختبر سكاي للحوسبة في جامعة بيركلي تمكنوا أيضا مؤخرا من تدريب نموذج التفكير بأقل من 450 دولار باستخدام هذه التقنية، مما أثار النقاش في وادي السيليكون والغضب بين الشركات الكبيرة للذكاء الصناعي.
الباحثون الذين يطورون نموذج s1 قاموا أيضاً بالنظر في منهج “التحجيم في وقت الاختبار” – من خلال اجبار النموذج على التوقف والتفكير بشكل أكبر قبل تقديم الإجابة – وأجروا تدريبًا دقيقًا تحت إشراف من نموذج مُعَد مُسبقًا لبناء نموذج التفكير الذكي للذكاء الاصطناعي.
“نحن نطور الإكراه الميزانية للتحكم في الحوسبة في وقت الاختبار من خلال إنهاء عملية التفكير للنموذج بقوة أو تطويلها من خلال إلحاق كلمة ‘انتظر’ عدة مرات إلى الجيل الذي يحاول النموذج إنهاؤه”، كما يذكر ال ورقة. “يمكن أن يجبر هذا النموذج على التحقق مرة أخرى من إجابته، مما يصحح غالبًا التفكير الغير صحيح”.
استخدم الخبراء مجموعة بيانات تضم 1000 سؤال وجواب معتنى بها لتدريب نموذجهم في أقل من 30 دقيقة باستخدام بطاقات الرسومات Nvidia H100، مما يدل على أنه من الممكن تحقيق نتائج متقدمة باستخدام قاعدة بيانات صغيرة والاستفادة من التقنيات الأخرى ونماذج الذكاء الصناعي.
“التقدم الأخير في المنطق، مثل OpenAi’s o1 و DeepSeek’s R1، يفتقر إلى الشفافية، مما يقيد التقدم في البحوث على نطاق أوسع،” كتب الباحثون. “تهدف أعمالنا إلى دفع الحدود في المنطق بطريقة مفتوحة تمامًا، وتعزيز الابتكار والتعاون لتسريع التقدم الذي يعود بالنفع على المجتمع في نهاية المطاف.”
اترك تعليقًا
إلغاء