تحقيقات تكشف أن Apple وNvidia وشركات أخرى استخدمت مقاطع YouTube لتدريب الذكاء الاصطناعي

Photo by Szabo Viktor on Unsplash

تحقيقات تكشف أن Apple وNvidia وشركات أخرى استخدمت مقاطع YouTube لتدريب الذكاء الاصطناعي

وقت القراءة: 2 دقائق

  • Andrea Miliani

    كتبه: Andrea Miliani خبير أخبار التكنولوجيا

  • فريق الترجمة والتوطين

    ترجمة فريق الترجمة والتوطين خدمات الترجمة والتوطين

كشف تحقيق جديد أجراه استوديو Proof News الإخباري غير الهادف إلى الربح ومجلة Wired أن شركات ذكاء اصطناعي كبرى مثل Anthropic وNvidia وApple وSalesforce استخدمت آلاف الفيديوهات المنشورة على YouTube في تدريب نماذج الذكاء الاصطناعي رغم سياسات YouTube التي تمنع الحصول على المحتوى من دون إذن.

أجرى باحثون ذوو خبرة تقنية تحليلات لمجموعات البيانات المتاحة للجمهور، واكتشفوا أن شركات وادي السيليكون تلك وغيرها استخدمت تفريغات صوتية لـ 173,536 فيديو على YouTube من أكثر من 48,000 قناة.

وأوضح Proof News أنه اكتشف استخدام مواد من نجوم YouTube أمثال Mr. Beast وPewDiePie وJacksepticeye وMarques Brownlee، إضافةً إلى محتوى تعليمي من قنوات مثل MIT وHarvard وKhan Academy، ومنشورات إخبارية من وكالات مثل BBC وNPR وWall Street Journal. كما ذكر الاستوديو أن بعض البرامج الشهيرة مثل Jimmy Kimmel Live وThe Late Show With Stephen Colbert وLast Week Tonight With John Oliver استُخدمت في الدراسة ضمن مجموعة البيانات.

سُميت مجموعة البيانات “YouTube Subtitles”، أي “ترجمات يوتيوب”، وشملت أيضًا ترجمات إلى لغات مثل العربية والألمانية واليابانية، وأنشأتها EleutherAI، وهي مجموعة بحثية غير هادفة إلى الربح تعمل في مجال الذكاء الاصطناعي.

ووفقًا لبحث نشرته EleutherAI، فإن مجموعة البيانات جزء من تجميعة تُسمى Pile، وتشمل مواد من مصادر أخرى أيضًا. وأكدت شركات Apple وNvidia وSalesforce وBloomberg وDatabricks، إضافةً إلى شركة Antropic التي تركز على “أمان الذكاء الاصطناعي”، أنها استخدمت تجميعة Pile في تدريب نماذج الذكاء الاصطناعي من خلال الأوراق البحثية والمستندات.

كما أطلقت Proof News أمس أيضًا أداة لمساعدة صناع المحتوى والباحثين والجمهور على العثور على مقاطع الفيديو المستخدمة في قاعدة البيانات. وأوضحت المنظمة في بيان صحفي: “أنشأنا أداة تُتيح لك البحث في البيانات بنفسك. ويُرجى العلم أن أداة البحث قد تعرض بين الحين والآخر بيانات خاطئة من القنوات ومقاطع الفيديو التي تشملها مجموعة البيانات. فاحرص على تهجئة عنوان القناة أو الفيديو تهجئة صحيحة”.

كما أعرب مستخدمو YouTube الذين يشملهم البحث عن قلقهم واستيائهم. فقال ديف ويسكس، الرئيس التنفيذي لمنصة Nebula في تصريحات لـ Proof News وWired بعد أن علم أن محتوى منصته استُخدم في تدريب نماذج الذكاء الاصطناعي: “هذه سرقة. هل سيُستخدم هذا في استغلال الفنانين وإيذائهم?نعم، بالتأكيد”.

هل أعجبك هذا المقال؟ امنحه تقييمًا!
كان سيئًا لم يعجبني كان معقولًا جيد إلى حد كبير! أحببته!
0 بتصويت 0 من المستخدمين
عنوان
تعليق
شكرًا على ملاحظاتك!
Please wait 5 minutes before posting another comment.
Comment sent for approval.

اترك تعليقًا

عرض المزيد…