تحذر الشركات المتعاقدة من أن الإرشادات الجديدة لـ Google قد تؤثر على دقة Gemini في المواضيع الحساسة

Image by Solen Feyissa, from Unsplash

تحذر الشركات المتعاقدة من أن الإرشادات الجديدة لـ Google قد تؤثر على دقة Gemini في المواضيع الحساسة

وقت القراءة: 3 دقائق

أدى تحول حديث في الإرشادات الداخلية في Google إلى زيادة القلق بشأن دقة ذكائها الاصطناعي Gemini، وخاصة عند التعامل مع الموضوعات الحساسة أو المتخصصة بشدة.

في عجلة من أمرك؟ ها هي الحقائق السريعة!

  • لم يعد بإمكان المتعاقدين مع Google تجاهل المطالبات خارج مجال خبرتهم لتقييم Gemini.
  • المتعاقدون الآن يقومون بتقييم الردود الذكاء الاصطناعي التي لا يفهمونها تمامًا، مع ملاحظة نقص الخبرة.
  • كان المتعاقدون يتجاهلون سابقًا المطالبات حول مواضيع معقدة مثل علم القلب أو الأمراض النادرة.

لم يعد بإمكان المتعاقدين العاملين على مشروع Gemini، الذين يتم تكليفهم بتقييم دقة الردود التي تولدها الذكاء الصناعي، تجاوز التلميحات خارج مجال خبرتهم. هذا التغيير، الذي تم الإبلاغ عنه لأول مرة بواسطة TechCrunch، قد يؤثر بشكل محتمل على موثوقية المعلومات التي يقدمها الذكاء الصناعي حول مواضيع مثل الرعاية الصحية، حيث يكون الدقة في المعرفة أمراً بالغ الأهمية.

تلاحظ TechCrunch أن المتعاقدين في GlobalLogic، وهي شركة متخصصة في التعهيد تمتلكها هيتاشي، كانوا في السابق مكلفين بتقييم ردود الذكاء الاصطناعي بناءً على عوامل مثل “الصدق” وكانوا مسموح لهم بتجاوز الأسئلة التي تتجاوز مجال خبرتهم.

على سبيل المثال، إذا تم طلب تقييم سؤال فني حول علم القلب، يمكن للمتعاقد الذي ليس لديه خلفية علمية أن يتجاوزه.

ومع ذلك، في ضوء الإرشادات الجديدة، يتم الآن توجيه المتعاقدين لتقييم الردود على جميع المواضيع، بما في ذلك تلك التي تتطلب معرفة متخصصة، وتسجيل أي مناطق يفتقرون فيها إلى الخبرة، كما أفادت TechCrunch.

أدت القاعدة الجديدة إلى القلق حول جودة التصنيفات المقدمة للمواضيع المعقدة. يُكلف المتعاقدين الآن، وغالبًا ما يكونون بدون الخلفية اللازمة، بتقييم ردود الذكاء الاصطناعي على قضايا مثل الأمراض النادرة أو الرياضيات المتقدمة.

أعرب أحد المتعاقدين عن إحباطه لـ TechCrunch في المراسلات الداخلية، حيث تساءل حول المنطق وراء إلغاء خيار التخطي: “ألم يكن الهدف من التخطي هو زيادة الدقة عن طريق تحويلها إلى شخص أكثر قدرة؟”

وفقًا لتقارير TechCrunch، تسمح الإرشادات المحدثة للمتعاقدين بتخطي التحفيزات فقط في حالتين: إذا كان التحفيز أو الرد غير كامل أو يحتوي على محتوى ضار يتطلب موافقة خاصة للتقييم.

أثارت هذه القيود قلقًا بين الذين يعملون على جيميني، الذين يخشون أن الذكاء الاصطناعي قد ينتج معلومات غير دقيقة أو مضللة في المجالات الحساسة بشدة.

تقارير TechCrunch أن جوجل لم تقدم ردًا مفصلاً على القلق الذي أثاره المتعاقدون.

ومع ذلك، أكد المتحدث باسم الشركة لـ TechCrunch أن الشركة “تعمل باستمرار على تحسين الدقة الفعلية في Gemini”. وأوضحوا أيضاً أنه بينما يقدم المقيمون تعليقات ثمينة عبر عوامل متعددة، فإن تقييماتهم لا تؤثر مباشرة على الخوارزميات ولكن يتم استخدامها لقياس أداء النظام العام.

Mashable لاحظت أن التقرير يشكك في الصرامة والمعايير التي تدعي Google تطبيقها عند اختبار Gemini للدقة.

في قسم “البناء بمسؤولية” من إعلان Gemini 2.0، أعلنت Google أنها “تعمل مع مختبرين موثوقين وخبراء خارجيين وتجري تقييمات مخاطر شاملة وتقييمات الأمان والضمان”.

بينما هناك تركيز معقول على تقييم الردود بالنسبة للمحتوى الحساس والضار، يبدو أنه يتم إعطاء اهتمام أقل للردود التي، بينما ليست ضارة، فهي ببساطة غير دقيقة، كما لاحظت Mashable.

هل أعجبك هذا المقال؟ امنحه تقييمًا!
كان سيئًا لم يعجبني كان معقولًا جيد إلى حد كبير! أحببته!

يسعدنا أن عملنا أعجبك!

نهتم برأيك لأنك من قرّائنا الذين نقدِّرهم، فهلّ يمكن أن تقيّمنا على Trustpilot؟ إنه إجراء سريع ويعني الكثير لنا. شكرًا لتعاونك القيّم!

قيِّمنا على Trustpilot
5.00 بتصويت 2 من المستخدمين
عنوان
تعليق
شكرًا على ملاحظاتك!
Loader
Please wait 5 minutes before posting another comment.
Comment sent for approval.

اترك تعليقًا

Loader
Loader عرض المزيد…