
Image by Freepik
تحول الذكاء الصناعي للخطاب من العقل إلى الكلام الأمواج الدماغية إلى خطاب
لقد أحرز العلماء تقدماً كبيراً في استعادة الكلام الطبيعي للأشخاص المشلولين، باستخدام زراعات الدماغ التي تعمل بالذكاء الصناعي لتحويل موجات الدماغ إلى كلمات مكتوبة في الوقت الفعلي.
بالعجلة؟ هنا الحقائق السريعة:
- يقوم النظام بتفكيك موجات الدماغ وتحويلها إلى كلام يبدو طبيعياً تقريبًا في لحظات.
- يستخدم النظام صوت المريض قبل الإصابة لتصميم توليف للكلام الشخصي، مما يتيح التواصل الأصيل.
- يفك شفرة إشارات الكلام النموذج الذكاء الاصطناعي في 80 مللي ثانية، مما يقلل كثيراً من التأخير السابق.
أفاد علماء في جامعة رادبود بالتعاون مع UMC أوترخت بأنهم طوروا تكنولوجيا زرع الدماغ بالذكاء الصناعي التي تترجم الإشارات العصبية إلى كلمات منطوقة بمعدلات دقة تتراوح بين 92-100%، كما أفادت أخبار العلوم العصبية. تسعى الأبحاث التي نشرت هذا الأسبوع في Nature Neuroscience إلى تطوير أدوات الاتصال للأشخاص المشلولين.
استخدمت الدراسة مرضى الصرع الذين تم زرع مُدخلات دماغية فيهم لفترة قصيرة لإنشاء العلاقات بين الإشارات العصبية والتعبيرات اللفظية. هذا التطور قلل من التأخير السابق الذي جعل الاتصال صعبا للأشخاص الذين يعانون من صعوبات الكلام.
“يجلب نهجنا المباشر نفس قدرة فك التشفير السريع للكلام الذي تقدمه أجهزة مثل أليكسا وسيري إلى الأجهزة العصبية الاصطناعية”، هكذا أوضح جوبالا أنومانتشيبالي، المحقق المشارك الرئيسي في الدراسة، كما ذكرته New Atlas. “باستخدام نوع مماثل من الخوارزميات، اكتشفنا أننا يمكننا فك تشفير البيانات العصبية و، لأول مرة، تمكين التدفق الصوتي التزامني تقريبا”، أضاف.
يعمل النظام من خلال التقاط نشاط الدماغ عبر الأقطاب الكهربائية عالية الكثافة الموضوعة على سطح الدماغ. ثم يقوم الذكاء الاصطناعي بتفكيك هذه الإشارات، وإعادة تشكيل الكلمات والجمل بدقة مدهشة.
بالإضافة إلى ذلك، يضمن نموذج تحويل النص إلى كلام، الذي تم تدريبه على صوت المريض قبل الإصابة، أن الكلام المنتج يبدو طبيعيًا، ويشبه إلى حد كبير صوتهم الأصلي.
أحد مؤلفي الدراسة، تشول جون تشو، شرح كيف يقوم النظام بتحويل الأفكار إلى كلام: “ما نحن نفكره هو بعد حدوث الفكرة، بعد أن قررنا ماذا سنقول، بعد أن قررنا أي الكلمات سنستخدم وكيف سنتحرك عضلات الجهاز الصوتي لدينا”، كما ذكر في New Atlas.
تحقق هذا الاختراق تحسيناً كبيراً على التكنولوجيات السابقة. بالإضافة إلى ذلك، يوفر هذا النظام الذي يعتمد على الذكاء الاصطناعي الآن بداية نطق بوقت ثانية واحدة مما يتيح المحادثات المتواصلة السلسة. يمكن أن تكون هذه التكنولوجيا تغييراً جذرياً في حياة الأشخاص الذين يعانون من شلل شديد أو متلازمة الإقفال أو الحالات مثل مرض التصلب اللويحي، بتمكينهم من القدرة على التواصل بشكل طبيعي مع الآخرين.
ومع ذلك، بالرغم من هذه التقدمات، ما زالت التكنولوجيا تواجه تحديات. كما هو موضح في أخبار علم الأعصاب، يتطلب هذا الذكاء الاصطناعي تدريباً واسعاً على بيانات الشخص العصبية، وقد لا يعمل بفعالية لأولئك الذين يفتقدون التسجيلات الصوتية السابقة.
بينما يمكن للنظام فك تشفير الكلمات، لا يزال الوصول إلى الإيقاع والتعبير الطبيعي تمامًا صعبًا. بالإضافة إلى ذلك، تجد النماذج الحالية صعوبة في التنبؤ بالجمل والفقرات الكاملة، مع التركيز بشكل رئيسي على الكلمات الفردية.
بالإضافة إلى ذلك، فإن الإصدارات غير الجراحية باستخدام خوذات EEG لديها دقة أقل، حوالي 60٪، مقارنة بالأقطاب المزروعة، كما لاحظت في New Scientist.
من الآن فصاعدًا، يهدف الباحثون إلى تعزيز سرعة النظام اللغوية وتعبيريته، لجعل المحادثات تبدو أكثر واقعية. تضيف كاتبة النص أن هذه الخطوة تهدف إلى جعل التفاعلات أكثر سلاسة وطبيعية.
اترك تعليقًا
إلغاء