طفرة في الذكاء الاصطناعي تساعد على فهم الكلام الصامت
باحثون من جامعة كاليفورنيا في بيركلي نجحوا في تطوير خوارزمية معتمدة على الذكاء الاصطناعي تعمل على استخدام الكلمات الصامتة وأجهزة الاستشعار التي تجمع نشاط العضلات لتحول الكلام الصامت إلى كلام مفهوم. يتم الكشف عن الكلام الصامت باستخدام التخطيط الكهربائي للعضلات والذي يعرف باسم (EMG) . تتم العملية من خلال وضع أقطاب كهربائية على الوجه والحلق. يركز النموذج على ما يسميه الباحثون بالتعبير الرقمي للتنبؤ بالكلمات وتوليد الكلام الاصطناعي.
كيفية عمل الذكاء الاصطناعي
يعتقد الباحثون أن طريقتهم يمكن أن تكون مقدمةً لتوفير عدد من التطبيقات لمساعدة للأشخاص غير القادرين على إنتاج كلام مسموع. وبالتالي يمكن أن تعمل على دعم انتاج الكلام بمساعدة الذكاء الاصطناعي أو الأجهزة الأخرى التي تستجيب للأوامر الصوتية.
بحسب ورقة الفريق: “إن الكلام الصامت رقميًا له مجموعة واسعة من التطبيقات المحتملة”. “على سبيل المثال، يمكن استخدامه لإنشاء جهاز مشابه لسماعة رأس بلوتوث تتيح للأشخاص إجراء محادثات هاتفية دون إزعاج من حولهم. يمكن أن يكون هذا الجهاز مفيدًا أيضًا في الإعدادات التي تكون فيها الإزعاج عالية جدًا. سيساعد الجهاز بحيث لا يمكن التقاط الكلام المسموع أو حيث يكون الحفاظ على الصمت أمرًا مهمًا “.
تطبيقات مفيدة
مثال آخر على الذكاء الاصطناعي يمكنه التقاط الكلمات من الكلام الصامت و قراءة الشفاه. يمكن لقراءة الشفاه تشغيل أدوات المراقبة أو دعم التطبيقات المختلفة عند الأشخاص الصم.
من أجل التنبؤ بالكلام الصامت، استخدم باحثو جامعة كاليفورنيا نهجًا مختلفاً. حيث يتم نقل أهداف الإخراج الصوتي من التسجيلات الصوتية إلى التسجيلات الصامتة للألفاظ نفسها. ثم بعد ذلك يتم استخدام مفكك الشفرة لإنشاء تنبؤات الكلام الصوتي.
مقارنة بخط الأساس الذي تم تدريبه باستخدام بيانات التخطيط الكهربائي للعضلات الصوتية، فإن هذا النهج يوفر انخفاضًا في معدلات الخطأ. فقد انخفض معدل أخطاء الكلمات في نسخ الجمل من الكتب بنسبة 64٪ إلى 4٪ ، و انخفض بنسبة 95٪ من خط الأساس. لتغذية العمل الإضافي في هذا المجال، فتح الباحثون مجموعة بيانات تضم ما يقرب من 20 ساعة من بيانات مخطط التخطيط الكهربائي لعضلات الوجه.
حصلت ورقة بحثية عن النموذج بعنوان “الصوت الرقمي للكلام الصامت” على جائزة أفضل ورقة لأحدث الأساليب التجريبية في معالجة اللغة الطبيعية.