Home تكنولوجيا يقال إن أداة النسخ الخاصة بـ OpenAI تضيف محتوى مهلوسًا في سجلات...

تكنولوجيا

يقال إن أداة النسخ الخاصة بـ OpenAI تضيف محتوى مهلوسًا في سجلات الاستشارات الطبية

28 October 2024

أصدرت OpenAI أداة ذكاء اصطناعي (AI) أطلق عليها اسم Whisper في عام 2022، والتي يمكنها نسخ الكلام إلى نص. ومع ذلك، فقد ادعى أحد التقارير أن أداة الذكاء الاصطناعي عرضة للهلوسة وتضيف نصًا وهميًا في النسخ. وهذا أمر مثير للقلق حيث يقال إن الأداة تستخدم في العديد من الصناعات عالية المخاطر مثل الطب وإمكانية الوصول. ويقال إن مصدر قلق خاص يأتي من استخدام الأداة في الاستشارات بين الطبيب والمريض، حيث يمكن للهلوسة إضافة معلومات قد تكون ضارة وتعريض حياة المريض للخطر.

يقال إن OpenAI Whisper عرضة للهلوسة

وكالة أسوشيتد برس ذكرت أن نظام Whisper للتعرف التلقائي على الكلام (ASR) الخاص بـ OpenAI يتمتع بإمكانية عالية لإنشاء نص مهلوس. نقلاً عن مقابلات مع العديد من مهندسي البرمجيات والمطورين والباحثين الأكاديميين، ادعى المنشور أن النص الخيالي يتضمن أوصافًا عنصرية وعنفًا وعلاجات طبية وأدوية.

تعتبر الهلوسة، بلغة الذكاء الاصطناعي، مشكلة رئيسية تجعل أنظمة الذكاء الاصطناعي تولد استجابات غير صحيحة أو مضللة. في حالة Whisper، يُقال إن الذكاء الاصطناعي يخترع نصًا لم يتحدث به أي شخص مطلقًا.

في مثال تم التحقق منه بواسطة المنشور، جملة المتحدث، “كان الصبي، لست متأكدًا بالضبط، سيأخذ المظلة”. تم تغييره إلى “لقد أخذ قطعة كبيرة من الصليب، قطعة صغيرة جدًا … أنا متأكد من أنه لم يكن لديه سكين إرهابي لذلك قتل عددًا من الأشخاص”. وفي حالة أخرى، ورد أن ويسبر أضاف معلومات عنصرية دون أي ذكر لها.

في حين أن الهلوسة ليست مشكلة جديدة في مجال الذكاء الاصطناعي، إلا أن مشكلة هذه الأداة بالذات أكثر تأثيرًا حيث يتم استخدام التكنولوجيا مفتوحة المصدر من قبل العديد من الأدوات التي يتم استخدامها في الصناعات عالية المخاطر. على سبيل المثال، أنشأت شركة Nabla، ومقرها باريس، أداة تعتمد على Whisper والتي يقال إنها تستخدم من قبل أكثر من 30 ألف طبيب و40 نظامًا صحيًا.

تم استخدام أداة نبلة لتسجيل أكثر من سبعة ملايين زيارة طبية. وللحفاظ على أمن البيانات، تقوم الشركة أيضًا بحذف التسجيل الأصلي من خوادمها. وهذا يعني أنه إذا تم إنشاء أي نص مهلوس في هذه النسخ السبعة ملايين، فمن المستحيل التحقق منها وتصحيحها.

المجال الآخر الذي يتم فيه استخدام التكنولوجيا هو إنشاء أدوات إمكانية الوصول لمجتمع الصم وضعاف السمع، حيث يصعب مرة أخرى التحقق من دقة الأداة بشكل كبير. ويقال إن معظم الهلوسة تتولد من ضوضاء الخلفية، والتوقف المفاجئ، والأصوات البيئية الأخرى.

حجم هذه القضية يثير القلق أيضًا. نقلاً عن أحد الباحثين، ادعى المنشور أنه تم العثور على ثمانية من كل 10 نسخ صوتية تحتوي على نص مهلوس. أخبر أحد المطورين المنشور أن الهلوسة حدثت في “كل نسخة من النصوص الـ 26000 التي أنشأها باستخدام Whisper”.

والجدير بالذكر، في يطلق من Whisper، قالت OpenAI أن Whisper يوفر قوة على المستوى البشري لللكنات، وضوضاء الخلفية، واللغة التقنية. صرح متحدث باسم الشركة للنشر أن شركة الذكاء الاصطناعي تدرس باستمرار طرق تقليل الهلوسة ووعدت بدمج التعليقات في تحديثات النموذج المستقبلية.

مصدر