سيتمكن مستخدمو Microsoft Teams قريبًا من استخدام الإصدارات المستنسخة من أصواتهم للتحدث وترجمة المحادثة في الوقت الفعلي، حيث تكشف الشركة عن أداة المترجم الفوري الجديدة التي تعمل بالذكاء الاصطناعي.
أعلن في السنوي مايكروسوفت إشعال المؤتمر وأبلغ عنه تك كرانشتتيح الميزة الجديدة للمستخدمين إنشاء نسخ رقمية طبق الأصل من أصواتهم والتي يمكن استخدامها بعد ذلك لترجمة كلامهم إلى لغات مختلفة. “تخيل أنك قادر على أن تبدو مثلك تمامًا في لغة مختلفة. يوفر المترجم الفوري في Teams ترجمة من الكلام إلى كلام في الوقت الحقيقي أثناء الاجتماعات، ويمكنك اختيار جعله يحاكي صوتك أثناء التحدث للحصول على تجربة أكثر شخصية وجاذبية.” كتب Microsoft CMO Jared Spataro في منشور مدونة تمت مشاركته مع المنشور.
سيسمح Instagram للمستخدمين بإعادة ضبط المحتوى الموصى به
ستكون الميزة متاحة فقط لمشتركي Microsoft365، وسيتم إطلاقها مبدئيًا للغة الإنجليزية والفرنسية والألمانية والإيطالية واليابانية والكورية والبرتغالية والصينية الماندرين والإسبانية.
سرعة الضوء ماشابل
يتمتع المترجم الفوري من Microsoft بالقدرة على جعل أعمال العمل عن بعد والتواصل الاجتماعي الرقمي أكثر سهولة لمجموعة واسعة من المتحدثين غير الناطقين باللغة الإنجليزية، على الرغم من أنه ليس ديناميكيًا بعد مثل المترجم البشري الحي. وبعيدًا عن تطبيقها الصريح، تثير الأداة المزيد من الأسئلة حول التحيز الأمني والتكنولوجي.
حديثة يذاكر وجدت أن أداة النسخ الشائعة المدعومة بالذكاء الاصطناعي Whisper – والتي تُستخدم أيضًا في برامج الحوسبة السحابية من Microsoft – كانت مليئة بالهلوسة، بما في ذلك اختراع محتوى أو عبارات عند ترجمة معلومات المريض في المجال الطبي. وكان هذا ينطبق بشكل خاص على المرضى الذين يعانون من اضطرابات النطق مثل فقدان القدرة على الكلام. لقد تبين أن دبوس Humane AI الذي تم الترويج له سابقًا، والذي تم الإعلان عنه لقدراته على الترجمة المباشرة، هو عبارة عن دبوس غير متناسق البديل الرقمي للترجمة البشرية وفي معالجة مخاوف مماثلة بشأن مترجم الفرق، قالت Microsoft لـ TechCrunch: “تم تصميم المترجم لتكرار رسالة المتحدث بأمانة قدر الإمكان دون إضافة افتراضات أو معلومات غريبة. لا يمكن تمكين محاكاة الصوت إلا عندما يقدم المستخدمون الموافقة عبر إشعار أثناء الاجتماع أو عن طريق تمكين “الموافقة على محاكاة الصوت” في الإعدادات.”
يمكن أن يكون للتكنولوجيا آثار هائلة في مجال إمكانية الوصول، مع شخصيات بارزة مثل الممثلة الأمريكية جينيفر ويكستون تضخيم استخدام استنساخ الصوت الشخصي عالي التقنية للأشخاص الذين يعانون من كلام غير نمطي. ولكنه أثار أيضًا مخاوف بشأن الاستخدامات غير التوافقية للتزييف العميق واحتمال أن تصبح التكنولوجيا أداة في ترسانة المحتالين. تقنية قوية لاستنساخ الكلام بالذكاء الاصطناعي – يقال إنها من إنتاج مايكروسوفت تشبه الإنسان بشكل مثير للإعجاب – أثار مخاوف أخلاقية، مع الرئيس التنفيذي لشركة مايكروسوفت الدعوة إلى حواجز حماية أقوى وحوكمة الذكاء الاصطناعي في مواجهة التزييف العميق المتزايد للمشاهير.
ومع ذلك، فإن الضجة حول استنساخ الصوت، والتي عززها جنون الذكاء الاصطناعي، قد نمت فقط بين مبتكري الصناعة، مما أضاف إلى الاستثمارات السابقة في ترجمة الكلام إلى النص باستخدام الذكاء الاصطناعي. في العام الماضي، أعلنت شركة Apple عن ميزة الصوت الشخصي، وهي أداة للتعلم الآلي تقوم بإنشاء نسخة مركبة من صوت المستخدم يمكن استخدامها في مواقف تحويل النص إلى كلام مباشرة، مثل FaceTime، وتم الإعلان عنها كإمكانية وصول. كشفت مايكروسوفت النقاب عن الخاصة بها صوت شخصي الميزة في نفس الوقت تقريبًا، مدعومة بـ Azure AI ومتوفرة بـ 90 لغة.