تم إصدار Meta NotebookLlama AI Podcast Generator كأداة مفتوحة المصدر لمنافسة NotebookLM من Google

أصدرت Meta أداة ذكاء اصطناعي جديدة مفتوحة المصدر (AI) يوم الأحد والتي ستتنافس مع Google NotebookLM. الأداة التي يطلق عليها اسم NotebookLlama، عبارة عن مولد بودكاست مدعوم بالذكاء الاصطناعي حيث يمكن للمستخدمين تحميل ملف PDF وستقوم الأداة بتحويله إلى بودكاست صوتي يحتوي على حرفين من الذكاء الاصطناعي. تستخدم الأداة ثلاثة نماذج مختلفة من Llama 3.1 AI لإكمال العملية بأكملها. تمامًا مثل أداة Google، يتبع البودكاست الخاص بـ NotebookLlama أيضًا محادثة ذهابًا وإيابًا بين مضيفين يعملان بالذكاء الاصطناعي بطريقة سلسة.

تستخدم أداة Meta NotebookLlama AI ثلاثة نماذج لغوية كبيرة لإنشاء ملفات صوتية من كتل نصية. في الوقت الحالي، تقبل الأداة فقط ملفات PDF كمدخلات، لذلك سيتعين على المستخدمين تحويل أي تنسيق نص لديهم إلى PDF.

Meta NotebookLlama سير العمل
مصدر الصورة: ميتا

يستخدم NotebookLlama أولاً نموذج تعليمات Llama 3.2 1B لمعالجة ملف PDF مسبقًا وحفظه في ملف “.txt”. ثم يتم استخدام نموذج تعليمات Llama 3.1 70B لكتابة نص بودكاست باستخدام مجموعة البيانات المصدر. يتم بعد ذلك تحويل النسخ إلى مسرحية باستخدام أداة إعادة كتابة تستخدم نموذج تعليمات Llama 3.1 8B. وأخيرًا، يتم استخدام أداة مخصصة لإضافة النسخ في سير عمل تحويل النص إلى كلام. لهذا، يستخدم Meta أداة Parler TTS. يمكن للأفراد المهتمين الوصول إلى جميع النماذج المطلوبة لإنشاء ملفات podcast من قائمة GitHub هنا.

ومع ذلك، فإن نماذج الذكاء الاصطناعي المذكورة أعلاه هي مجرد توصيات من المطورين. يمكن للمستخدمين أن يفضلوا استخدام نماذج أصغر لكل خطوة، ومع ذلك، قد تختلف النتائج. أبرز ميتا أنه لتشغيل نظام الذكاء الاصطناعي في الإعداد الموصى به، سيحتاج المستخدمون إلى وحدة معالجة رسومات بذاكرة مجمعة تبلغ حوالي 140 جيجابايت.

مستخدم X (المعروف سابقًا باسم Twitter). نشر عينة من البودكاست الذي تم إنشاؤه. وبناءً على ذلك، يبدو أن جودة الصوت ليست بجودة Google NotebookLM، ويبدو حادًا وآليًا. علاوة على ذلك، هناك حالات يتم فيها تخطي أجزاء من الصوت وينتهي الأمر بمضيفي الذكاء الاصطناعي بالتحدث مع بعضهم البعض.

تعترف Meta ببعض المشكلات وتخطط لتحسينها في الإصدار التالي لمنتج الذكاء الاصطناعي. وسلطت الشركة الضوء على أن “نموذج TTS هو الحد من مدى طبيعية هذا الأمر. من المحتمل أن يتم تحسين هذا من خلال خط أنابيب أفضل وبمساعدة شخص أكثر دراية.

ويخطط عملاق التكنولوجيا أيضًا لاستخدام درجتين مختلفتين من ماجستير إدارة الأعمال لكتابة السيناريو، حيث سيناقش كل نموذج الآخر لجعل البودكاست يبدو أكثر حوارية. وهذا أيضًا جزء من خط الأنابيب المستقبلي للمطورين. بالإضافة إلى ذلك، تقوم الشركة أيضًا باختبار نموذج Llama 405B AI لكتابة النصوص بالإضافة إلى زيادة الدعم لمزيد من تنسيقات الإدخال والإخراج.

للحصول على أحدث الأخبار والمراجعات التقنية، تابع Gadgets 360 على X, فيسبوك, واتساب, المواضيع و أخبار جوجل. للحصول على أحدث مقاطع الفيديو حول الأدوات والتكنولوجيا، اشترك في قناتنا قناة يوتيوب. إذا كنت تريد أن تعرف كل شيء عن كبار المؤثرين، تابع موقعنا Who’sThat360 على انستغرام و يوتيوب.

من المتوقع أن يصل iPhone SE 4 مع شاشة LTPS OLED مقاس 6.06 بوصة وبطارية تبلغ 3279 مللي أمبير في الساعة ومودم داخلي من Apple


تم حظر مبيعات سلسلة iPhone 16 في إندونيسيا بسبب متطلبات الاستثمار غير الملباة



مصدر

LEAVE A REPLY

Please enter your comment!
Please enter your name here