Home تكنولوجيا Gemini AI Agent Gems، وإمكانيات إنشاء الصور Imagen 3 يتم طرحها للمستخدمين

تكنولوجيا

Gemini AI Agent Gems، وإمكانيات إنشاء الصور Imagen 3 يتم طرحها للمستخدمين

27 September 2024

أعلنت شركة جوجل يوم الأربعاء أن تطبيقات Gemini ستحصل على إمكانيتين متقدمتين جديدتين. سوف يتلقى برنامج الدردشة الآلي الخاص بالذكاء الاصطناعي (AI) التابع لشركة ماونتن فيو، ومقره ماونتن فيو، وكيل الذكاء الاصطناعي Gems وقدرات توليد الصور لنموذج Imagen 3 AI الذي تم إصداره مؤخرًا. في حين أن الأول سيكون متاحًا فقط لمستخدمي Gemini المدفوعين، فسيتم شحن الأخير إلى جميع المستخدمين، بما في ذلك المستخدمين الموجودين في الطبقة المجانية. ومع ذلك، قد يرى أولئك الذين يستخدمون الإصدار المجاني بعض القيود الإضافية على إنشاء الصور.

برج الجوزاء يحصل على الجواهر، وقدرات Imagen 3

أعلنت Google عن دمج Gems وImagen 3 في تطبيقات Gemini في إحدى المدونات بريد. تمت معاينة كلتا الميزتين لأول مرة في Google I/O في وقت سابق من هذا العام. والجدير بالذكر أن الأحجار الكريمة قد تم طرحها بالفعل وستكون متاحة لمستخدمي Gemini Advanced وBusiness وEnterprise. وقالت الشركة إن ميزات Imagen 3 سيتم شحنها في الأيام المقبلة لمستخدمي Gemini وGemini Advanced وBusiness وEnterprise.

الأحجار الكريمة هي في الأساس إصدارات مصغرة من برنامج الدردشة الآلي مع مجموعة بيانات محدودة. ويمكن تخصيصها للتركيز على مجموعة محددة من المواضيع، مما يمكّن نموذج الذكاء الاصطناعي من توليد معلومات أكثر تحديدًا ودقة. وقالت جوجل: “باستخدام Gems، يمكنك إنشاء فريق من الخبراء لمساعدتك في التفكير في مشروع مليء بالتحديات، أو تبادل الأفكار لحدث قادم، أو كتابة التسمية التوضيحية المثالية لمنشور على وسائل التواصل الاجتماعي”.

يمكن للمستخدمين أيضًا إضافة تعليمات محددة إلى الجوهرة لتحسين الاستجابات بشكل أكبر. بمجرد توفر الميزة للمستخدمين، سيجدون أيضًا مجموعة من الجواهر المعدة مسبقًا والتي أنشأتها جوجل. ويشمل ذلك مدرب التعلم، والعصف الذهني، والدليل الوظيفي، ومحرر الكتابة، وشريك البرمجة. ستكون الأحجار الكريمة متاحة بلغات متعددة على أجهزة سطح المكتب والأجهزة المحمولة في أكثر من 150 دولة.

يتم أيضًا طرح Imagen 3، أحدث أدوات الذكاء الاصطناعي لإنشاء الصور في الشركة، على تطبيقات Gemini. يمكنه إنشاء صور بأنماط مختلفة، مثل Nikon DSLR ونمط GoPro والعدسة ذات الزاوية الواسعة والمزيد. وتقول Google إنها تستطيع أيضًا إنشاء “مناظر طبيعية واقعية، أو لوحات زيتية مزخرفة، أو مشاهد طينية غريبة الأطوار”.

إحدى التحسينات المهمة في Imagen 3 هي أن نموذج الذكاء الاصطناعي سيسمح للمستخدمين أيضًا بإنشاء صور للأشخاص، وهو أمر تمت إزالته بعد أن لاحظ العديد من المستخدمين أن Gemini كان ينشئ صورًا متحيزة وضارة تتضمن أشخاصًا. وللحد من مخاطر التزييف العميق، تقول الشركة إنها أضافت وسائل حماية مدمجة. علاوة على ذلك، تم استخدام SynthID لوضع علامة مائية على الصور التي تم إنشاؤها بواسطة الذكاء الاصطناعي.

على الرغم من أن الشركة لم تحدد ذلك، فقد ألمحت إلى أن إمكانيات Imagen 3 قد تتضمن أيضًا التحرير المضمن للصور التي تم إنشاؤها. ومع ذلك، يبدو أنه لا يمكن إجراء التحرير إلا باستخدام المطالبات النصية. والجدير بالذكر أن Google تقول إن Imagen 3 لن “يدعم إنشاء صور واقعية أو أفراد يمكن التعرف عليهم أو تصوير قاصرين أو مشاهد دموية أو عنيفة أو جنسية مفرطة”.

مصدر