بعد أيام قليلة من تقديم إمكانات Gemini للعالم، نموذجها اللغوي الرائع الجديد، أصدرت غوغل رسميًا إصدارًا جديدًا من Image، وهو نموذج تحويل النص إلى صورة الذي يسمح بإنشاء صور فوتوغرافية من أوصاف النص. اسمها Image 2، وقد وعدت الشركة بإحراز تقدم كبير في دقة النموذج وواقعيته وتعدد استخداماته.
تدعي الشركة في الإعلان أن Image 2 هي تقنية التصوير الأكثر تقدمًا حتى الآن. بالمقارنة مع الإصدار السابق من Imagen، فإن هذا قادر على توفير صور أكثر واقعية وعالية الجودة، بالإضافة إلى تحسين اتساق النتائج من مطالبات المستخدم بشكل كبير.يصل Image 2 للتنافس مع DALL-E 3، وهو الإصدار الأحدث من نموذج تحويل النص إلى صورة الخاص بـ Open AI. وتدعي شركة محرك البحث أنها أضافت أوصافًا إضافية للصور المستخدمة في مجموعة البيانات التي تم استخدامها لتدريب النموذج، حتى يتمكن من فهم الأنماط المختلفة ويكون أكثر دقة عند اتباع تعليمات المستخدم.
أثناء التدريب، ركزت غوغل أيضًا على تحسين بعض نقاط الضعف في Image (ونماذج أخرى من هذا النوع)، مثل عرض الصور أو الأسنان أو الوجوه البشرية أو الميزات الأخرى التي غالبًا ما يواجه الذكاء الاصطناعي مشكلات فيها.
وبالمثل، أصبحت Image 2 الآن قادرة على إدراج نص قابل للقراءة في الصور، بالإضافة إلى القيام بعمل أفضل في إنشاء شعارات أو أيقونات للعلامات التجارية. وأولئك الذين يتطلعون إلى الحفاظ على الاتساق بين الصور المختلفة التي تم إنشاؤها باستخدام Image 2 سيكون لديهم القدرة على الجمع بين المطالبات النصية والصور المدخلة "لإجبار" النموذج على إنشاء صور بنفس النمط.لكن قدرات Image 2 تتجاوز مجرد إنشاء صور بواسطة الذكاء الاصطناعي . وتوضح غوغل أن الإصدار الجديد من نموذجها يمكن استخدامه أيضًا لتحرير الصور الفوتوغرافية، على سبيل المثال إضافة محتوى إلى الصور الموجودة أو توسيعها لتحتل مساحة أكبر.
الصورة 2 متاحة الآن بشكل عام لعملاء Vertex AI الذين لديهم إمكانية الوصول إلى الإصدار السابق من الأداة.- إقرأ أيضا أفضل 4 تطبيقات أندرويد و أفضل 4 مواقع ويب تتيح لك إنشاء صور بواسطة الذكاء الاصطناعي مجانًا
ليست هناك تعليقات:
إرسال تعليق