Meta Announces New Image Generation AI Model
ميتا تعلن عن إطلاق نموذج ذكاء اصطناعي جديد لتوليد الصور قريبا
QNA
Washington: Meta has announced a new generative AI model that aims at achieving a state-of-the-art performance for text-to-image generation, a company statement stated on Friday.
The unveiling happens at a time when AI-powered image generators have become very popular and accessible. At present, every major company and emerging startups use it for their daily operations.
At present, AI-based image generators like DALL-E2, Google’s Imagen and Stable Diffusion rely on a process called diffusion for art creation, where the respective AI model learns by gradually subtracting noise from an image, thereby working efficiently on the prompts given.
However, the process of diffusion is intensive, expensive and time-taking, whereas CM3leon relies on a mechanism called attention that takes more importance to the input prompt, which can be a text or an image. In comparison, CM3Leon is expected to be more efficient and requires less computation and a smaller dataset compared to other models.
قنا
واشنطن: أعلنت شركة /ميتا/ عن إطلاق نموذج جديد للذكاء الاصطناعي /CM3Leon/ قريبا، يعد من أفضل نموذج في فئته لتوليد الصور استنادًا إلى الأوامر النصية.
وقالت الشركة عبر مدونتها الرسمية: “يتميز هذا النموذج بأدائه ذي الحالة الفنية المتطورة لتوليد صور أكثر اتساقا مع الأوامر النصية، إذ إنه أكثر كفاءة، ويتطلب حوسبة أقل بخمس مرات، ومجموعة بيانات أصغر للتدرب مقارنةً بالنماذج الأخرى”.
وأضافت الشركة أنه يمكن لأدوات توليد الصور إنتاج صور أكثر اتساقا وفقا للإرشادات النصية المدخلة، ونحن نعتقد أن الأداء القوي للنموذج عبر مجموعة متنوعة من المهام يمثل خطوة نحو تحسين جودة توليد الصور وفهمها.
وينفرد نموذج /CM3Leon/ بقدرته على توليد وصف للصور، مما يمهد الطريق لنماذج فهم الصور ذات القدرات الأكبر في المستقبل، ويمكن استخدامه في مجموعة واسعة من التطبيقات مثل الواقع الافتراضي والواقع المعزز والروبوتات والإعلان والتسويق.
ولم تحدد ميتا موعد إصدار نموذج /CM3Leon/ أو ما إذا كانت تنوي إطلاقه كاملًا للجمهور، ومن المتوقع أن تكشف ميتا المزيد من التفاصيل حول النموذج في وقت لاحق.
يذكر أن معظم مولدات الصور التي تعمل بالذكاء الاصطناعي تعتمد على تقنية تُعرف باسم /الانتشار Diffusion/ وهي تقنية تتطلب حوسبة أكبر فضلا عن كونها بطيئة ومكلفة لتشغيلها.