أوبن إيه آي تُحدث نقلة نوعية في توليد الصور بالذكاء الاصطناعي

3 دقيقة للقراءة

المنارة: متابعات

في خطوة جديدة تعزز حضور الذكاء الاصطناعي في عالم الإبداع الرقمي، أعلنت شركة أوبن إيه آي (OpenAI) إطلاق نموذجها الأحدث لتوليد الصور عالية الدقة تحت اسم GPT-Image 1.5. ويُعد هذا النموذج تطورًا مهمًا في فهم الأوامر النصية ودقة التفاصيل البصرية. كما يوفر سرعة تنفيذ أعلى مقارنة بالإصدارات السابقة.

تحول واضح في تجربة إنشاء الصور

يأتي النموذج الجديد ليؤكد تحول “شات جي بي تي” من أداة تعتمد على النصوص فقط إلى منصة توليدية متكاملة. إذ أصبح قادرًا على استدعاء الأدوات المناسبة تلقائيًا حسب احتياجات المستخدم. وفي هذا السياق، أوضحت فيدجي سيمو، الرئيسة التنفيذية لتطبيقات OpenAI، أن هذه الخطوة تندرج ضمن رؤية أشمل لدعم الإبداع الرقمي وتسهيل عملياته.

سرعة أعلى وجودة أدق

وبحسب الشركة، يوفر GPT-Image 1.5 سرعة توليد تصل إلى أربعة أضعاف مقارنة بالإصدار السابق. في الوقت نفسه، تحسنت جودة الصور النهائية بشكل ملحوظ. إضافة إلى ذلك، أصبح النموذج متاحًا لجميع مستخدمي ChatGPT، وكذلك للمطورين عبر واجهة البرمجة (API)، ما يوسع مجالات استخدامه.

تحرير الصور بذكاء متقدم

ولا يقتصر دور النموذج على إنشاء الصور فقط. بل يمتد ليشمل تحريرها بذكاء متقدم. إذ يمكنه إجراء تعديلات دقيقة دون التأثير على باقي عناصر الصورة. علاوة على ذلك، يحافظ على اتساق الإضاءة والتكوين والوجوه، مع دعم الإضافة والحذف والدمج ونقل العناصر داخل المشهد.

مميزات تقنية تعزز الاستخدام

وأوضحت OpenAI أن النموذج الجديد يقدم مجموعة من الخصائص المهمة، أبرزها سرعة أعلى في إنشاء الصور، وفهم أدق للتعليمات المعقدة. كما يحافظ على التفاصيل الثابتة مثل الوجوه والأسلوب البصري. إلى جانب ذلك، يقدم نتائج أكثر ترتيبًا وثراءً، مع تحسن واضح في الإضاءة والخامات الدقيقة. لذلك، يناسب مجالات التصميم والتسويق والرسوم التوضيحية وواجهات المستخدم ووسائل التواصل الاجتماعي.

التزام أكبر بالأوامر النصية

ومن جهة أخرى، أظهر GPT-Image 1.5 التزامًا أعلى بالتوجيهات النصية التفصيلية. فقد نجح في اختبارات تتطلب ترتيب عدد كبير من العناصر داخل مساحات محددة بدقة. كذلك، تحسنت قدرته على إدراج النصوص داخل الصور، بما يشمل النصوص الصغيرة والجداول المختصرة والإنفوجرافيك.

تحديات مستمرة قيد التطوير

ورغم هذا التقدم، أقرت OpenAI بوجود بعض التحديات. وتشمل هذه التحديات التعامل مع النصوص الطويلة أو الخطوط غير الشائعة. كما يواجه النموذج صعوبة نسبية مع الصور التي تضم عددًا كبيرًا من الوجوه أو محتوى متعدد اللغات. ومع ذلك، أكدت الشركة أن العمل مستمر لمعالجة هذه الجوانب في الإصدارات القادمة.

📎 رابط مختصر للمقال: https://almanara.media/?p=33499
شارك هذه المقالة