DALL-E (اختصار لـ "Deep-Learning-to-Answer-Long-Questions") هو نموذج لمعالجة اللغة الطبيعية تم تطويره بواسطة OpenAI للإجابة على أسئلة حول صورة ما. يتم تدريب النظام على ملايين الصور الموجودة على مجموعات بيانات الإنترنت ويستخدم نموذج لغة المحولات لتحديد الكلمات المرتبطة بصورة معينة. يمكنه إنشاء تعليق لصورة يصف محتوياتها باللغة الطبيعية.

تم إصدار DALL-E بواسطة OpenAI في ديسمبر 2020. وهو نموذج لغوي قوي لأنه يمكنه التعامل مع مرحلة فهم اللغة الطبيعية ومرحلة إنشاء المهمة. ويستخدم مزيجًا من خوارزميات رؤية الكمبيوتر وتقنيات معالجة اللغة الطبيعية للجمع بين مصادر متعددة للمعلومات في وصف واحد متماسك.

على سبيل المثال، إذا كانت الصورة تحتوي على غرفة بها أشخاص وكلب، فيمكن لـ DALL-E إنشاء تعليق مثل، "هناك العديد من الأشخاص في الغرفة يداعبون كلبًا بني اللون." يتجاوز هذا النوع من الوصف العلامات الأساسية، والتي قد تقول ببساطة: "هذه غرفة بها أشخاص وكلب".

باستخدام DALL-E، يمكن للباحثين إنشاء تسميات توضيحية لوصف الصور بالتفصيل، مما يساعد على إنشاء وصف أكثر دقة من التقنيات التقليدية لوضع علامات على الصور. ويمكن استخدامه أيضًا للإجابة على أسئلة حول صورة ما، مثل ما لون الكلب الموجود في الصورة؟

يستطيع النظام أيضًا إنشاء تعليقات أكثر إبداعًا، مثل "الكلب ينظر من النافذة، ويحلم بالسيطرة على العالم" أو "الأشخاص الموجودون في الغرفة يتبادلون نظرات ذات معنى بينما يجلس الكلب في الزاوية". يوضح هذا قدرة النظام على وصف الصور بطرق يمكن للبشر تقديرها.

DALL-E هي تقنية مثيرة وقوية لديها القدرة على إحداث ثورة في معالجة اللغات الطبيعية. إنها أداة مهمة في تطوير رؤية الكمبيوتر وتقنيات معالجة اللغة الطبيعية.

اختر وشراء الوكيل

وكلاء مركز البيانات

وكلاء الدورية

وكلاء UDP

موثوق به من قبل أكثر من 10000 عميل حول العالم

العميل الوكيل
العميل الوكيل
وكيل العميلflowch.ai
العميل الوكيل
العميل الوكيل
العميل الوكيل