ഓപ്പൺ AI സൃഷ്ടിച്ച ഏറ്റവും പുതിയ ന്യൂറൽ നെറ്റ് ആർക്കിടെക്ചറാണ് DALL-E 2. ടെക്സ്റ്റിൽ നിന്ന് ചിത്രങ്ങൾ സൃഷ്ടിക്കാൻ രൂപകൽപ്പന ചെയ്ത വിപ്ലവകരമായ വാസ്തുവിദ്യയാണിത്. 2020-ൽ വികസിപ്പിച്ച API-കളെ അടിസ്ഥാനമാക്കിയുള്ളതാണ് DALL-E 2, കൂടാതെ നാച്ചുറൽ ലാംഗ്വേജ് പ്രോസസ്സിംഗിൽ (NLP) മാത്രം പ്രവർത്തിക്കുന്നു.
വാസ്തുവിദ്യയിൽ വിവിധ മൊഡ്യൂളുകൾ അടങ്ങിയിരിക്കുന്നു, അവ പരസ്പരം ബന്ധപ്പെട്ടിരിക്കുന്നു. നൽകിയിരിക്കുന്ന ഇൻപുട്ട് ടെക്സ്റ്റിൽ നിന്ന് ആദ്യം ടോക്കണുകളുടെ ഒരു ശ്രേണി സൃഷ്ടിച്ചുകൊണ്ട് ഇത് പ്രവർത്തിക്കുന്നു, തുടർന്ന് സൃഷ്ടിച്ച ശ്രേണിയിൽ മൾട്ടി-ഹെഡ് ശ്രദ്ധ ചെലുത്തുന്നു. ഇത് ട്രാൻസ്ഫോർമർ, ലീനിയർ ലെയർ, അഡാപ്റ്റീവ് എംബഡിംഗ് മോഡലുകളുടെ സംയോജനമാണ് ഉപയോഗിക്കുന്നത്.
വാചക വിവരണങ്ങളിൽ നിന്ന് വളരെ ഉയർന്ന മിഴിവുള്ള ചിത്രങ്ങൾ സൃഷ്ടിക്കാൻ DALL-E 2-ന് കഴിയും. ടെക്സ്റ്റ് 2 ഇമേജ് സിന്തസിസിനായുള്ള ആദ്യത്തെ ആഴത്തിലുള്ള പഠന സംവിധാനമാണിത്, യഥാർത്ഥ ചിത്രങ്ങളിൽ നിന്ന് വേർതിരിച്ചറിയാൻ കഴിയാത്ത ഇമേജുകൾ സൃഷ്ടിക്കാൻ കഴിയും.
DALL-E 2 ന്, കസേരകൾ, മൃഗങ്ങൾ അല്ലെങ്കിൽ ഉപകരണങ്ങൾ പോലുള്ള ടെക്സ്റ്റിൽ നിന്ന് 3D ഒബ്ജക്റ്റുകൾ സൃഷ്ടിക്കാനും കഴിയും. ഈ ടാസ്ക്കിന് കൂടുതൽ സങ്കീർണ്ണമായ ഘടനയുള്ള സങ്കീർണ്ണമായ ഡാറ്റാസെറ്റുകൾ ആവശ്യമാണ്, അതിനാൽ മറ്റ് ആർക്കിടെക്ചറുകൾക്ക് DALL-E 2 പോലെ കൃത്യമായ ഫലങ്ങൾ സൃഷ്ടിക്കുന്നത് ബുദ്ധിമുട്ടാണ്.
DALL-E 2 ഉപയോഗിക്കുന്നത് വളരെ ലളിതമാണ്. "ചെറിയ മൂക്കും വലിയ കറുത്ത മൂക്കും ഉള്ള തവിട്ടുനിറത്തിലുള്ള വെളുത്ത നായ" പോലെയുള്ള ആവശ്യമുള്ള ചിത്രത്തിന്റെ ഒരു വാചക വിവരണം മാത്രമേ ആവശ്യമുള്ളൂ. ആർക്കിടെക്ചർ ഈ വിവരണം എടുക്കുകയും ടെക്സ്റ്റിൽ വിവരിച്ചിരിക്കുന്നതുമായി സാമ്യമുള്ള ഒരു ചിത്രം സൃഷ്ടിക്കുകയും ചെയ്യും.
ക്രിയേറ്റീവ് ഉള്ളടക്ക സൃഷ്ടിയുടെ ലോകത്ത് വിപ്ലവം സൃഷ്ടിക്കാൻ കഴിയുന്ന ഒരു ശക്തമായ ഉപകരണമാണ് DALL-E 2. സാധ്യതയുള്ള ആപ്ലിക്കേഷനുകൾ ജനറേറ്റീവ് ആർട്ട് സൃഷ്ടിക്കുന്നത് മുതൽ ഉപയോക്തൃ ഇന്റർഫേസുകൾ വേഗത്തിൽ സൃഷ്ടിക്കുന്നത് വരെ, ഉൽപ്പന്ന എഞ്ചിനീയറിംഗിനെ സഹായിക്കുന്നു. ക്രിയേറ്റീവ് പരസ്യം അല്ലെങ്കിൽ മാർക്കറ്റിംഗ് ഉള്ളടക്കം സൃഷ്ടിക്കുന്നതിനും അതുപോലെ കഥപറച്ചിലിനും വെർച്വൽ ലോകാനുഭവങ്ങൾക്കും ഇത് ഉപയോഗിക്കാം.