ചാറ്റ്ജിപിടി പോലുള്ള ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് (Artificial Intelligence) ചാറ്റ്ബോട്ടുകൾ ലോകം കീഴടക്കിയെന്നായിരുന്നു കുറച്ചുകാലം മുൻപ് വരെയുള്ള നമ്മുടെ ധാരണ. എന്നാൽ കാര്യങ്ങൾ മാറിമറിയുകയാണ്. മൊബൈൽ ആപ്പ് ലോകത്തെ പുതിയ താരം സംസാരശേഷിയുള്ള എഐ അല്ല, മറിച്ച് മനോഹരമായ ചിത്രങ്ങൾ വരയ്ക്കുന്ന എഐ ആണ്. പുതിയ കണക്കുകൾ പ്രകാരം, ചാറ്റ്ബോട്ടുകളിലെ പരിഷ്കാരങ്ങളേക്കാൾ എത്രയോ മടങ്ങ് അധികം ഡൗൺലോഡുകളാണ് പുതിയ എഐ ഇമേജ് മോഡലുകൾ ആപ്പുകൾക്ക് നേടിക്കൊടുക്കുന്നത്.
ആപ്പ് ലോകത്തെ കണക്കുകൾ പുറത്തുവിടുന്ന പ്രമുഖ സ്ഥാപനമായ ആപ്പ്ഫിഗേഴ്സിന്റെ (Appfigures) പുതിയ റിപ്പോർട്ട് ഒരു പുതിയ പ്രവണതയിലേക്കാണ് വിരൽ ചൂണ്ടുന്നത്. ഒരു സാധാരണ എഐ മോഡൽ അപ്ഡേറ്റ് ഒരു ആപ്പിന് നൽകുന്നതിനേക്കാൾ 6.5 മടങ്ങ് അധികം ഡൗൺലോഡുകളാണ് ഒരു പുതിയ ഇമേജ് മോഡൽ പുറത്തിറങ്ങുമ്പോൾ ലഭിക്കുന്നത്. ഇത് ടെക് ലോകത്ത് ഒരു വലിയ മാറ്റത്തിന്റെ സൂചനയാണ് നൽകുന്നത്.
സംസാരത്തിൽ നിന്ന് കാഴ്ചയിലേക്ക്; എഐ ലോകത്തെ മാറ്റം
ഒരുകാലത്ത്, ചാറ്റ്ജിപിടിയുടെ പുതിയ പതിപ്പുകൾ വരുമ്പോഴോ അല്ലെങ്കിൽ പുതിയ വോയിസ് ചാറ്റ് സൗകര്യങ്ങൾ വരുമ്പോഴോ ആയിരുന്നു ആളുകൾ ആപ്പുകൾ ഡൗൺലോഡ് ചെയ്യാൻ തിടുക്കം കാട്ടിയിരുന്നത്. എന്നാൽ ആ കാലം കഴിഞ്ഞു. ഇപ്പോൾ ആളുകൾക്ക് വേണ്ടത് ടെക്സ്റ്റുകളല്ല, മറിച്ച് അവരുടെ ഭാവനയ്ക്കനുസരിച്ച് ചിത്രങ്ങളും ദൃശ്യങ്ങളും ഉണ്ടാക്കി നൽകുന്ന സാങ്കേതികവിദ്യയാണ്. ഈ മാറ്റം ശരിക്കും മുതലെടുക്കുന്നത് ഗൂഗിളും ഓപ്പൺഎഐയും പോലുള്ള വമ്പന്മാരാണ്.
ചാറ്റ്ജിപിടിയും ഗൂഗിളിന്റെ ജെമിനിയും തങ്ങളുടെ ഇമേജ് മോഡലുകൾ അവതരിപ്പിച്ചപ്പോൾ ദശലക്ഷക്കണക്കിന് പുതിയ ഉപയോക്താക്കളെയാണ് നേടിയെടുത്തത്. കണക്കുകൾ പറയുന്നത് ഒരു അമ്പരപ്പിക്കുന്ന കഥയാണ്.
ജെമിനിയുടെ കുതിപ്പ്
ഗൂഗിളിന്റെ ജെമിനി (Gemini) ആപ്പ്, അതിന്റെ പുതിയ ഇമേജ് മോഡലായ ‘നാനോ ബനാന’ അവതരിപ്പിച്ചതിന് ശേഷമുള്ള 28 ദിവസത്തിനുള്ളിൽ നേടിയത് 2.2 കോടിയിലധികം പുതിയ ഡൗൺലോഡുകളാണ്. ഇത് മുൻപുള്ള ഡൗൺലോഡുകളേക്കാൾ നാലിരട്ടി വർധനവായിരുന്നു. ആളുകൾക്ക് ചിത്രങ്ങൾ നിർമ്മിക്കാനുള്ള സൗകര്യം ലഭിച്ചപ്പോൾ ജെമിനി ആപ്പ് ഡൗൺലോഡ് ചെയ്യാൻ ഒരു പ്രത്യേക താൽപ്പര്യം കാണിച്ചു തുടങ്ങി.
ചാറ്റ്ജിപിടിയുടെ തന്ത്രം ഫലിക്കുന്നു
ഓപ്പൺഎഐയുടെ ചാറ്റ്ജിപിടിയും ഒട്ടും പിന്നിലായിരുന്നില്ല. അവരുടെ ഏറ്റവും പുതിയ GPT-4o ഇമേജ് മോഡൽ പുറത്തിറങ്ങിയതിന് ശേഷമുള്ള 28 ദിവസത്തിനുള്ളിൽ 1.2 കോടിയിലധികം പുതിയ ഇൻസ്റ്റാളുകളാണ് ആപ്പിന് ലഭിച്ചത്. ഇത് അവരുടെ മുൻപത്തെ ടെക്സ്റ്റ് അധിഷ്ഠിത മോഡലുകളായ GPT-4, GPT-4.5 എന്നിവയുടെ അപ്ഡേറ്റുകൾക്ക് ലഭിച്ചതിനേക്കാൾ 4.5 മടങ്ങ് കൂടുതലാണ്. ചാറ്റ്ബോട്ടുകളുടെ രാജാവിന് പോലും ഇപ്പോൾ വളർച്ചയ്ക്ക് എഐ ഇമേജ് മോഡലുകൾ ആവശ്യമായി വരുന്നു എന്നത് ശ്രദ്ധേയമാണ്.
ഡൗൺലോഡുകൾ പണമാകുമോ? ഇതാണ് യഥാർത്ഥ ചോദ്യം
പുതിയ ഫീച്ചറുകൾ വരുമ്പോൾ ആളുകൾ ആപ്പുകൾ ഡൗൺലോഡ് ചെയ്യുന്നത് സ്വാഭാവികമാണ്. എന്നാൽ ഈ താൽക്കാലിക ആവേശം കമ്പനികൾക്ക് വരുമാനമായി മാറുന്നുണ്ടോ? ഇവിടെയാണ് കഥയിൽ ഒരു ട്വിസ്റ്റ് വരുന്നത്.
ആപ്പ്ഫിഗേഴ്സ് റിപ്പോർട്ട് പ്രകാരം, ഡൗൺലോഡുകളിലെ ഈ കുതിച്ചുചാട്ടം എല്ലായ്പ്പോഴും വരുമാനമായി മാറുന്നില്ല. ജെമിനിയുടെ കാര്യം തന്നെയെടുക്കാം. 2.2 കോടി പുതിയ ഡൗൺലോഡുകൾ ലഭിച്ചെങ്കിലും, ആ 28 ദിവസത്തിനുള്ളിൽ ആപ്പിൽ നിന്ന് ലഭിച്ച അധിക വരുമാനം ഏകദേശം 1.81 ലക്ഷം ഡോളർ മാത്രമായിരുന്നു. ഇത് ഡൗൺലോഡുകളുടെ എണ്ണവുമായി താരതമ്യം ചെയ്യുമ്പോൾ വളരെ തുച്ഛമാണ്.
മെറ്റയുടെ എഐയുടെ കാര്യവും വ്യത്യസ്തമല്ല. അവരുടെ പുതിയ വീഡിയോ ഫീഡായ ‘വൈബ്സ്’ (Vibes) അവതരിപ്പിച്ചപ്പോൾ 26 ലക്ഷം പുതിയ ഡൗൺലോഡുകൾ ലഭിച്ചു. എന്നാൽ വരുമാനത്തിൽ കാര്യമായ ഒരു ചലനവും സൃഷ്ടിക്കാൻ അതിന് കഴിഞ്ഞില്ല.
എന്നാൽ ഈ കൂട്ടത്തിൽ ഒരാൾ മാത്രം വിജയിച്ചു, അത് ചാറ്റ്ജിപിടിയാണ്.
ഓപ്പൺഎഐയുടെ GPT-4o ഇമേജ് മോഡൽ അവതരിപ്പിച്ചതിന് ശേഷം ലഭിച്ച അധിക ശ്രദ്ധയെ അവർ പണമാക്കി മാറ്റി. ആ 28 ദിവസത്തിനുള്ളിൽ ഏകദേശം 7 കോടി ഡോളറിന്റെ അധിക വരുമാനമാണ് ഉപഭോക്താക്കളിൽ നിന്ന് ചാറ്റ്ജിപിടിക്ക് നേടാനായത്. ഇത് വ്യക്തമാക്കുന്നത്, ആളുകളെ ആപ്പിലേക്ക് ആകർഷിക്കാൻ മാത്രമല്ല, അവരെ പണം നൽകി സബ്സ്ക്രൈബ് ചെയ്യിക്കാനും ഓപ്പൺഎഐക്ക് കഴിയുന്നുണ്ട് എന്നതാണ്.
എന്തുകൊണ്ട് ചിത്രങ്ങൾക്ക് ഇത്ര പ്രിയം?
എന്തുകൊണ്ടാണ് ടെക്സ്റ്റ് അപ്ഡേറ്റുകളേക്കാൾ ഇമേജ് മോഡലുകൾക്ക് ഇത്രയധികം സ്വീകാര്യത ലഭിക്കുന്നത്? അതിന് പല കാരണങ്ങളുണ്ട്:
- ദൃശ്യപരമായ ആകർഷണം: ഒരു ആശയം വാക്കുകളിൽ വിവരിക്കുന്നതിനേക്കാൾ എളുപ്പത്തിൽ ഒരു ചിത്രം കൊണ്ട് കാണിക്കാൻ സാധിക്കും. ഇത് ആളുകൾക്ക് പെട്ടെന്ന് മനസ്സിലാക്കാനും പങ്കുവെക്കാനും എളുപ്പമാണ്.
- സോഷ്യൽ മീഡിയ സ്വാധീനം: നമ്മുടെ നാട്ടിലടക്കം, ഇൻസ്റ്റാഗ്രാം, ഫേസ്ബുക്ക് തുടങ്ങിയ സോഷ്യൽ മീഡിയ പ്ലാറ്റ്ഫോമുകളിൽ പങ്കുവെക്കാൻ độc đáo ആയ ചിത്രങ്ങൾ നിർമ്മിക്കാൻ യുവാക്കൾ ഇത്തരം ടൂളുകൾ വ്യാപകമായി ഉപയോഗിക്കുന്നു.
- കൗതുകം: “സൂര്യൻ ചുവന്ന നിറത്തിൽ ഉദിക്കുന്ന കേരളത്തിലെ കായൽ” എന്ന് പറഞ്ഞാൽ അതുപോലൊരു ചിത്രം നിമിഷങ്ങൾക്കുള്ളിൽ നിർമ്മിച്ചു നൽകുന്ന സാങ്കേതികവിദ്യ ഏതൊരാളിലും കൗതുകമുണർത്തും. ഈ കൗതുകമാണ് പലരെയും ആപ്പ് ഡൗൺലോഡ് ചെയ്യാൻ പ്രേരിപ്പിക്കുന്നത്.
ഡീപ്പ്സീക്ക് (DeepSeek) എന്ന മറ്റൊരു എഐയുടെ കാര്യവും റിപ്പോർട്ടിൽ പരാമർശിക്കുന്നുണ്ടെങ്കിലും, അത് ഈ പ്രവണതയ്ക്ക് ഒരു അപവാദമായിരുന്നു. അവരുടെ R1 മോഡൽ അവതരിപ്പിച്ചപ്പോൾ 2.8 കോടി ഡൗൺലോഡുകൾ ലഭിച്ചു. എന്നാൽ അത് ഒരു ഇമേജ് മോഡൽ ആയതുകൊണ്ടായിരുന്നില്ല. മറിച്ച്, കുറഞ്ഞ ചെലവിൽ എങ്ങനെ എഐ മോഡലുകളെ പരിശീലിപ്പിക്കാം എന്ന അവരുടെ പുതിയ രീതിയെക്കുറിച്ചുള്ള സാങ്കേതിക ലോകത്തെ കൗതുകമായിരുന്നു ആ ഡൗൺലോഡ് കുതിപ്പിന് പിന്നിൽ.
മുന്നോട്ടുള്ള വഴി: കാഴ്ചയുടെ ഭാവി
ഈ കണക്കുകൾ നൽകുന്ന സൂചന വ്യക്തമാണ്. എഐ ആപ്പുകളുടെ വളർച്ചയുടെ അടുത്ത ഘട്ടം നയിക്കുന്നത് ദൃശ്യപരമായ കഴിവുകളായിരിക്കും. ചാറ്റ്ബോട്ടുകൾ അപ്രസക്തമാകുന്നു എന്നല്ല ഇതിനർത്ഥം. അവ ഇപ്പോഴും എഐ ലോകത്തിന്റെ നട്ടെല്ലാണ്. എന്നാൽ ഒരു സാധാരണ ഉപഭോക്താവിനെ ആപ്പിലേക്ക് ആകർഷിക്കാനുള്ള ഏറ്റവും വലിയ ‘ചൂണ്ട’ ഇപ്പോൾ മികച്ച എഐ ഇമേജ് മോഡലുകൾ ആണ്.
വരും നാളുകളിൽ, ചിത്രങ്ങളിൽ നിന്ന് വീഡിയോകളിലേക്കും 3D മോഡലുകളിലേക്കും ഈ പ്രവണത മാറുന്നത് നമുക്ക് കാണാൻ സാധിക്കും. ഉപയോക്താക്കളുടെ ഭാവനയെ എത്രത്തോളം ദൃശ്യവൽക്കരിക്കാൻ ഒരു ആപ്പിന് കഴിയുന്നുവോ, അത്രത്തോളം അത് വിജയിക്കും. എന്നാൽ ആത്യന്തികമായി, ഡൗൺലോഡുകളുടെ എണ്ണത്തിൽ മാത്രം ശ്രദ്ധിക്കാതെ, ഉപയോക്താക്കൾക്ക് യഥാർത്ഥ മൂല്യം നൽകി അവരെ പണം നൽകുന്ന വരിക്കാരാക്കി മാറ്റുന്നതിലായിരിക്കും കമ്പനികളുടെ യഥാർത്ഥ വിജയം.



