top of page

ആർട്ടിഫിഷ്യൽ ഇൻ്റലിജൻസ് (AI) : നിർമിത ബുദ്ധിയുടെ വൈവിധ്യങ്ങളും ഭാവിയും

ശാസ്ത്രമലയാളം

രാജേശ്വരി ബി

അസിസ്റ്റൻ്റ്  പ്രൊഫസർ

ഗണിത ശാസ്ത്ര വിഭാഗം

സർക്കാർ വനിത കോളേജ്, തിരുവനന്തപുരം

 


 സംഗ്രഹം:

 

ഇന്ന് നമ്മൾ ജീവിക്കുന്നത് തിരക്കേറിയ ലോകത്താണ്, അവിടെ ആർട്ടിഫിഷ്യൽ ഇൻ്റലിജൻസ് എന്ന് വിളിക്കപ്പെടുന്ന സ്മാർട്ട് മെഷീനുകൾ, അല്ലെങ്കിൽ ചുരുക്കത്തിൽ AI, കാര്യങ്ങൾ വേഗത്തിൽ ചെയ്യാനും പുതിയ ആശയങ്ങൾ കൊണ്ടുവരാനും സഹായിക്കുന്നു. AI വളരെ വേഗത്തിൽ നമ്മുടെ ജീവിതത്തിൽ വലിയ മാറ്റങ്ങൾ വരുത്തുന്നു!വ്യത്യസ്ത രീതികളിൽ ചിന്തിക്കാനും പഠിക്കാനും കഴിയുന്ന വ്യത്യസ്ത തരം റോബോട്ടുകളും കമ്പ്യൂട്ടറുകളും ഉണ്ട്.ഒരു ഗെയിം കളിക്കുന്നതോ ചോദ്യങ്ങൾക്ക് ഉത്തരം നൽകുന്നതോ പോലെ ഒരു പ്രത്യേക കാര്യം ചെയ്യുന്നതിൽ ശരിക്കും മിടുക്കരാണ് അവർ . കാര്യങ്ങൾ എങ്ങനെ ബന്ധിപ്പിച്ചിരിക്കുന്നു, സാധ്യതകൾ എങ്ങനെ മനസ്സിലാക്കാം തുടങ്ങിയ AI-യെ സഹായിക്കുന്ന ചില ഗണിത ആശയങ്ങളും ഇതിൽ വിശദീകരിക്കുന്നു. ഓപ്പൺഎഐയുടെ AI മോഡലുകൾ GPT-2-ൽ നിന്ന് GPT-4o-ലേക്ക് എങ്ങനെ മെച്ചപ്പെട്ടു എന്നും ഈ ലേഖനത്തിൽ വിവരിക്കുന്നു. സംഭാഷണങ്ങൾ നടത്തുന്നതിനും വ്യത്യസ്ത തരത്തിലുള്ള വിവരങ്ങൾ മനസ്സിലാക്കുന്നതിനും അവരെ മികച്ചതാക്കുന്നു. അവസാനമായി, AI എത്ര വേഗത്തിൽ വളരുന്നുവെന്നും അത് നമ്മുടെ ജീവിതത്തിൻ്റെ പല മേഖലകളെ എങ്ങനെ മാറ്റിമറിക്കുന്നുവെന്നും ഇതിൽ വിവരിക്കുന്നു, ഭാവിയിൽ ഈ സാങ്കേതികവിദ്യയിൽ നിന്ന് നമ്മൾ എന്താണ് പ്രതീക്ഷിക്കുന്നതെന്നും ഇതിൽ വിശദീകരിക്കുന്നു. 

 


താക്കോൽ വാക്കുകൾ : ആർട്ടിഫിഷ്യൽ ഇൻ്റലിജൻസ്, കൃത്രിമ നാരോ AI, കൃത്രിമ ജനറൽ AI, സൂപ്പർ AI, റിയാക്ടീവ് മെഷീൻ AI, ലിമിറ്റഡ് മെമ്മറി AI,  തിയറി ഓഫ് മൈൻഡ് AI, സെൽഫ് അവെർ AI, DALL·E, ചാറ്റ് ജിപിടി, ഓപ്പൺ AI.

 

 

എന്താണ് ആർട്ടിഫിഷ്യൽ ഇൻ്റലിജൻസ് (AI) ?

 

ജീവികളുടെ തിരിച്ചറിവിനെ ബുദ്ധി എന്നു പറയുന്നു. ആശയവിനിയമത്തിന് ഭാഷ കൈകാര്യം ചെയ്യാനുള്ള കഴിവ്, ഓർമശക്തി, വിവരങ്ങൾ മനസ്സിലാക്കാനുള്ള കഴിവ് (understanding), ആസൂത്രണം (planning), അമൂർത്തമായ ആശയങ്ങളെ മനസ്സിലാക്കാനും പ്രയോഗിക്കാനുമുള്ള ശേഷി (abstract reasoning), പ്രശ്നപരിഹാരം (problem solving) എന്നീ കഴിവുകളുടെ ആകത്തുകയെയാണ് ബുദ്ധി എന്ന് പറയുക. മനുഷ്യബുദ്ധിയെ അനുകരിച്ച് സ്വയം പ്രവർത്തിക്കുന്ന ഉപകരണങ്ങളുടെ ബുദ്ധി കൃത്രിമബുദ്ധി അഥവാ നിർമ്മിതബുദ്ധി എന്നു പറയുന്നു. AI ക്ക് പ്രശ്‌നങ്ങൾ പരിഹരിക്കാനും എന്തുചെയ്യണമെന്ന് തിരഞ്ഞെടുക്കാനും വ്യത്യസ്‌ത ശബ്‌ദങ്ങൾ കേൾക്കാനും ഗെയിമുകൾ കളിക്കാനും കാറുകൾ ഓടിക്കുന്നത് പോലെ സാധാരണയായി മനുഷ്യർക്ക് മാത്രം ചെയ്യാൻ കഴിയുന്ന കാര്യങ്ങൾ ചെയ്യാനും കഴിയും. അനുഭവത്തിൽ നിന്ന് പഠിക്കുന്ന AI ക്ക്  കാലക്രമേണ പല മെച്ചപ്പെടുത്തലുകളും നടത്താൻ കഴിയുന്നതുമാണ്.  ഇന്നത്തെ വേഗതയേറിയ  ആധുനിക ലോകത്ത് നിർമ്മിത ബുദ്ധി കാര്യക്ഷമതയുടെയും സർഗാത്മകതയുടെയും കണ്ടുപിടിത്തമായി മാറിക്കഴിഞ്ഞിരിക്കുന്നു.  ലോകത്തെ പിടിച്ചു കുലുക്കിയ ഒരു വിപ്ലവമായി, ഭയാനകമായ  വേഗതയിൽ നമ്മുടെ  ജീവിതത്തെ മാറ്റിമറിക്കുന്ന ഒന്നായി AI മാറിക്കൊണ്ടിരിക്കുകയാണ്.

 

AI യുടെ വ്യത്യസ്ത തരങ്ങൾ

 

കഴിവുകളെ അടിസ്ഥാനമാക്കിയും പ്രവർത്തികളെ അടിസ്ഥാനമാക്കിയും AI പലതരത്തിലുണ്ട്.  ആദ്യം നമുക്ക് കഴിവുകളെ അടിസ്ഥാനമാക്കിയുള്ള AI കൾ ഏതൊക്കെയെന്ന് നോക്കാം. അത് മൂന്ന് തരത്തിൽ ആണ് ഉള്ളത് - “കൃത്രിമ നാരോ AI” (Artificial Narrow AI), “കൃത്രിമ ജനറൽ AI” (Artificial General AI) പിന്നെ സൂപ്പർ AI (Super AI).

കൃത്രിമ നാരോ AI (Artificial Narrow AI)

 

ഈ AI യെ നമ്മൾ ദുർബല AI എന്നും വിളിക്കുന്നുണ്ട്.  ഇന്ന് നിലവിലുള്ള ഒരേയൊരു തരം AI ആണ് കൃത്രിമ നാരോ AI. മനുഷ്യ മനസ്സുകൾക്ക് കഴിയുന്നതിനേക്കാൾ വേഗത്തിൽ ഏതൊരു ദൗത്യവും നമുക്ക് ഈ AI യെ കൊണ്ട് വളരെ എളുപ്പത്തിൽ പരിശീലിപ്പിക്കുവാൻ സാധിക്കുന്നതാണ്.  എന്നിരുന്നാലും നിർവചിക്കപ്പെട്ട ചുമതലയ്ക്ക് പുറത്ത് ഇതിന് പ്രവർത്തിക്കാൻ കഴിയില്ല.  പകരം അത് ആ സ്പെക്ട്രത്തിലെ വൈജ്ഞാനിക കഴിവുകളുടെയും മുന്നേറ്റങ്ങളുടെയും ഒരൊറ്റ ഉപവിഭാഗത്തെ ലക്ഷ്യമിടുന്നു. Siri, Amazon's Alexa, IBM Watson® എന്നിവ നാരോ AI യുടെ ഉദാഹരണങ്ങളാണ്. OpenAI യുടെ ChatGPT പോലും നാരോ AI യുടെ ഒരു രൂപമായി കണക്കാക്കപ്പെടുന്നു, കാരണം ഇത് ടെക്‌സ്‌റ്റ് അധിഷ്‌ഠിത ചാറ്റ് എന്ന ഒരൊറ്റ ദൗത്യത്തിലേക്ക് പരിമിതപ്പെട്ടിരിക്കുന്നു.

കൃത്രിമ ജനറൽ AI (Artificial General AI)

ഈ AI  ശക്തമായ AI എന്നും  അറിയപ്പെടുന്നു. ഈ AI യുകൾക്ക്  മനുഷ്യസഹായം ഇല്ലാതെ തന്നെ മുൻപഠനങ്ങളും കഴിവുകളും ഉപയോഗിച്ച് പുതിയ ജോലികൾ നിർവഹിക്കാൻ കഴിയുന്നതാണ്. AI യുടെ ഈ കഴിവ് കാരണം മനുഷ്യന് ചെയ്യാൻ കഴിയുന്ന ഏത് ഭൗതിക ജോലിയും പഠിക്കാനും നിർവഹിക്കാനും ഇതിന് സാധിക്കുന്നു.

സൂപ്പർ AI (Super AI)

സൂപ്പർ AI യെ സാധാരണയായി കൃത്രിമ സൂപ്പർ ഇൻ്റലിജൻസ് എന്ന് വിളിക്കുന്നു. ഈ  സൂപ്പർ AI  ചിന്തിക്കുകയും ന്യായവാദം ചെയ്യുകയും പഠിക്കുകയും തീരുമാനങ്ങൾ എടുക്കുകയും മനുഷ്യരെ മറികടക്കുന്ന വൈജ്ഞാനിക കഴിവുകൾ സ്വന്തമാക്കുകയും ചെയ്യുന്നു. സൂപ്പർ AI യുടെ ആപ്ലിക്കേഷനുകൾ എന്ന് പറയുമ്പോൾ അത് മനുഷ്യവികാരങ്ങളും അനുഭവങ്ങളും മനസ്സിലാക്കുന്ന ഘട്ടം കടന്ന് അതിൻറെ തായ ആഗ്രഹങ്ങളും ആവശ്യങ്ങളും മനസ്സിലാക്കാൻ പറ്റുന്ന,  സ്വന്തമായ വിശ്വാസങ്ങൾ ഉണ്ടാക്കിയെടുക്കാൻ കഴിവുള്ള ഒരു അവസ്ഥയിലേക്ക് എത്തിച്ചേരുന്നു.

 

ഇനി നമുക്ക് പ്രവർത്തികളെ  അടിസ്ഥാനമാക്കിയുള്ള AI കളെ പരിചയപ്പെടാം. അത് നാല് തരത്തിലാണ്, റിയാക്ടീവ് മെഷീൻ AI (Reactive Machine AI ),  ലിമിറ്റഡ് മെമ്മറി AI (Limited Memory AI),  തിയറി ഓഫ് മൈൻഡ് AI (Theory of Mind AI) പിന്നെ, സെൽഫ് അവെർ AI (Self Aware AI).

റിയാക്ടീവ് മെഷീൻ AI (Reactive Machine AI )

റിയാക്ടീവ് മെഷീനുകൾ മെമ്മറി ഇല്ലാത്ത AI സിസ്റ്റങ്ങളാണ്, അവ വളരെ പ്രത്യേകമായ ഒരു ജോലി നിർവഹിക്കാൻ രൂപകൽപ്പന ചെയ്തിട്ടുള്ളവയാണ്. മുമ്പത്തെ ഫലങ്ങളോ തീരുമാനങ്ങളോ അവർക്ക് ഓർമിക്കാൻ കഴിയാത്തതിനാൽ, നിലവിൽ ലഭ്യമായ ഡാറ്റ ഉപയോഗിച്ച് മാത്രമേ അവർ പ്രവർത്തിക്കൂ. റിയാക്റ്റീവ് AI സ്റ്റാറ്റിസ്റ്റിക്കൽ ഗണിതത്തിൽ നിന്നാണ് ഉത്ഭവിക്കുന്നത്, കൂടാതെ ഇൻ്റലിജൻ്റ് ഔട്ട്‌പുട്ട് നിർമ്മിക്കുന്നതിന് വേണ്ടിയുള്ള  വലിയ അളവിലുള്ള  ഡാറ്റകൾ വിശകലനം ചെയ്യാനും അതിനു കഴിയും.

റിയാക്ടീവ് മെഷീൻ AI യുടെ ഉദാഹരണങ്ങൾ:

 

a)     IBM ഡീപ് ബ്ലൂ:  IBM-ൻ്റെ ചെസ്സ് കളിക്കുന്ന സൂപ്പർ കമ്പ്യൂട്ടർ AI, 1990-കളുടെ അവസാനത്തിൽ ചെസ്സ് ഗ്രാൻഡ്മാസ്റ്റർ ഗാരി കാസ്പറോവിനെ തോൽപിച്ചു, ബോർഡിലെ കരുക്കൾ വിശകലനം ചെയ്ത് ഓരോ നീക്കത്തിൻ്റെയും സാധ്യതകൾ പ്രവചിച്ചു.

b)     Netflix റെക്കമൻഡേഷൻ എഞ്ചിൻ: ഉപഭോക്താക്കൾക്ക് അവർ ആസ്വദിക്കാൻ സാധ്യതയുള്ള ഉള്ളടക്കം നൽകുന്നതിന്, അവർ   മുന്നെ കണ്ടതും കേട്ടതും ആയ  കാര്യങ്ങളുടെ ഡാറ്റാ സെറ്റുകൾ പ്രോസസ്സ് ചെയ്യുന്ന മോഡലുകളാണ് Netflix-ൻ്റെ റെക്കമൻഡേഷൻ എഞ്ചിൻ നൽകുന്നത് .

 

ലിമിറ്റഡ് മെമ്മറി AI  (Limited Memory AI )

റിയാക്ടീവ് മെഷീൻ AI-ൽ നിന്ന് വ്യത്യസ്തമായി, AI-യുടെ ഈ രൂപത്തിന് മുൻകാല സംഭവങ്ങളും ഫലങ്ങളും ഓർമ്മിപ്പിക്കാനും സമയത്തിനനുസരിച്ച് നിർദ്ദിഷ്ട വസ്തുക്കളും സാഹചര്യങ്ങളും നിരീക്ഷിക്കാനും കഴിയും. ലിമിറ്റഡ് മെമ്മറി AI ക്ക് പഴയകാല ഡാറ്റകളും പുതിയകാല ഡാറ്റുകളും ഉപയോഗിച്ച്  അതിന് ആവശ്യമുള്ള ഫലങ്ങൾ നേടാൻ സാധിക്കുന്നതാണ്.  എന്നിരുന്നാലും അതിന് ഒരു നിശ്ചിത സമയത്തേക്ക് മാത്രമേ ആ ഡാറ്റകൾ ഉപയോഗിക്കാൻ കഴിയുകയുള്ളൂ.  കാലക്രമേണ കൂടുതൽ ഡാറ്റയിൽ പരിശീലനം ലഭിക്കുന്നതിലൂടെ  ലിമിറ്റഡ് മെമ്മറി AI ക്ക് അതിൻറെ പ്രവർത്തനം മെച്ചപ്പെടുത്താൻ  കഴിയുന്നതാണ്.

ലിമിറ്റഡ് മെമ്മറി AI യുടെ ഉദാഹരണങ്ങൾ

 

a)     ജനറേറ്റീവ് AI: ChatGPT, Bard, DeepAI എന്നിവ പോലുള്ള ജനറേറ്റീവ് AI ടൂളുകൾ അത് സൃഷ്ടിക്കുന്ന ഉള്ളടക്കത്തിനുള്ളിലെ വാക്കോ ശൈലിയോ ദൃശ്യ ഘടകമോ പ്രവചിക്കാൻ പരിമിതമായ മെമ്മറി AI കഴിവുകളെ ആശ്രയിക്കുന്നു.

b)     വെർച്വൽ അസിസ്റ്റൻ്റുകളും ചാറ്റ്ബോട്ടുകളും: ചോദ്യങ്ങളും അഭ്യർത്ഥനകളും മനസിലാക്കാനും ഉചിതമായ നടപടികളെടുക്കാനും പ്രതികരണങ്ങൾ നൽകാനും സിരി, അലക്സാ, ഗൂഗിൾ അസിസ്റ്റൻ്റ്, കോർട്ടാന, ഐബിഎം വാട്സൺ അസിസ്റ്റൻ്റ് എന്നിവ പോലുള്ള നാച്ചുറൽ ലാംഗ്വേജ് പ്രോസസ്സിംഗും ലിമിറ്റഡ് മെമ്മറി AI സംയോജിപ്പിക്കുന്നു.

c)     സ്വയം ഓടിക്കുന്ന കാറുകൾ: സ്വയം ഓടിക്കുന്ന വാഹനങ്ങൾ തത്സമയം അതിന് ചുറ്റുമുള്ള ലോകത്തെ  മനസ്സിലാക്കുകയും, വേഗത, ബ്രേക്ക്, ടേൺ എപ്പോൾ പ്രയോഗിക്കണം തുടങ്ങിയ കാര്യങ്ങളിൽ ശരിയായ തീരുമാനങ്ങൾ എടുക്കുന്നതിനും ലിമിറ്റഡ് മെമ്മറി AI ഉപയോഗിക്കുന്നു.

 

തിയറി ഓഫ് മൈൻഡ് AI (Theory of Mind AI)

തിയറി ഓഫ് മൈൻഡ് AI  എന്നത് ജനറൽ AI യുടെ കീഴിൽ വരുന്ന AI യുടെ ഒരു ഫംഗ്ഷണൽ ക്ലാസ് ആണ്.  ഇത് AI യുടെ യാഥാർത്ഥ്യമാകാത്ത  രൂപമാണെങ്കിലും അതിന് മറ്റുള്ളവരുടെ ചിന്തകളും വികാരങ്ങളും മനസ്സിലാക്കാൻ സാധിക്കും.  അതുകൊണ്ടുതന്നെ അത് മനുഷ്യരുമായി ഒരു വൈകാരികമായ ബന്ധം സ്ഥാപിക്കും എന്ന് വിശ്വസിക്കുന്നു.  ഇന്നത്തെ ജനറേറ്റീവ് AI  ടൂളുകൾക്ക് ചെയ്യാൻ കഴിയാത്ത കലാസൃഷ്ടികളും ഉപന്യാസങ്ങളും മനസ്സിലാക്കാനും സന്ദർഭോചിതമാക്കാനും മൈൻഡ് AI ക്ക് കഴിയുന്നു.  നിലവിൽ വികസിച്ചുകൊണ്ടിരിക്കുന്ന മൈൻഡ് AI  യുടെ ഒരു സിദ്ധാന്തമാണ് ഇമോഷൻ AI.  വൈകാരികതലത്തിൽ മനുഷ്യരെ തിരിച്ചറിയാനും അനുകരിക്കാനും പരീക്ഷിക്കാനും ഉചിതമായി പ്രതികരിക്കാനും ശബ്ദങ്ങൾ,  ചിത്രങ്ങൾ മറ്റുതരത്തിലുള്ള ഡാറ്റകൾ  എന്നിവ വിശകലനം ചെയ്യാനുള്ള കഴിവും ഇതിനു ഉണ്ടാകുമെന്നും AI  ഗവേഷകർ പ്രതീക്ഷിക്കുന്നു. ഇതുവരെ മനുഷ്യൻറെ വികാരങ്ങൾ മനസ്സിലാക്കാനും പ്രതികരിക്കാനും ഇമോഷൻ AI ക്ക് കഴിഞ്ഞിട്ടില്ല.

 

സെൽഫ് അവെർ AI (Self Aware AI)

സൂപ്പർ AI കഴിവുകൾ ഉള്ള ആപ്ലിക്കേഷനുകൾക്കായുള്ള ഒരു തരം ഫംഗ്ഷണൽ AI ക്ലാസാണ് സെൽഫ്-അവെയർ AI. മനുഷ്യൻ്റെ വികാരങ്ങൾക്കും ചിന്തകൾക്കും ഒപ്പം സ്വന്തം ആന്തരിക അവസ്ഥകളും സവിശേഷതകളും മനസ്സിലാക്കാനുള്ള കഴിവ് അതിന് ഉണ്ടായിരിക്കും എന്നാണ് ഗവേഷകർ പറയുന്നത്. കൂടാതെ അതിൻ്റതായ  വികാരങ്ങളും ആവശ്യങ്ങളും വിശ്വാസങ്ങളും ഉണ്ടായിരിക്കും എന്നുകൂടെ പറയുന്നു.


    

          

    

 

AI മോഡലുകൾക്ക് പിന്നിലെ ഗണിതശാസ്ത്ര തത്വങ്ങൾ

 

ChatGPT പോലുള്ള ജനറേറ്റീവ് AI മോഡലുകൾക്ക് പിന്നിലെ ഗണിതശാസ്ത്ര തത്വങ്ങൾ പ്രാഥമികമായി പ്രോബബിലിറ്റി സിദ്ധാന്തം, ലീനിയർ ആൾജിബ്ര, കാൽക്കുലസ്, ഒപ്റ്റിമൈസേഷൻ ടെക്നിക്കുകൾ എന്നിവയെ അടിസ്ഥാനമാക്കിയുള്ളതാണ്. ഡീപ് ന്യൂറൽ നെറ്റ്‌വർക്കുകൾ ഉപയോഗിച്ചാണ് ChatGPT നിർമ്മിച്ചിരിക്കുന്നത്, പ്രത്യേകിച്ച് ട്രാൻസ്‌ഫോർമർ എന്ന് വിളിക്കുന്ന ഒരു വേരിയൻ്റ്. ന്യൂറൽ നെറ്റ്‌വർക്കുകളിൽ പരസ്പരം ബന്ധിപ്പിച്ച നോഡുകളുടെ (ന്യൂറോണുകൾ) പാളികൾ അടങ്ങിയിരിക്കുന്നു, അത് വെയ്റ്റഡ് കണക്ഷനുകളിലൂടെ ഇൻപുട്ട് ഡാറ്റ പ്രോസസ്സ് ചെയ്യുന്നു. ഒരു ഔട്ട്‌പുട്ട് ഉൽപ്പാദിപ്പിക്കുന്നതിന് ആക്റ്റിവേഷൻ ഫംഗ്ഷനുകൾ പ്രയോഗിക്കുന്നു.

ജനറേറ്റീവ് AI മോഡലുകൾ ഒരു ശ്രേണിയിൽ മുമ്പത്തെ വാക്കുകൾ നൽകിയ ഒരു വാക്കിൻ്റെ സാധ്യത (probability) പ്രവചിക്കുന്നു. ഇത് കണ്ടീഷണൽ പ്രോബബിലിറ്റിയെ അടിസ്ഥാനമാക്കിയുള്ളതാണ്, പരിശീലന ഡാറ്റയിൽ നിന്ന് പഠിച്ച പദങ്ങളുടെ പ്രോബബിലിറ്റി ഡിസ്ട്രിബ്യൂഷനെ അടിസ്ഥാനമാക്കി അടുത്ത വാക്ക് സൃഷ്ടിക്കപ്പെടുന്നു.

 ഡാറ്റ പ്രോസസ്സ് ചെയ്യുന്നതിലും ഭാരം സംഭരിക്കുന്നതിലും പരിവർത്തനങ്ങൾ പ്രയോഗിക്കുന്നതിലും മെട്രിക്സുകളും വെക്റ്ററുകളും അടിസ്ഥാനപരമാണ്. ന്യൂറൽ നെറ്റ്‌വർക്കുകളിൽ മുന്നോട്ടും പിന്നോട്ടും പ്രചരിപ്പിക്കുന്നതിന് ഡോട്ട് പ്രോഡക്ടുകൾ, മാട്രിക്സ് ഗുണനം, ഐജൻവെക്റ്റർ/ഐജൻവാല്യൂ കണക്കുകൂട്ടൽ എന്നിവ പോലുള്ള പ്രവർത്തനങ്ങൾ നിർണായകമാണ്. ഒരു മോഡലിനെ പരിശീലിപ്പിക്കുന്നതിന്, മോഡലിൻ്റെ പ്രവചനങ്ങൾ യഥാർത്ഥ ലക്ഷ്യത്തിൽ നിന്ന് എത്ര ദൂരെയാണെന്ന് അളക്കാൻ ഒരു ഒബ്ജക്റ്റീവ് ഫംഗ്ഷൻ (ക്രോസ്-എൻട്രോപ്പി ലോസ് പോലെ) ഉപയോഗിക്കുന്നു. ഗ്രേഡിയൻ്റ് ഡിസെൻ്റ് എന്ന് വിളിക്കുന്ന ഒരു പ്രക്രിയയിലൂടെ, ഈ പിശക് കുറയ്ക്കുന്നതിന് മോഡലിൻ്റെ ഭാരം അപ്‌ഡേറ്റ് ചെയ്യാൻ സാധിക്കുന്നു. ഡെറിവേറ്റീവുകൾ (കാൽക്കുലസ്) ഉപയോഗിച്ച് ഗ്രേഡിയൻ്റുകൾ കണക്കാക്കുകയും നെറ്റ്‌വർക്കിലൂടെ (ബാക്ക്പ്രൊപഗേഷൻ) വീണ്ടും പ്രചരിപ്പിക്കുകയും ചെയ്യുന്നു. ChatGPT-യെ ശക്തിപ്പെടുത്തുന്ന ട്രാൻസ്‌ഫോർമർ ആർക്കിടെക്ചർ, ടെക്‌സ്‌റ്റ് സൃഷ്‌ടിക്കുമ്പോൾ ഒരു ശ്രേണിയിൽ വ്യത്യസ്ത പദങ്ങളുടെ പ്രാധാന്യം അളക്കാൻ മോഡലിനെ അനുവദിക്കുന്ന ഒരു ശ്രദ്ധാകേന്ദ്രം ഉപയോഗിക്കുന്നു. ഈ സംവിധാനം ഒരു പ്രധാന ഗണിതശാസ്ത്ര നവീകരണമാണ്, ഇത് വാചകത്തിലെ ദീർഘദൂര ഡിപൻഡൻസികൾ കൈകാര്യം ചെയ്യാൻ മോഡലിനെ സഹായിക്കുന്നു. മാട്രിക്സ് പ്രവർത്തനങ്ങളിലൂടെ ഗണിതശാസ്ത്രപരമായി പ്രതിനിധീകരിക്കുന്ന എല്ലാ വാക്കുകളും ഒരേസമയം ഒരു ശ്രേണിയിൽ പ്രോസസ്സ് ചെയ്യുന്നതിന് ഈ മോഡലുകൾ സ്വയം ശ്രദ്ധ ചെലുത്തുന്നു. ഓരോ വാക്കും ഒരു ക്രമത്തിൽ മറ്റുള്ളവർക്ക് എത്രമാത്രം ശ്രദ്ധ നൽകണമെന്ന് നിർണ്ണയിക്കുന്ന സെൽഫ് അറ്റൻഷൻ സ്‌കോറുകൾ, ഡോട്ട് പ്രോഡക്ടുകൾ ഉപയോഗിച്ചാണ് കണക്കാക്കുന്നത്. ഒരു ഭാഷാ മോഡലിൻ്റെ അവസാന ലെയറിൽ, സാധ്യമായ എല്ലാ വാക്കുകളുടേയും പ്രോബബിലിറ്റി ഡിസ്‌ട്രിബ്യൂഷനാണ് ഔട്ട്‌പുട്ട്. ഇത് സാധാരണയായി സോഫ്റ്റ്‌മാക്‌സ് ഫംഗ്‌ഷൻ ഉപയോഗിച്ചാണ് ചെയ്യുന്നത്, ഇത് മൂല്യങ്ങൾ എക്‌സ്‌പോണൻഷ്യേറ്റ് ചെയ്‌ത് നോർമലൈസ് ചെയ്‌ത് അസംസ്‌കൃത സ്‌കോറുകളെ (ലോഗറ്റുകൾ) പ്രോബബിലിറ്റികളാക്കി മാറ്റുന്നു.

 

 

 

 

AI യുടെ വിവിധ രൂപാന്തരങ്ങൾ

 

2019-ൽ പുറത്തിറങ്ങിയ GPT-2 ആയിരുന്നു ഓപ്പൺഎഐയുടെ ആദ്യ ചാറ്റ്ബോട്ട്. പ്രത്യേകമായി ചാറ്റ്ബോട്ട് എന്ന് ബ്രാൻഡ് ചെയ്തിട്ടില്ലെങ്കിലും, സംഭാഷണ ജോലികൾക്കായി ഉപയോഗിക്കാവുന്ന, മനുഷ്യനെപ്പോലെയുള്ള ടെക്‌സ്‌റ്റ് സൃഷ്‌ടിക്കാൻ കഴിവുള്ള OpenAI-ൽ നിന്നുള്ള ആദ്യത്തെ പ്രധാന ഭാഷാ മോഡലാണിത്. എന്നിരുന്നാലും, 2022 നവംബറിൽ സമാരംഭിച്ച ChatGPT, സംവേദനാത്മക സംഭാഷണങ്ങൾക്കായി പ്രത്യേകം രൂപകൽപ്പന ചെയ്‌ത ചാറ്റ്‌ബോട്ടായി ഔദ്യോഗികമായി അവതരിപ്പിച്ച ആദ്യത്തെ മോഡലാണ്. ഭാഷാ മോഡലുകളായ ഓപ്പൺ AI യുടെ പുരോഗതി 2019-ൽ GPT-2 പുറത്തിറങ്ങിയതോടെയാണ് ആരംഭിച്ചത്, ഇത് ഒരു ചാറ്റ്ബോട്ടായി രൂപകൽപ്പന ചെയ്തിട്ടില്ലെങ്കിലും, മനുഷ്യനെപ്പോലെയുള്ള വാചകം സൃഷ്ടിക്കാൻ പ്രാപ്തമായിരുന്നു. 2020 ജൂണിൽ, സംഭാഷണം, ഉള്ളടക്കം സൃഷ്‌ടിക്കൽ, കോഡിംഗ് സഹായം എന്നിവയുൾപ്പെടെ നിരവധി ടാസ്‌ക്കുകൾ നിർവഹിക്കാൻ കഴിയുന്ന വളരെ വലുതും ശക്തവുമായ മോഡലായ GPT-3, OpenAI സമാരംഭിച്ചു. 2021 ഓഗസ്റ്റിൽ, പ്രോഗ്രാമിംഗ് ടാസ്‌ക്കുകൾക്കായി ഫൈൻ-ട്യൂൺ ചെയ്‌ത GPT-3-ൻ്റെ ഒരു വകഭേദമായ കോഡെക്‌സ് OpenAI അവതരിപ്പിച്ചു, അത് പിന്നീട് GitHub-ൻ്റെ കോപൈലറ്റിലേക്ക് സംയോജിപ്പിച്ചു. 2022 നവംബറിൽ, OpenAI ഔദ്യോഗികമായി ChatGPT പുറത്തിറക്കി, GPT-3.5-ൻ്റെ ഫൈൻ-ട്യൂൺ ചെയ്ത പതിപ്പ് സംഭാഷണ ഉപയോഗത്തിനായി പ്രത്യേകം ഒപ്റ്റിമൈസ് ചെയ്‌തു, അവരുടെ ആദ്യത്തെ ചാറ്റ്‌ബോട്ടിനെ അത്തരത്തിൽ ബ്രാൻഡ് ചെയ്തു. ഇതിനെത്തുടർന്ന്, 2023 മാർച്ചിൽ GPT-4, മെച്ചപ്പെട്ട ന്യായവാദം, സങ്കീർണ്ണമായ ചോദ്യങ്ങളെക്കുറിച്ച് ആഴത്തിലുള്ള ധാരണ, ദൈർഘ്യമേറിയതും കൂടുതൽ സൂക്ഷ്മവുമായ സംഭാഷണങ്ങൾ കൈകാര്യം ചെയ്യാനുള്ള കഴിവ് എന്നിവ വാഗ്ദാനം ചെയ്യുന്ന കൂടുതൽ വിപുലമായ മോഡൽ കൊണ്ടുവന്നു. DALL·E, DALL·E 2, DALL·E 3 (ഉച്ചാരണം DOLL-E) എന്നിവ "പ്രോംപ്റ്റുകൾ" എന്നറിയപ്പെടുന്ന സ്വാഭാവിക ഭാഷാ വിവരണങ്ങളിൽ നിന്ന് ഡിജിറ്റൽ ഇമേജുകൾ സൃഷ്ടിക്കുന്നതിന് ആഴത്തിലുള്ള പഠന രീതികൾ ഉപയോഗിച്ച് OpenAI വികസിപ്പിച്ച ടെക്സ്റ്റ്-ടു-ഇമേജ് മോഡലുകളാണ്. GPT-4o ("o" എന്നതിന് "ഓമ്‌നി") മനുഷ്യ-കമ്പ്യൂട്ടർ ആശയവിനിമയത്തിലേക്കുള്ള ഒരു ചുവടുവെപ്പാണ് - ഇത് ടെക്‌സ്‌റ്റ്, ഓഡിയോ, ഇമേജ്, വീഡിയോ എന്നിവയുടെ ഏത് സംയോജനവും ഇൻപുട്ടായി സ്വീകരിക്കുകയും ടെക്‌സ്‌റ്റ്, ഓഡിയോ, ഇമേജ് എന്നിവയുടെ ഏത് സംയോജനവും ഔട്ട്പുട്ടുകൾ ആയി സൃഷ്ടിക്കുകയും ചെയ്യുന്നു. ഇതിന് 232 മില്ലിസെക്കൻഡിനുള്ളിൽ ഓഡിയോ ഇൻപുട്ടുകളോട് പ്രതികരിക്കാൻ കഴിയും, ശരാശരി 320 മില്ലിസെക്കൻഡ്, ഇത് ഒരു സംഭാഷണത്തിലെ മനുഷ്യ പ്രതികരണ സമയത്തിന് സമാനമാണ് (ഒരു പുതിയ വിൻഡോയിൽ തുറക്കുന്നു). ഇംഗ്ലീഷിലും കോഡിലുമുള്ള ടെക്‌സ്‌റ്റിലെ GPT-4 ടർബോ പ്രകടനവുമായി ഇത് പൊരുത്തപ്പെടുന്നു. നിലവിലുള്ള മോഡലുകളെ അപേക്ഷിച്ച് GPT-4o കാഴ്ചയിലും ഓഡിയോ മനസ്സിലാക്കുന്നതിലും മികച്ചതാണ്.

GPT-4o മിനി, ഒന്നിലധികം മോഡൽ കോളുകൾ ശൃംഖലയിലാക്കുകയോ സമാന്തരമാക്കുകയോ ചെയ്യുന്ന ആപ്ലിക്കേഷനുകൾ (ഉദാ. ഒന്നിലധികം API-കളെ വിളിക്കൽ) പോലെയുള്ള ഒരു വലിയ വോളിയം സന്ദർഭം (ഉദാ. പൂർണ്ണ കോഡ് ബേസ്) ഉപയോഗിച്ച് അതിൻ്റെ കുറഞ്ഞ ചെലവും ലേറ്റൻസിയും ഉപയോഗിച്ച് വിപുലമായ ടാസ്‌ക്കുകൾ പ്രവർത്തനക്ഷമമാക്കുന്നു.അല്ലെങ്കിൽ വേഗതയേറിയ, തത്സമയ ടെക്സ്റ്റ് പ്രതികരണങ്ങളിലൂടെ ഉപഭോക്താക്കളുമായി സംവദിക്കുകയും (ഉദാ. ഉപഭോക്തൃ പിന്തുണ ചാറ്റ്ബോട്ടുകൾ) ചെയ്യുന്നു.

 

ഇന്ന്, GPT-4o മിനി, ഭാവിയിൽ വരുന്ന ടെക്‌സ്‌റ്റ്, ഇമേജ്, വീഡിയോ, ഓഡിയോ ഇൻപുട്ടുകൾക്കും ഔട്ട്‌പുട്ടുകൾക്കുമുള്ള പിന്തുണയോടെ API-ൽ വാചകത്തെയും കാഴ്ചയെയും പിന്തുണയ്‌ക്കുന്നു. മോഡലിന് 128K ടോക്കണുകളുടെ ഒരു കോൺടെക്‌സ്‌റ്റ് വിൻഡോയുണ്ട്, ഓരോ അഭ്യർത്ഥനയിലും 16K ഔട്ട്‌പുട്ട് ടോക്കണുകൾ വരെ പിന്തുണയ്‌ക്കുന്നു, കൂടാതെ 2023 ഒക്‌ടോബർ വരെ അറിവുമുണ്ട്. 2024 സെപ്റ്റംബറിൽ OpenAI പുറത്തിറക്കിയ ഒരു ജനറേറ്റീവ് പ്രീ-ട്രെയിൻഡ് ട്രാൻസ്‌ഫോർമറാണ് OpenAI o1. ഉത്തരം നൽകുന്നതിന് മുമ്പ് o1 "ചിന്തിക്കാൻ" സമയം ചിലവഴിക്കുന്നു, ഇത് സങ്കീർണ്ണമായ ന്യായവാദം, ശാസ്ത്രം, പ്രോഗ്രാമിംഗ് എന്നിവയിൽ കൂടുതൽ കാര്യക്ഷമമാക്കുന്നു. സോറ, ടെക്‌സ്‌റ്റ്-ടു-വീഡിയോ മോഡലിന് വിഷ്വൽ നിലവാരവും ഉപയോക്താവിൻ്റെ പ്രോംപ്‌റ്റ് പാലിക്കലും നിലനിർത്തിക്കൊണ്ട് ഒരു മിനിറ്റ് വരെ ദൈർഘ്യമുള്ള വീഡിയോകൾ സൃഷ്‌ടിക്കാനാകും. ദോഷങ്ങൾക്കോ ​​അപകടസാധ്യതകൾക്കോ ​​വേണ്ടിയുള്ള നിർണായക മേഖലകൾ വിലയിരുത്താൻ റെഡ് ടീമർമാർക്ക് സോറ ലഭ്യമാകുന്നു. ക്രിയേറ്റീവ് പ്രൊഫഷണലുകൾക്ക് ഏറ്റവും സഹായകരമായ രീതിയിൽ മോഡൽ എങ്ങനെ മുന്നോട്ട് കൊണ്ടുപോകാം എന്നതിനെക്കുറിച്ചുള്ള ഫീഡ്‌ബാക്ക് നേടുന്നതിന് നിരവധി വിഷ്വൽ ആർട്ടിസ്റ്റുകൾ, ഡിസൈനർമാർ, ചലച്ചിത്ര നിർമ്മാതാക്കൾ എന്നിവർക്ക് OpenAI ആക്‌സസ് നൽകുന്നു.

 

 

 

 

ഉപസംഹാരം:

 

മനുഷ്യർ ആർട്ടിഫിഷ്യൽ ഇൻ്റലിജൻസ് (AI) വികസിപ്പിച്ചെടുത്തത്, പഠിക്കാനും തീരുമാനങ്ങൾ എടുക്കാനും ജോലികൾ ചെയ്യാനും കഴിയുന്ന യന്ത്രങ്ങളും അൽഗോരിതങ്ങളും രൂപകല്പന ചെയ്തുകൊണ്ടാണ്. കാലക്രമേണ, മനുഷ്യരേക്കാൾ വളരെ വേഗത്തിലും കൃത്യമായും പ്രവർത്തനങ്ങൾ കൈകാര്യം ചെയ്യാൻ AI വികസിച്ചു. ഉദാഹരണത്തിന്, AI-ക്ക് നിമിഷങ്ങൾക്കുള്ളിൽ വലിയ അളവിലുള്ള ഡാറ്റ പ്രോസസ്സ് ചെയ്യാനും പാറ്റേണുകൾ കൂടുതൽ കാര്യക്ഷമമായി തിരിച്ചറിയാനും കൃത്യതയോടെ പ്രവചനങ്ങൾ നടത്താനും കഴിയും. കണക്കുകൂട്ടലുകൾ, ഡാറ്റ വിശകലനം അല്ലെങ്കിൽ ചെസ്സ് പോലുള്ള പ്രത്യേക മേഖലകളിൽ, AI-ക്ക് മനുഷ്യരെക്കാൾ മികച്ച പ്രകടനം കാഴ്ചവെക്കാൻ കഴിയും. എന്നിരുന്നാലും, AI-യുടെ കഴിവുകൾ സാധാരണയായി അത് രൂപകൽപ്പന ചെയ്‌തിരിക്കുന്ന ജോലികൾക്കായി പരിമിതപ്പെടുത്തിയിരിക്കുന്നു, അതേസമയം മനുഷ്യൻ്റെ ബുദ്ധി വിശാലവും സർഗ്ഗാത്മകത, വികാരങ്ങൾ, അമൂർത്തമായ ചിന്തകൾ എന്നിവയുൾപ്പെടെ കൂടുതൽ വഴക്കമുള്ളതുമാണ്.

 

 

അവലംബങ്ങൾ :

14 views0 comments
bottom of page