എ.ഐ. ഡീപ്ഫേക്ക് ടെക്നോളജിയുടെ സമഗ്രമായ ഒരു പുറം വിശകലനമാണ് ഈ ലേഖനത്തിലൂടെ ഉദ്ദേശിക്കുന്നത്. അതായത് ഡീപ്ഫേക്ക് ടെക്നോളജിയുടെ സങ്കീര്ണമായ സാങ്കേതിക വശങ്ങളിലേക്ക് പോകാതെയും അതേസമയം തന്നെ അതിന്റെ അര്ത്ഥ തലങ്ങളെക്കുറിച്ചും പ്രതിപാദിക്കുന്ന ലേഖനം.
കഴിഞ്ഞ ഒന്ന് രണ്ടു വര്ഷമായി ഡീപ്ഫേക്ക് ഉള്ളടക്കങ്ങള് നമ്മുടെ ഇടയില് സാധാരണമായിക്കഴിഞ്ഞിരിക്കുന്നു. സോഷ്യല് മീഡിയകളിലൂടെയും ചാറ്റ് മെസന്ജറുകളിലൂടെയും അവ നിര്ലോഭം എല്ലായിടത്തും എത്തുന്നു. സത്യത്തില് എന്താണ് ഈ ഡീപ്ഫയ്ക്ക്? അതറിയണമെങ്കില് നമുക്ക് ഫേക്ക് എന്താണെന്നറിയണം.
മോര്ഫിംഗ് (morphing) എന്ന സാങ്കേതികവിദ്യയുടെ ആരംഭം ആധുനിക ഡിജിറ്റല് എഫക്ടുകളുടെ ദിശയില് ഒരു വലിയ ചുവടുവെപ്പായിരുന്നു. ഒരു ചിത്രം അല്ലെങ്കില് വീഡിയോ ദൃശ്യത്തില് നിന്നും മറ്റൊന്നിലേക്ക് താളമോ കൃത്യതയോ വിട്ടുകൂടാതെ സാങ്കേതികമായി മാറുന്ന പ്രക്രിയ ആണ് മോര്ഫിംഗ്. 1980-90 കളിലാണ് ഈ സാങ്കേതിക വിദ്യ രൂപം കൊണ്ടത്, പിന്നീട് അത് സിനിമ, ടെലിവിഷന്, ഗെയിമിംഗ്, എന്നിവയുടെ പ്രധാന ഭാഗമായി. ഈ ടെക്നോളജി ഉപയോഗിച്ച് ദൃശ്യങ്ങളില് പല കൂട്ടിച്ചേര്ക്കലുകളും ആശ്ചര്യകരമായ വിധത്തില് സന്നിവേശിപ്പിക്കാന് സാധിച്ചു. എന്നിരുന്നാലും അനലിസ്റ്റുകള്ക്കും സൂക്ഷ്മമായി അപഗ്രഥിക്കുന്നവര്ക്കും അതിലെ കൂട്ടിച്ചേര്ക്കലുകള് മനസ്സിലാക്കുവാന് സാധിച്ചിരുന്നു. ഇതിനെ സാധാരണമായി നാം ഫേക്ക് എന്നാണ് പറയുന്നത് .
2014 മുതല്, ഡീപ്ഫേക്ക് സാങ്കേതിക വിദ്യയുടെ ഉദയം മറ്റൊരു തലത്തിലേക്ക് മനുഷ്യരുടെ സൃഷ്ടിപരമായ കഴിവുകളെ കൊണ്ടെത്തിച്ചു. ആര്ട്ടിഫിഷ്യല് ഇന്റലിജന്സ് (എ.ഐ) വഴി വ്യക്തികളുടെ മുഖങ്ങള്, ശബ്ദങ്ങള്, ചലനങ്ങള് എന്നിവ യഥാര്ത്ഥമെന്ന പോലെതന്നെ പുനര്സൃഷ്ടിക്കാനാവും. ജനറേറ്റീവ് അഡ്വേഴ്സറിയല് നെറ്റ്വര്ക്കുകള് (GNAs ) ഉപയോഗിച്ചാണ് ഡീപ്ഫേക്ക് പ്രവര്ത്തിക്കുന്നത്.
| വിശേഷത | മോര്ഫിംഗ് | ഡീപ്ഫേക്ക് |
| സാങ്കേതിക വിധാനം | ചിത്രങ്ങള് പരിവര്ത്തനം ചെയ്യുക. | എ.ഐ ഉപയോഗിച്ച് ഒരു പൂര്ണ്ണമായ ഡിജിറ്റല് പുനരാവിഷ്കാരം. |
| യാഥാര്ത്ഥ്യം | മോര്ഫിംഗ് ഫോട്ടോഷോപ്പ് പോലെയാണ്; പരിചയസമ്പന്നര്ക്കായി തിരിച്ചറിയാന് സാധ്യമാകും. | ഡീപ്ഫേക്ക് വളരെ യഥാര്ത്ഥം പോലെ തോന്നുന്നു. ശബ്ദം, ഭാവങ്ങള് എല്ലാം സ്വാഭാവികം. |
| പ്രത്യാഘാതം | പരിചിതമായ കണ്ണുകളില് വ്യാജത തോന്നും. | സത്യവും വ്യാജവും തമ്മില് തിരിച്ചറിയാന് പോലും സാധിക്കില്ല |
GAN ജനറേറ്റീവ് AI ഡീപ്ഫേക്ക് എന്നുവിളിക്കുന്നത് എന്തുകൊണ്ട്?
ഡീപ്ഫേക്ക് എന്നതിന് ‘ഡീപ്’ എന്നത് എന്ത്?
ഡീപ്ഫേക്ക് എന്നതിന് ‘ഫേക്ക്’ എന്തുകൊണ്ട്?
1 ശബ്ദത്തിന്റെ കുതിപ്പ്: ഡീപ്ഫേക്ക് ഓഡിയോ
ഒരു ദിവസം, ഒരു വിദ്യാര്ത്ഥി തന്റെ ക്ലാസില് അലക്സാണ്ടര് ഗ്രഹാം ബെല്ലിന്റെ ശബ്ദത്തില് ഫോണ് ശാസ്ത്രത്തിന്റെ കഥ കേള്ക്കുന്നു. ഇത് പക്ഷേ ഡീപ്ഫേക്ക് എ.ഐ ഉപയോഗിച്ച് സൃഷ്ടിച്ചതാണ്.ചരിത്രപ്രസിദ്ധരായ ശാസ്ത്രജ്ഞര്, കലാകാരന്മാര്, നേതാക്കള് എന്നിവരുടെ ശബ്ദം പുനരാവിഷ്കരിച്ച് കുട്ടികള്ക്കും സാമൂഹിക പ്രവര്ത്തനങ്ങള്ക്കും നമുക്ക് പുതിയൊരു അനുഭവം നല്കാം.
ഉദാഹരണത്തിന്,
ഈ സാങ്കേതിക വിദ്യക്ക് വോയ്സ് ക്ലോണിങ് എന്നും ജനറേറ്റീവ് AI ( ടെക്സ്റ്റ് to സ്പീച് ) എന്നും പറയാറുണ്ട് . മോര്ഫിങ് പോലെ തന്നെ വോയ്സ് ക്ലോണിങ്ങിന് യാഥാര്ത്ഥ ശബ്ദത്തോട് ഏറെ സാമ്യമുള്ള ശബ്ദങ്ങള് സൃഷ്ടിക്കാന് കഴിയും.
നിങ്ങളുടെ ഒരു 5 മിനിട്ട് ഓഡിയോ ഉപയോഗിച്ച് ഒരു ജനറേറ്റീവ് ഓഡിയോ മോഡല് ട്രെയിന് ചെയ്തു ശബ്ദങ്ങള് പുനഃസൃഷ്ടിക്കുവാന് കഴിയും. എന്നിരുന്നാലും വികാരപരമായി ശബ്ദങ്ങള് ഉണ്ടാക്കുന്നതിനു ഇനിയും കടമ്പകള് കടക്കാനുണ്ട് .
മനുഷ്യര് ഓരോ അവസരങ്ങളിലും ഓരോ വികാരവായ്പ്പോടുകൂടിയാണ് സംസാരിക്കുന്നത്. അതുപോലെ തന്നെ ഒരു സ്പോര്ട്സ് കമന്ററി വായിക്കുന്നത് പോലെയല്ല സാമ്പത്തിക മേഖലയെ കുറിച്ചുള്ള വാര്ത്ത വായിക്കുന്നത്. ഇത്തരം വികാരങ്ങള് വാക്കിലേക്ക് സന്നിവേശിപ്പിക്കാന് വേണ്ട പ്രവര്ത്തങ്ങളാണ് ഇപ്പോള് നടന്നു വരുന്നത്. മലയാളത്തിലെ ആദ്യത്തെ ന്യൂസ്റീഡിങ് വോയിസിന്റെ സാമ്പിള് ഓഡിയോ ഇവിടെ കേൾക്കാം.
2 ദൃശ്യങ്ങളുടെ വിസ്മയം: ഡീപ്ഫേക്ക് വീഡിയോ /ചിത്രങ്ങൾ
ഒരു ദിവസം, അനുശ്രീ എന്ന വിദ്യാര്ത്ഥിനി തന്റെ ഫോണില് ഒരു വീഡിയോ കണ്ടു. അതില്, പ്രശസ്ത രാഷ്ട്രീയ നേതാവിന്റെ അനൗചിത്യമായ പെരുമാറ്റം ശ്രദ്ധയില് പെട്ടു. ഇദ്ദേഹത്തിന്റെ മുഖം വളരെയധികം പരിചിതമായി തോന്നി.പിന്നീട്, സുഹൃത്ത് അവളോട് പറഞ്ഞു: ‘അത് ഡീപ്ഫേക്ക് ആകാം!’
അവള് അതിനെപ്പറ്റി വിശദമായി പഠിച്ചു. ഡീപ്ഫേക്ക് വീഡിയോ എന്നത് ആര്ട്ടിഫിഷ്യല് ഇന്റലിജന്സ് (AI) ഉപയോഗിച്ച് ഒരു വ്യക്തിയുടെ മുഖവും ശബ്ദവും മറ്റൊരാളുടെ ശരീരത്തില് ചേര്ത്ത് ഒറിജിനല് പോലെയുള്ള വ്യാജ ചിത്രങ്ങളും വീഡിയോകളും സൃഷ്ടിക്കുന്ന സാങ്കേതിക വിദ്യയാണ്. ഇത് മുഖവിന്യാസത്തില് സൂക്ഷ്മമായ മാറ്റങ്ങള് ചെയ്യുകയും യഥാര്ത്ഥ ദൃശ്യമെന്ന തോന്നല് ഉണ്ടാക്കുകയും ചെയ്യുന്നു.
ഉദാഹരണത്തിന്, ഒരു വീഡിയോയില് നിങ്ങള് നടന് മമ്മൂട്ടി പാടുന്നത് കാണുമ്പോള്, അത് മമ്മൂട്ടി തന്നെ ആകുമെന്ന് നിങ്ങള് കരുതും. എന്നാല്, ഡീപ്ഫേക്ക് ടെക്നോളജിയിലൂടെ മറ്റൊരാളുടെ ശരീരത്തിനും ശബ്ദത്തിനും മമ്മൂട്ടിയുടെ മുഖം ചേര്ത്താണ് അത് സൃഷ്ടിച്ചത്.
ഇമേജുകള്ക്കായി, ഒരാളുടെ ഫോട്ടോയില് മറ്റൊരാളുടെ മുഖം പകര്ത്തി, അത് യഥാര്ത്ഥ ചിത്രമാണെന്ന് തോന്നിക്കുന്ന വിധത്തില് മാറ്റം വരുത്താനാകും. ഈ ചിത്രങ്ങളും വീഡിയോകളും പ്രൊഫഷണല് ആയാല്, ഒറിജിനലില് നിന്ന് വേര്തിരിച്ചറിയുന്നത് വളരെ പ്രയാസകരമായിരിക്കും.
ഡീപ്ഫേക്ക് AI ഉപയോഗിച്ച് നിർമിച്ച ഒരു ഒരു പൂച്ചയുടെ ചിത്രം
പഴയ ചരിത്ര സംഭവങ്ങള് വീണ്ടെടുക്കുന്നതിനുംചലച്ചിത്ര രംഗത്ത് സൃഷ്ടിപരമായ പരീക്ഷണങ്ങള് നടത്തുന്നതിനും ഡീപ് ഫേക്ക് വീഡിയോകള് വലിയ മുന്നേറ്റമാണ്. ഉദാഹരണത്തിന്, മഹാത്മാ ഗാന്ധിജിയുടെ വ്യക്തിപരമായ പ്രഭാഷണം ഒരു ഡോക്യുമെന്ററിയില് അവതരിപ്പിക്കുക, വിദ്യാര്ത്ഥികള്ക്ക് ആല്ബര്ട്ട് ഐന്സ്റ്റീന്റെ പ്രാചീന ആശയങ്ങള് അതിന്റെ യഥാര്ത്ഥ ഭാവത്തില് കാണിക്കാന് കഴിയുകപോലുള്ള കാര്യങ്ങള് ഡീപ്ഫേക്ക് വീഡിയോകളിലൂടെ സാധ്യമാകും.വിനോദമണ്ഡലത്തിലും ഇത് അതിശയകരമായ സംഭാവനകള് നല്കുന്നു. പഴയ കാലത്തിന്റെ അനുഭവങ്ങള് യഥാര്ത്ഥ ദൃശ്യങ്ങളിലൂടെ പുനരാവിഷ്കരിച്ച് ഒരു പുതിയ ലോകത്തെ സൃഷ്ടിക്കാം.
3 വാക്കിന്റെ മാധുര്യം: ഡീപ്ഫേക്ക് ടെക്സ്റ്റ്
ലോകം ഭ്രമിച്ചുകൊണ്ടിരിക്കുന്നിടത്തോളം, ഒരു എഴുത്തുകാരന് തന്റെ ശൈലിയിലുള്ള പുതിയ കഥകള് സൃഷിടിക്കില്ലേ? ഡീപ്ഫേക്ക് ടെക്സ്റ്റ് നമ്മുടെ പ്രിയപ്പെട്ട എഴുത്തുകാരന്റെ ശൈലി പുനരാവിഷ്കരിച്ച് പുതിയ താളങ്ങള് സൃഷ്ടിക്കുന്നു. ഡീപ്ഫേക്ക് ടെക്സ്റ്റ് എ.ഐ അടിസ്ഥാനപ്പെടുത്തിയുള്ള ഒരു സാങ്കേതിക വിദ്യയാണ്, ഇത് ഉപയോഗിച്ച് വ്യക്തികള് അല്ലെങ്കില് സ്ഥാപനങ്ങള് നടത്തിയതായി തോന്നിക്കുന്ന വ്യാജ എഴുത്തുകള് സൃഷ്ടിക്കാം. ഈ ടെക്സ്റ്റ് യഥാര്ത്ഥമെന്നു തോന്നിക്കാന് അത്രയധികം സുതാര്യമായ രീതിയിലാണ് സൃഷ്ടിക്കപ്പെടുന്നത്, അത് വായിക്കുന്നവര്ക്ക് അത് വ്യാജമാണെന്ന് തിരിച്ചറിയാന് പ്രയാസമായിരിക്കും.
ഉദാഹരണത്തിന്:
ഡീപ്ഫേക്ക് ടെക്സ്റ്റ് ജനറേറ്റീവ് പ്രീ-ട്രെയിൻഡ് ട്രാൻസ്ഫോർമേഴ്സ് (GPT) പോലുള്ള എ.ഐ മോഡലുകൾ ഉപയോഗിച്ച് സൃഷ്ടിക്കപ്പെടുന്നു.
അവസാനഫലം: സൃഷ്ടിച്ച ടെക്സ്റ്റ് യഥാർത്ഥ എഴുത്തുകാരന്റെ ശൈലിയും സന്ദേശവും ഒട്ടേറെ സമാനതയുള്ളതായിരിക്കും.
ChatGPT ഡീപ്ഫേക്ക് ?
ചാറ്റ്ജിപിടി ഒരു ആര്ട്ടിഫിഷ്യല് ഇന്റലിജന്സ് (AI) മോഡലാണ്, OpenAI എന്ന സാങ്കേതിക സ്ഥാപനമാണ് ഇത് വികസിപ്പിച്ചത്. GPT (Generative Pre-trained Transformer) എന്ന സാങ്കേതിക സംവിധാനത്തിന്റെ ഒരു പതിപ്പായ ചാറ്റ്ജിപിടി, മനുഷ്യരുടെ സംഭാഷണ ശൈലിയില് സ്വാഭാവികമായ ഉത്തരം നല്കുന്ന ഒരു എ.ഐ ചാറ്റ്ബോട്ട് ആയി പ്രവര്ത്തിക്കുന്നു.
ChatGPT ഡീപ് ലേണിംഗ് ഉപയോഗിച്ച് മനുഷ്യന് എഴുതിയതുപോലുള്ള സിന്തറ്റിക് ടെക്സ്റ്റ് സൃഷ്ടിക്കുന്നു. ഇത് GAN-കളെ പോലെ പ്രാമാണികമെന്ന് തോന്നിപ്പിക്കുന്ന തെറ്റായ ഉള്ളടക്കം സൃഷ്ടിക്കാന് കഴിവുള്ളതുകൊണ്ട് ഡീപ്ഫേക്ക് എന്ന പദവുമായി ബന്ധിപ്പിക്കാം. ChatGPT അതിന്റെ ഡാറ്റ ഉപയോഗിച്ച് സമൂഹത്തിന്റെ നാനാതുറകുളിലുള്ള പ്രശസ്തരെ അനുകരിക്കാന് സാധിക്കും. അത് ചെയ്യുമ്പോള്ഡീപ്ഫേക്ക് ടെക്സ്റ്റ് ആണ് ഉണ്ടാക്കുന്നത്.
ഡീപ്ഫേക്കിനെ എങ്ങനെ തിരിച്ചറിയാം ?
2018 മുതല് Deepfake AIക്ക് വളരെയധികം പുരോഗതി വന്നിട്ടുണ്ട്. ഇപ്പോള് നമ്മുടെ നഗ്നനേത്രങ്ങള് കൊണ്ട് ഇത് തിരിച്ചറിയാന് വളരെയധികം ബുദ്ധിമുട്ടാണ്. താഴെ ഉള്ള ഗ്രാഫ് കഴിഞ്ഞ 8 കൊല്ലങ്ങളായി ഇത് എത്രത്തോളം ഉന്നതി പ്രാപിച്ചു എന്ന് വ്യക്തമാകും.
നമ്മുടെ കണ്ണുകള്ക്കും കാതുകള്ക്കും ബുദ്ധിക്കും ഡീപ്ഫേക്ക് നിര്മിതികള് തിരിച്ചറിയാന് പ്രയാസകരമായിരിക്കും. പക്ഷെ അത് തിരിച്ചറിയുന്ന സോഫ്റ്റ്വെയറുകള് ധാരാളമുണ്ട്. AI ഉപയോഗിച്ച് ചെയ്യുന്ന എന്തിനും നിയതമായ പാറ്റേണുകള് ഉണ്ടാകും. ഈ പാറ്റേണുകള് തിരിച്ചറിയുകയാണ് ഇങ്ങനെയുള്ള ഡിസ്ക്രിമിനേറ്റിങ് AI സോഫ്റ്റ്വെയര് ചെയ്യുന്നത്. താഴെ കാണുന്നത് ഈ സോഫ്റ്റ്വെയറിനു നാം ആദ്യം നിര്മ്മിച്ച AI ഡീപ്ഫയ്ക് ചിത്രം കൊടുത്തു.
ഡീപ്ഫേക്ക് ഡിസ്ക്രിമിനേറ്റിങ് AI സോഫ്റ്റ്വെയർ ഔട്ട്പുട്ട്
നമ്മുടെ നഗ്നനേത്രങ്ങള്ക്കു യാഥാര്ഥ്യമാണോ എന്ന് മനസ്സിലാക്കുവാന് ബുദ്ധിമുട്ടുള്ള ഈ ചിത്രത്തെ കുറിച്ച് Discriminating (വ്യതിരിക്ത)സോഫ്റ്റ്വെയര് പറയുന്നത് 99 % ഇത് ഡീപ്ഫേക്ക് ആണെന്നാണ്. ടെക്സ്റ്റും ശബ്ദങ്ങളും ഈ രീതിയില് പരിശോധിക്കുവാന് സാധിക്കും.
അതേസമയം കോപ്പിറൈറ്റഡ് ഇമേജ് സൈറ്റ് ആയ Envato യില് നിന്ന് ഒരു ഒരു പൂച്ചയുടെ ഒറിജിനല് ചിത്രം ഡീപ് ഫേക്ക് നിര്ധാരണം ചെയ്യാന് കൊടുത്തപ്പോള് കിട്ടുന്ന ഫലം നോക്കൂ.
ഡീപ്ഫേക്ക് ഡിസ്ക്രിമിനേറ്റിങ് AI സോഫ്റ്റ്വെയർ ഔട്ട്പുട്ട്
നൽകിയിരിക്കുന്ന ചിത്രം AI സൃഷ്ടിച്ചതല്ലെന്ന് ഉയർന്ന ആത്മവിശ്വാസത്തോടെ ഇത് പറയുന്നു.
ഡീപ്ഫേക്ക് തിരിച്ചറിയുന്നതിൽ ഡിസ്ക്രിമിനേറ്റിങ് എ.ഐ.യുടെ പങ്ക്:
ഡീപ്ഫേക്ക് (Deepfake) എ.ഐയെ തിരിച്ചറിയാൻ കൃത്രിമ ബുദ്ധിയുള്ള (AI) സംവിധാനം, പ്രത്യേകിച്ചും ഡിസ്ക്രിമിനേറ്റിങ് മോഡലുകൾ ഉപയോഗിക്കുന്നു. ഇവയുടെ പ്രവർത്തനം ചുരുക്കത്തിൽ പറയാം:
എ.ഐ. മോഡലുകള് മനുഷ്യന്റെ മുഖത്തിലുള്ള സ്വാഭാവിക ചലനങ്ങള്, കണ്ണിന്റെ ഉതിപ്പ്, അധരചലനം, തൊലിയിലെ പ്രകാശം തുടങ്ങിയവ സൂക്ഷ്മമായി വിശകലനം ചെയ്യുന്നു. ഡീപ്ഫേക്കില് ഇവ കൃത്യതയില്ലാതെ കാണപ്പെടാറുണ്ട്.
മനുഷ്യന് ചെയ്യുന്ന സൂക്ഷ്മമായ മുഖവികാരങ്ങള് (micro-expressions) പകര്ത്താന് ഡീപ്ഫേക്ക് എഞ്ചിനുകള്ക്ക് സാധിക്കാറില്ല. ഡിസ്ക്രിമിനേറ്റിങ് എ.ഐ. ഇത്തരം എക്സ്പ്രഷനുകള് പരിശോധിച്ച് വ്യത്യാസം കണ്ടുപിടിക്കുന്നു.
ഓരോ ഫ്രെയിമിലും മുഖഭാഗങ്ങള് തുല്യമായി മാറുന്നുണ്ടോ എന്ന് എ.ഐ. പരിശോധിക്കുന്നു. ഡീപ്ഫേക്ക് വീഡിയോകളില് ഇത്തരം കണ്സിസ്റ്റന്സി കുറവായിരിക്കും.
സംസാരിക്കുന്ന സമയത്ത് ശബ്ദം അധരചലനത്തോട് പൊരുത്തപ്പെടുന്നതുണ്ടോ എന്ന് എ.ഐ. പരിശോധിക്കുന്നു. പൊരുത്തക്കേട് ഉണ്ടെങ്കില് അത് ഒരു സൂചനയായി ഉപയോഗിക്കുന്നു.
കണ്ണിന്റെ തിളക്കം, ചെറു നാഡി ചലനങ്ങള്, ഹൃദയമിടിപ്പിന്റെ മൂര്ച്ച എന്നിവ പോലുള്ള സൂക്ഷ്മമായ ബയോഫിസിക്കല് ഡാറ്റയും പുതിയ എ.ഐ. മോഡലുകള് പരിശോധിക്കുന്നു.
ഡീപ്ഫേക്ക് ചിത്രങ്ങളില് ചില പിക്സല് ലെവല് അപാകതകള് കാണാം – പ്രത്യേകിച്ച് മുഖത്തിന്റെയും ചുറ്റുപാടുകളുടെയും അതിര്ത്തികളില്. എ.ഐ. മോഡലുകള് ഇത്തരം സൂക്ഷ്മമായ പിശകുകള് തിരിച്ചറിയാന് പ്രായോഗികമായി പരിശീലിപ്പിച്ചിരിക്കുന്നു.
പ്രകാശം പ്രകൃതിപ്രദമായ രീതിയില് വീണിട്ടുണ്ടോ? വിയര്പ്പിന്റെ കണം, നിഴല്, കണ്ണിലെ പ്രതിബിംബം. ഡീപ്ഫേക്ക് ചിത്രങ്ങളില് ഇത് കൃത്യതയില്ലാതെയായിരിക്കും.
കണ്ണിന്റെ അകത്ത് പ്രതിഫലിക്കുന്ന വെളിച്ചം (reflection), pupil dilation, തുടങ്ങിയവ സാധാരണ എഐ ജനറേറ്റഡ് ചിത്രങ്ങളില് യാഥാര്ത്ഥ്യത്തോട് പൊരുത്തപ്പെടുന്നില്ല. GAN-നെറ്റുകള്ക്കിത് പകര്ത്താന് ബുദ്ധിമുട്ടാണ്.
ചിത്രങ്ങള് പരിശോധിക്കുന്നതിനുള്ള ചില ഓൺലൈൻ ടൂളുകൾ
ഡീപ്ഫെയ്ക്കും നൈതികതയും പകർപ്പവകാശ ലംഘനവും
നൈതികതയുടെ നിര്വചനങ്ങള് മാറ്റുന്ന തരത്തിലേക്ക് AI യും ഡീപ്ഫെയ്ക്കുംകാര്യങ്ങള് കൊണ്ടുവന്നെത്തിച്ചിരിക്കുന്നു. ഒന്നാമതായി പറയുകയാണെങ്കില് ഈ GAN അല്ലെങ്കില് GPT മോഡല് ഉണ്ടാക്കുമ്പോള് തന്നെ പകര്പ്പവകാശ ലംഘനം നടന്നു കഴിഞ്ഞു. ChatGPT, Dalle പോലെയുള്ള മോഡലുകള് നമുക്ക് ചിന്തിക്കാന്കഴിയുന്നതിനും അപ്പുറത്തുള്ള ഡാറ്റ ശേഖരം ട്രെയിന് ചെയ്തു കഴിഞ്ഞു.
പഠിപ്പിച്ചത് മാത്രമേ മോഡലുകള്ക്ക് ചെയ്യാന് കഴിയൂ. രവീന്ദ്ര നാഥ ടാഗോറിന്റെ രചനകളുടെ സവിശേഷതകള് മനസ്സിലാക്കിയാല് മാത്രമേ മോഡലിന് മഴയെ പറ്റി രവീന്ദ്ര നാഥ ടാഗോറിന്റെ ഭാവത്തില് കവിത രചിക്കുവാന് കഴിയൂ. വാന്ഗോഗിന്റെ ചിത്രങ്ങള് അപഗ്രഥിച്ച GAN മോഡലിന് മാത്രമേ അദ്ദേഹത്തിന്റെ രീതിയില് ചിത്രം വരയ്ക്കാന് കഴിയു.
ലാര്ജ് ലാംഗ്വേജ് മോഡലുകളും (LLM) ജനറേറ്റീവ് അഡ്വേര്സേറിയല് നെറ്റ്വര്ക്കുകളും (GAN) പകര്പ്പവകാശ മേഖലയില് കാര്യമായ വെല്ലുവിളികള് ഉയര്ത്തുന്നു. ഈ AI സിസ്റ്റങ്ങള് വിപുലമായ ഡാറ്റാസെറ്റുകളില് പരിശീലിപ്പിക്കപ്പെടുന്നു, പലപ്പോഴും പകര്പ്പവകാശമുള്ള മെറ്റീരിയലുകള് ഉള്പ്പെട്ടേക്കാവുന്ന പൊതുവായി ലഭ്യമായ ഉള്ളടക്കത്തില് നിന്നാണ്. വ്യക്തമായ അനുമതിയില്ലാതെ ഈ കൃതികള് ഉപയോഗിക്കുന്നത് അത്തരം പ്രവര്ത്തനങ്ങളുടെ നിയമസാധുതയെക്കുറിച്ച് ചോദ്യങ്ങള് ഉയര്ത്തുന്നു.
AI പരിശീലനം ‘ന്യായമായ ഉപയോഗത്തിന്’ കീഴിലാണെന്ന് ചിലര് വാദിക്കുമ്പോള്, നിയമപരമായ വ്യാഖ്യാനങ്ങള് അധികാരപരിധിയിലുടനീളം വ്യത്യാസപ്പെടുന്നു, ഇത് പ്രശ്നം പരിഹരിക്കപ്പെടാതെ അവശേഷിക്കുന്നു. കൂടാതെ, AI- ജനറേറ്റഡ് ഔട്ട്പുട്ടുകള്-ടെക്സ്റ്റോ ചിത്രങ്ങളോ സംഗീതമോ ആകട്ടെ-പലപ്പോഴും മനുഷ്യന്റെ സര്ഗ്ഗാത്മകതയുമായി സാമ്യമുള്ളതാണ്, ഉടമസ്ഥാവകാശത്തെക്കുറിച്ചുള്ള ചോദ്യങ്ങള് സങ്കീര്ണ്ണമാക്കുന്നു. അത്തരം ഔട്ട്പുട്ടുകളില് അബദ്ധവശാല് പകര്പ്പവകാശമുള്ള മെറ്റീരിയല് ആവര്ത്തിക്കുകയാണെങ്കില്, അവ ബൗദ്ധിക സ്വത്തവകാശ നിയമങ്ങള് ലംഘിക്കാന് സാധ്യതയുള്ള ഡെറിവേറ്റീവ് വര്ക്കുകളായി തരംതിരിക്കപ്പെടും.
AI സൃഷ്ടിച്ച ഉള്ളടക്കത്തിന്റെ ഉടമസ്ഥാവകാശം വരെ അവ്യക്തത വ്യാപിക്കുന്നു. AI-ക്ക് നിയമപരമായ വ്യക്തിത്വം ഇല്ലാത്തതിനാല്, നിലവിലെ നിയമങ്ങള് സാധാരണയായി AI-യുടെ ഉപയോക്താവിനോ ഡെവലപ്പര്ക്കോ ഉടമസ്ഥാവകാശം നല്കുന്നു. എന്നിരുന്നാലും, ഔട്ട്പുട്ട് നിലവിലുള്ള പ്രത്യേക സൃഷ്ടികളെ ശക്തമായി പ്രതിഫലിപ്പിക്കുന്ന സാഹചര്യങ്ങളെ ഈ ചട്ടക്കൂട് വേണ്ടത്ര അഭിസംബോധന ചെയ്യുന്നില്ല.
AI പരിശീലന ഡാറ്റാസെറ്റുകളിലെ സുതാര്യതയുടെ അഭാവം ഈ പ്രശ്നത്തെ സങ്കീര്ണ്ണമാക്കുന്നു, AI- ജനറേറ്റഡ് ഔട്ട്പുട്ടുകളിലെ നിര്ദ്ദിഷ്ട ഘടകങ്ങളുടെ ഉത്ഭവം കണ്ടെത്തുന്നത് ബുദ്ധിമുട്ടാക്കുന്നു. ഇത് മനഃപൂര്വമല്ലാത്ത കോപ്പിയടി, ഡെവലപ്പര്മാര്ക്കും ഉപയോക്താക്കള്ക്കും ഒരുപോലെ നിയമപരമായ അപകടസാധ്യതകള് എന്നിവ പോലുള്ള ധാര്മ്മിക പ്രതിസന്ധികള് സൃഷ്ടിക്കുന്നു.
പകർപ്പവകാശത്തിൻ്റെ ഭാവി
AI യുഗത്തിലെ പകര്പ്പവകാശത്തിന്റെ ഭാവി, സ്രഷ്ടാക്കളുടെ അവകാശങ്ങള് സംരക്ഷിക്കുന്നതിനൊപ്പം നവീകരണത്തെ പ്രോത്സാഹിപ്പിക്കുന്ന ഒരു സമതുലിതമായ നിയമ ചട്ടക്കൂട് സൃഷ്ടിക്കുന്നതിനെ ആശ്രയിച്ചിരിക്കുന്നു. സുതാര്യമായ ഡാറ്റാസെറ്റ് ഉപയോഗം, ലൈസന്സിംഗ് കരാറുകള്, ദുരുപയോഗത്തിനെതിരെ കൂടുതല് കര്ശനമായ നിര്വ്വഹണം എന്നിവ ആവശ്യമായ AI- നിര്ദ്ദിഷ്ട നിയന്ത്രണങ്ങള് നയനിര്മ്മാതാക്കള് സ്ഥാപിച്ചേക്കാം.
AI പരിശീലനത്തെ വ്യക്തമായി അഭിസംബോധന ചെയ്യുന്നതിനായി പുതിയ ചട്ടക്കൂടുകള് ‘ന്യായമായ ഉപയോഗം’ പുനര് നിര്വചിച്ചേക്കാം. ദീര്ഘകാലാടിസ്ഥാനത്തില്, പകര്പ്പവകാശം എന്ന ആശയം തന്നെ വികസിച്ചേക്കാം. AI പരിശീലനത്തില് ഉപയോഗിക്കുന്ന സ്രഷ്ടാക്കള്ക്കായി പങ്കിട്ട ഉടമസ്ഥാവകാശ മോഡലുകള്ക്കോ നഷ്ടപരിഹാര സംവിധാനങ്ങള്ക്കോ വ്യവസ്ഥകള് ഉണ്ടാവേണ്ടതാണ് .
ഉള്ളടക്ക സൃഷ്ടിയില് AI അവിഭാജ്യമാകുമ്പോള്, നവീകരണം പ്രാപ്തമാക്കുന്നതിനൊപ്പം ബൗദ്ധിക സ്വത്തിനെ ബഹുമാനിക്കുന്ന ഒരു ഭാവി ഉറപ്പാക്കാന് സ്രഷ്ടാക്കളും സാങ്കേതിക വിദഗ്ധരും നയരൂപീകരണക്കാരും തമ്മിലുള്ള സഹകരണം വളര്ത്തിയെടുക്കുന്നത് അത്യന്താപേക്ഷിതമാണ്.
സുതാര്യതയും ഉത്തരവാദിത്തവുമാണ് മറ്റൊരു നിര്ണായക പ്രശ്നം. LLM-കളും GAN-കളും പോലെയുള്ള AI സിസ്റ്റങ്ങള് ‘ബ്ലാക്ക് ബോക്സുകള്’ ആയി പ്രവര്ത്തിക്കുന്നു, തീരുമാനങ്ങള് അല്ലെങ്കില് ഔട്ട്പുട്ടുകള് എങ്ങനെ സൃഷ്ടിക്കപ്പെടുന്നു എന്ന് മനസ്സിലാക്കാന് ബുദ്ധിമുട്ടാണ്. ഈ അതാര്യത, അവരുടെ മോഡലുകള് മൂലമുണ്ടാകുന്ന ദോഷങ്ങള്ക്ക് ഡെവലപ്പര്മാരെ ഉത്തരവാദികളാക്കുന്നതില് വെല്ലുവിളികള് സൃഷ്ടിക്കുന്നു.
മാത്രവുമല്ല, AI- സൃഷ്ടിച്ച പ്രവൃത്തികളുടെ ഉടമസ്ഥതയെയും ക്രെഡിറ്റിനെയും ചുറ്റിപ്പറ്റിയുള്ള ധാര്മ്മിക പ്രതിസന്ധികള് ഉടലെടുക്കുന്നു. ഒരു AI ഒരു നിര്ദ്ദിഷ്ട കലാകാരന്റെ ശൈലി അനുകരിക്കുകയോ അല്ലെങ്കില് വാചകം കോപ്പിയടിക്കുകയോ ചെയ്താല്, ധാര്മ്മിക ഉപയോഗത്തെക്കുറിച്ചുള്ള ചോദ്യം മുന്നിലെത്തും.
നിയമങ്ങളും ടെക്നോളജിയും വേറൊരു തലത്തിലേക്ക് Deep Fake നെ എത്തിക്കുന്നു. ഈ കാര്യങ്ങളിലേക്ക് നിയമങ്ങള് ഉണ്ടാക്കുന്നത് തന്നെ അത്യന്തം ദുഷ്കരമാണ് . അടുത്തിടെ, പ്രശസ്ത വാര്ത്താ ഏജന്സിയായ ഏഷ്യന് ന്യൂസ് ഇന്റര്നാഷണല് (ANI), ChatGPT യുടെ സ്രഷ്ടാക്കളായ OpenAI ക്കെതിരെ പകര്പ്പവകാശ ലംഘന കേസ് ഫയല് ചെയ്തു. ഈ കേസ് ഇന്ത്യയില് ആദ്യമായി ഇന്ത്യയിലെ പകര്പ്പവകാശ നിയമ മേഖലയില് പുതിയ നിയമപരമായ മാതൃകകള് രൂപപ്പെടുത്തുന്നതിനുള്ള വാതില് തുറക്കുന്നു.
content highlights: Deepfake AI: The Step of Creation and the Shadow of Deception