ഡീപ്ഫേക്ക് എ.ഐ; സൃഷ്ടിയുടെ ചുവടും ചതിയുടെ നിഴലും
DISCOURSE
ഡീപ്ഫേക്ക് എ.ഐ; സൃഷ്ടിയുടെ ചുവടും ചതിയുടെ നിഴലും
ഷഫീക് റഹ്‌മാന്‍
Thursday, 8th May 2025, 12:43 pm
നമ്മുടെ കണ്ണുകള്‍ക്കും കാതുകള്‍ക്കും ബുദ്ധിക്കും ഡീപ്ഫേക്ക് നിര്‍മിതികള്‍ തിരിച്ചറിയാന്‍ പ്രയാസകരമായിരിക്കും. പക്ഷെ അത് തിരിച്ചറിയുന്ന സോഫ്റ്റ്‌വെയറുകള്‍ ധാരാളമുണ്ട്. AI ഉപയോഗിച്ച് ചെയ്യുന്ന എന്തിനും നിയതമായ പാറ്റേണുകള്‍ ഉണ്ടാകും. ഈ പാറ്റേണുകള്‍ തിരിച്ചറിയുകയാണ് ഇങ്ങനെയുള്ള ഡിസ്‌ക്രിമിനേറ്റിങ് AI സോഫ്റ്റ്‌വെയര്‍ ചെയ്യുന്നത്.

എ.ഐ. ഡീപ്‌ഫേക്ക് ടെക്നോളജിയുടെ സമഗ്രമായ ഒരു പുറം വിശകലനമാണ് ഈ ലേഖനത്തിലൂടെ ഉദ്ദേശിക്കുന്നത്. അതായത് ഡീപ്‌ഫേക്ക് ടെക്നോളജിയുടെ സങ്കീര്‍ണമായ സാങ്കേതിക വശങ്ങളിലേക്ക് പോകാതെയും അതേസമയം തന്നെ അതിന്റെ അര്‍ത്ഥ തലങ്ങളെക്കുറിച്ചും പ്രതിപാദിക്കുന്ന ലേഖനം.

കഴിഞ്ഞ ഒന്ന് രണ്ടു വര്‍ഷമായി ഡീപ്‌ഫേക്ക് ഉള്ളടക്കങ്ങള്‍ നമ്മുടെ ഇടയില്‍ സാധാരണമായിക്കഴിഞ്ഞിരിക്കുന്നു. സോഷ്യല്‍ മീഡിയകളിലൂടെയും ചാറ്റ് മെസന്‍ജറുകളിലൂടെയും അവ നിര്‍ലോഭം എല്ലായിടത്തും എത്തുന്നു. സത്യത്തില്‍ എന്താണ് ഈ ഡീപ്ഫയ്ക്ക്? അതറിയണമെങ്കില്‍ നമുക്ക് ഫേക്ക് എന്താണെന്നറിയണം.

മോര്‍ഫിംഗ്: ഒരു ദൃശ്യ വിപ്ലവത്തിന്റെ കഥ

മോര്‍ഫിംഗ് (morphing) എന്ന സാങ്കേതികവിദ്യയുടെ ആരംഭം ആധുനിക ഡിജിറ്റല്‍ എഫക്ടുകളുടെ ദിശയില്‍ ഒരു വലിയ ചുവടുവെപ്പായിരുന്നു. ഒരു ചിത്രം അല്ലെങ്കില്‍ വീഡിയോ ദൃശ്യത്തില്‍ നിന്നും മറ്റൊന്നിലേക്ക് താളമോ കൃത്യതയോ വിട്ടുകൂടാതെ സാങ്കേതികമായി മാറുന്ന പ്രക്രിയ ആണ് മോര്‍ഫിംഗ്. 1980-90 കളിലാണ് ഈ സാങ്കേതിക വിദ്യ രൂപം കൊണ്ടത്, പിന്നീട് അത് സിനിമ, ടെലിവിഷന്‍, ഗെയിമിംഗ്, എന്നിവയുടെ പ്രധാന ഭാഗമായി. ഈ ടെക്നോളജി ഉപയോഗിച്ച് ദൃശ്യങ്ങളില്‍ പല കൂട്ടിച്ചേര്‍ക്കലുകളും ആശ്ചര്യകരമായ വിധത്തില്‍ സന്നിവേശിപ്പിക്കാന്‍ സാധിച്ചു. എന്നിരുന്നാലും അനലിസ്റ്റുകള്‍ക്കും സൂക്ഷ്മമായി അപഗ്രഥിക്കുന്നവര്‍ക്കും അതിലെ കൂട്ടിച്ചേര്‍ക്കലുകള്‍ മനസ്സിലാക്കുവാന്‍ സാധിച്ചിരുന്നു. ഇതിനെ സാധാരണമായി നാം ഫേക്ക് എന്നാണ് പറയുന്നത് .

2014 മുതല്‍, ഡീപ്‌ഫേക്ക് സാങ്കേതിക വിദ്യയുടെ ഉദയം മറ്റൊരു തലത്തിലേക്ക് മനുഷ്യരുടെ സൃഷ്ടിപരമായ കഴിവുകളെ കൊണ്ടെത്തിച്ചു. ആര്‍ട്ടിഫിഷ്യല്‍ ഇന്റലിജന്‍സ് (എ.ഐ) വഴി വ്യക്തികളുടെ മുഖങ്ങള്‍, ശബ്ദങ്ങള്‍, ചലനങ്ങള്‍ എന്നിവ യഥാര്‍ത്ഥമെന്ന പോലെതന്നെ പുനര്‍സൃഷ്ടിക്കാനാവും. ജനറേറ്റീവ് അഡ്വേഴ്സറിയല്‍ നെറ്റ്വര്‍ക്കുകള്‍ (GNAs ) ഉപയോഗിച്ചാണ് ഡീപ്‌ഫേക്ക് പ്രവര്‍ത്തിക്കുന്നത്.

ഡീപ്ഫേക്ക് മോര്‍ഫിംഗില്‍ നിന്ന് എങ്ങനെ വ്യത്യസ്തമാണ്?

വിശേഷത മോര്‍ഫിംഗ് ഡീപ്ഫേക്ക്
സാങ്കേതിക വിധാനം ചിത്രങ്ങള്‍ പരിവര്‍ത്തനം ചെയ്യുക. എ.ഐ ഉപയോഗിച്ച് ഒരു പൂര്‍ണ്ണമായ ഡിജിറ്റല്‍ പുനരാവിഷ്‌കാരം.
യാഥാര്‍ത്ഥ്യം മോര്‍ഫിംഗ് ഫോട്ടോഷോപ്പ് പോലെയാണ്; പരിചയസമ്പന്നര്‍ക്കായി തിരിച്ചറിയാന്‍ സാധ്യമാകും. ഡീപ്ഫേക്ക് വളരെ യഥാര്‍ത്ഥം പോലെ തോന്നുന്നു. ശബ്ദം, ഭാവങ്ങള്‍ എല്ലാം സ്വാഭാവികം.
പ്രത്യാഘാതം പരിചിതമായ കണ്ണുകളില്‍ വ്യാജത തോന്നും. സത്യവും വ്യാജവും തമ്മില്‍ തിരിച്ചറിയാന്‍ പോലും സാധിക്കില്ല

GAN ജനറേറ്റീവ് AI ഡീപ്ഫേക്ക് എന്നുവിളിക്കുന്നത് എന്തുകൊണ്ട്?

ഡീപ്ഫേക്ക് എന്നതിന് ‘ഡീപ്’ എന്നത് എന്ത്?

  • GAN-കള്‍ ഡീപ് ലേണിംഗ് ഉപയോഗിക്കുന്നു.
  • ഡീപ് എന്നു പറയുന്നത് ന്യൂറല്‍ നെറ്റ്വര്‍ക്കുകളിലെ പല പാളികളേയും സൂചിപ്പിക്കുന്നു. ഇത് ഡാറ്റയിലെ സങ്കീര്‍ണ്ണമായ മാതൃകകളെ അടയാളപ്പെടുത്താന്‍ സഹായിക്കുന്നു.

ഡീപ്ഫേക്ക് എന്നതിന് ‘ഫേക്ക്’ എന്തുകൊണ്ട്?

  • GAN-കള്‍ ഫേക്ക് ഉള്ളടക്കം സൃഷ്ടിക്കാന്‍ വ്യാപകമായി ഉപയോഗിക്കുന്നു, പ്രത്യേകിച്ച് മനുഷ്യന്റെ മുഖങ്ങള്‍, ശബ്ദം, അല്ലെങ്കില്‍ മുഴുവന്‍ വീഡിയോകള്‍.
  • ഈ ഫേക്ക് പ്രൊഡക്ഷനുകള്‍ യഥാര്‍ത്ഥ ഉള്ളടക്കത്തെക്കാള്‍ വാസ്തവസംബന്ധമായതാണ്, അതുകൊണ്ട് ‘ഫേക്ക്’ എന്നു പറയുന്നു.

ഡീപ്ഫേക്ക് ഔട്പുട്ടുകളെ പ്രധാനമായും മൂന്നായി തരം തിരിക്കാം

1 ശബ്ദത്തിന്റെ കുതിപ്പ്: ഡീപ്ഫേക്ക് ഓഡിയോ

ഒരു ദിവസം, ഒരു വിദ്യാര്‍ത്ഥി തന്റെ ക്ലാസില്‍ അലക്സാണ്ടര്‍ ഗ്രഹാം ബെല്ലിന്റെ ശബ്ദത്തില്‍ ഫോണ്‍ ശാസ്ത്രത്തിന്റെ കഥ കേള്‍ക്കുന്നു. ഇത് പക്ഷേ ഡീപ്‌ഫേക്ക് എ.ഐ ഉപയോഗിച്ച് സൃഷ്ടിച്ചതാണ്.ചരിത്രപ്രസിദ്ധരായ ശാസ്ത്രജ്ഞര്‍, കലാകാരന്മാര്‍, നേതാക്കള്‍ എന്നിവരുടെ ശബ്ദം പുനരാവിഷ്‌കരിച്ച് കുട്ടികള്‍ക്കും സാമൂഹിക പ്രവര്‍ത്തനങ്ങള്‍ക്കും നമുക്ക് പുതിയൊരു അനുഭവം നല്‍കാം.

ഉദാഹരണത്തിന്,

  • ഗുരുത്വാകര്‍ഷണ തത്വത്തെ ന്യൂടണ്‍ സ്വന്തം ശബ്ദത്തില്‍ പറയുന്നതുപോലെ അവതരിപ്പിക്കാം.
  • പഠനത്തില്‍ ഉപയോഗിക്കാന്‍ അനുയോജ്യമായ ചലച്ചിത്രപരമായ ശബ്ദം പുനരാവിഷ്‌കരിച്ച് സംഗീത ആല്‍ബങ്ങള്‍ സൃഷ്ടിക്കാം.

ഈ സാങ്കേതിക വിദ്യക്ക് വോയ്സ് ക്ലോണിങ് എന്നും ജനറേറ്റീവ് AI ( ടെക്സ്റ്റ് to സ്പീച് ) എന്നും പറയാറുണ്ട് . മോര്‍ഫിങ് പോലെ തന്നെ വോയ്സ് ക്ലോണിങ്ങിന് യാഥാര്‍ത്ഥ ശബ്ദത്തോട് ഏറെ സാമ്യമുള്ള ശബ്ദങ്ങള്‍ സൃഷ്ടിക്കാന്‍ കഴിയും.

നിങ്ങളുടെ ഒരു 5 മിനിട്ട് ഓഡിയോ ഉപയോഗിച്ച് ഒരു ജനറേറ്റീവ് ഓഡിയോ മോഡല്‍ ട്രെയിന്‍ ചെയ്തു ശബ്ദങ്ങള്‍ പുനഃസൃഷ്ടിക്കുവാന്‍ കഴിയും. എന്നിരുന്നാലും വികാരപരമായി ശബ്ദങ്ങള്‍ ഉണ്ടാക്കുന്നതിനു ഇനിയും കടമ്പകള്‍ കടക്കാനുണ്ട് .

മനുഷ്യര്‍ ഓരോ അവസരങ്ങളിലും ഓരോ വികാരവായ്പ്പോടുകൂടിയാണ് സംസാരിക്കുന്നത്. അതുപോലെ തന്നെ ഒരു സ്‌പോര്‍ട്‌സ് കമന്ററി വായിക്കുന്നത് പോലെയല്ല സാമ്പത്തിക മേഖലയെ കുറിച്ചുള്ള വാര്‍ത്ത വായിക്കുന്നത്. ഇത്തരം വികാരങ്ങള്‍ വാക്കിലേക്ക് സന്നിവേശിപ്പിക്കാന്‍ വേണ്ട പ്രവര്‍ത്തങ്ങളാണ് ഇപ്പോള്‍ നടന്നു വരുന്നത്. മലയാളത്തിലെ ആദ്യത്തെ ന്യൂസ്റീഡിങ് വോയിസിന്റെ സാമ്പിള്‍ ഓഡിയോ ഇവിടെ  കേൾക്കാം.

2 ദൃശ്യങ്ങളുടെ വിസ്മയം: ഡീപ്‌ഫേക്ക് വീഡിയോ /ചിത്രങ്ങൾ

ഒരു ദിവസം, അനുശ്രീ എന്ന വിദ്യാര്‍ത്ഥിനി തന്റെ ഫോണില്‍ ഒരു വീഡിയോ കണ്ടു. അതില്‍, പ്രശസ്ത രാഷ്ട്രീയ നേതാവിന്റെ അനൗചിത്യമായ പെരുമാറ്റം ശ്രദ്ധയില്‍ പെട്ടു. ഇദ്ദേഹത്തിന്റെ മുഖം വളരെയധികം പരിചിതമായി തോന്നി.പിന്നീട്, സുഹൃത്ത് അവളോട് പറഞ്ഞു: ‘അത് ഡീപ്‌ഫേക്ക് ആകാം!’

അവള്‍ അതിനെപ്പറ്റി വിശദമായി പഠിച്ചു. ഡീപ്‌ഫേക്ക് വീഡിയോ എന്നത് ആര്‍ട്ടിഫിഷ്യല്‍ ഇന്റലിജന്‍സ് (AI) ഉപയോഗിച്ച് ഒരു വ്യക്തിയുടെ മുഖവും ശബ്ദവും മറ്റൊരാളുടെ ശരീരത്തില്‍ ചേര്‍ത്ത് ഒറിജിനല്‍ പോലെയുള്ള വ്യാജ ചിത്രങ്ങളും വീഡിയോകളും സൃഷ്ടിക്കുന്ന സാങ്കേതിക വിദ്യയാണ്. ഇത് മുഖവിന്യാസത്തില്‍ സൂക്ഷ്മമായ മാറ്റങ്ങള്‍ ചെയ്യുകയും യഥാര്‍ത്ഥ ദൃശ്യമെന്ന തോന്നല്‍ ഉണ്ടാക്കുകയും ചെയ്യുന്നു.

ഉദാഹരണത്തിന്, ഒരു വീഡിയോയില്‍ നിങ്ങള്‍ നടന്‍ മമ്മൂട്ടി പാടുന്നത് കാണുമ്പോള്‍, അത് മമ്മൂട്ടി തന്നെ ആകുമെന്ന് നിങ്ങള്‍ കരുതും. എന്നാല്‍, ഡീപ്‌ഫേക്ക് ടെക്‌നോളജിയിലൂടെ മറ്റൊരാളുടെ ശരീരത്തിനും ശബ്ദത്തിനും മമ്മൂട്ടിയുടെ മുഖം ചേര്‍ത്താണ് അത് സൃഷ്ടിച്ചത്.

ഇമേജുകള്‍ക്കായി, ഒരാളുടെ ഫോട്ടോയില്‍ മറ്റൊരാളുടെ മുഖം പകര്‍ത്തി, അത് യഥാര്‍ത്ഥ ചിത്രമാണെന്ന് തോന്നിക്കുന്ന വിധത്തില്‍ മാറ്റം വരുത്താനാകും. ഈ ചിത്രങ്ങളും വീഡിയോകളും പ്രൊഫഷണല്‍ ആയാല്‍, ഒറിജിനലില്‍ നിന്ന് വേര്‍തിരിച്ചറിയുന്നത് വളരെ പ്രയാസകരമായിരിക്കും.

An image of a cat created using deepfake AI

ഡീപ്‌ഫേക്ക്  AI  ഉപയോഗിച്ച്  നിർമിച്ച ഒരു  ഒരു പൂച്ചയുടെ ചിത്രം

പഴയ ചരിത്ര സംഭവങ്ങള്‍ വീണ്ടെടുക്കുന്നതിനുംചലച്ചിത്ര രംഗത്ത് സൃഷ്ടിപരമായ പരീക്ഷണങ്ങള്‍ നടത്തുന്നതിനും ഡീപ് ഫേക്ക് വീഡിയോകള്‍ വലിയ മുന്നേറ്റമാണ്. ഉദാഹരണത്തിന്, മഹാത്മാ ഗാന്ധിജിയുടെ വ്യക്തിപരമായ പ്രഭാഷണം ഒരു ഡോക്യുമെന്ററിയില്‍ അവതരിപ്പിക്കുക, വിദ്യാര്‍ത്ഥികള്‍ക്ക് ആല്‍ബര്‍ട്ട് ഐന്‍സ്റ്റീന്റെ പ്രാചീന ആശയങ്ങള്‍ അതിന്റെ യഥാര്‍ത്ഥ ഭാവത്തില്‍ കാണിക്കാന്‍ കഴിയുകപോലുള്ള കാര്യങ്ങള്‍ ഡീപ്ഫേക്ക് വീഡിയോകളിലൂടെ സാധ്യമാകും.വിനോദമണ്ഡലത്തിലും ഇത് അതിശയകരമായ സംഭാവനകള്‍ നല്‍കുന്നു. പഴയ കാലത്തിന്റെ അനുഭവങ്ങള്‍ യഥാര്‍ത്ഥ ദൃശ്യങ്ങളിലൂടെ പുനരാവിഷ്‌കരിച്ച് ഒരു പുതിയ ലോകത്തെ സൃഷ്ടിക്കാം.

3 വാക്കിന്റെ മാധുര്യം: ഡീപ്‌ഫേക്ക് ടെക്സ്റ്റ്

ലോകം ഭ്രമിച്ചുകൊണ്ടിരിക്കുന്നിടത്തോളം, ഒരു എഴുത്തുകാരന്‍ തന്റെ ശൈലിയിലുള്ള പുതിയ കഥകള്‍ സൃഷിടിക്കില്ലേ? ഡീപ്ഫേക്ക് ടെക്സ്റ്റ് നമ്മുടെ പ്രിയപ്പെട്ട എഴുത്തുകാരന്റെ ശൈലി പുനരാവിഷ്‌കരിച്ച് പുതിയ താളങ്ങള്‍ സൃഷ്ടിക്കുന്നു. ഡീപ്‌ഫേക്ക് ടെക്സ്റ്റ് എ.ഐ അടിസ്ഥാനപ്പെടുത്തിയുള്ള ഒരു സാങ്കേതിക വിദ്യയാണ്, ഇത് ഉപയോഗിച്ച് വ്യക്തികള്‍ അല്ലെങ്കില്‍ സ്ഥാപനങ്ങള്‍ നടത്തിയതായി തോന്നിക്കുന്ന വ്യാജ എഴുത്തുകള്‍ സൃഷ്ടിക്കാം. ഈ ടെക്സ്റ്റ് യഥാര്‍ത്ഥമെന്നു തോന്നിക്കാന്‍ അത്രയധികം സുതാര്യമായ രീതിയിലാണ് സൃഷ്ടിക്കപ്പെടുന്നത്, അത് വായിക്കുന്നവര്‍ക്ക് അത് വ്യാജമാണെന്ന് തിരിച്ചറിയാന്‍ പ്രയാസമായിരിക്കും.

ഉദാഹരണത്തിന്:

  • ഒരു പ്രസിദ്ധ വ്യക്തി ഒരു ട്വിറ്റര്‍(X) പോസ്റ്റില്‍ വിവാദ പരാമര്‍ശം നടത്തിയതായി പ്രചരിപ്പിക്കുന്ന ഒരു വ്യാജ ലേഖനം.
  • ഒരു കമ്പനി ഔദ്യോഗിക പ്രസ്താവന നല്‍കിയതായി തോന്നിപ്പിക്കുന്ന വ്യാജ പ്രസ് റീലീസ്.
  • രവീന്ദ്രനാഥ ടാഗോറിന്റെ ശൈലിയില്‍ കവിതയെഴുതുക.
  • ശബ്ദതരംഗങ്ങളുമായി ബന്ധപ്പെട്ട ഒരു സിദ്ധാന്തം ഗബ്രിയേല്‍ മര്‍ക്കസ് ശൈലിയില്‍ എഴുതുക.

എങ്ങനെയാണ് ഇത് സൃഷ്ടിക്കപ്പെടുന്നത്?

ഡീപ്ഫേക്ക് ടെക്സ്റ്റ് ജനറേറ്റീവ് പ്രീ-ട്രെയിൻഡ് ട്രാൻസ്‌ഫോർമേഴ്‌സ് (GPT) പോലുള്ള എ.ഐ മോഡലുകൾ ഉപയോഗിച്ച് സൃഷ്ടിക്കപ്പെടുന്നു.

  • ഉപയോക്താവിന്റെ എഴുത്ത് ശൈലി പഠിക്കാന്‍ എ.ഐ ട്രെയിനിങ് നടത്തി.
  • അത് ഉപയോഗിച്ച് സമാനമായ വാചകഘടനയിലും ഭാഷശൈലിയിലും പുതിയ ടെക്സ്റ്റ് ജനറേറ്റ് ചെയ്യുന്നു.

അവസാനഫലം: സൃഷ്ടിച്ച ടെക്സ്റ്റ് യഥാർത്ഥ എഴുത്തുകാരന്റെ ശൈലിയും സന്ദേശവും ഒട്ടേറെ സമാനതയുള്ളതായിരിക്കും.

ChatGPT ഡീപ്ഫേക്ക് ?

ചാറ്റ്ജിപിടി ഒരു ആര്‍ട്ടിഫിഷ്യല്‍ ഇന്റലിജന്‍സ് (AI) മോഡലാണ്, OpenAI എന്ന സാങ്കേതിക സ്ഥാപനമാണ് ഇത് വികസിപ്പിച്ചത്. GPT (Generative Pre-trained Transformer) എന്ന സാങ്കേതിക സംവിധാനത്തിന്റെ ഒരു പതിപ്പായ ചാറ്റ്ജിപിടി, മനുഷ്യരുടെ സംഭാഷണ ശൈലിയില്‍ സ്വാഭാവികമായ ഉത്തരം നല്‍കുന്ന ഒരു എ.ഐ ചാറ്റ്‌ബോട്ട് ആയി പ്രവര്‍ത്തിക്കുന്നു.

ChatGPT ഡീപ് ലേണിംഗ് ഉപയോഗിച്ച് മനുഷ്യന്‍ എഴുതിയതുപോലുള്ള സിന്തറ്റിക് ടെക്സ്റ്റ് സൃഷ്ടിക്കുന്നു. ഇത് GAN-കളെ പോലെ പ്രാമാണികമെന്ന് തോന്നിപ്പിക്കുന്ന തെറ്റായ ഉള്ളടക്കം സൃഷ്ടിക്കാന്‍ കഴിവുള്ളതുകൊണ്ട് ഡീപ്‌ഫേക്ക് എന്ന പദവുമായി ബന്ധിപ്പിക്കാം. ChatGPT അതിന്റെ ഡാറ്റ ഉപയോഗിച്ച് സമൂഹത്തിന്റെ നാനാതുറകുളിലുള്ള പ്രശസ്തരെ അനുകരിക്കാന്‍ സാധിക്കും. അത് ചെയ്യുമ്പോള്‍ഡീപ്‌ഫേക്ക് ടെക്സ്റ്റ് ആണ് ഉണ്ടാക്കുന്നത്.

ഡീപ്‌ഫേക്കിനെ എങ്ങനെ  തിരിച്ചറിയാം ? 

2018 മുതല്‍ Deepfake AIക്ക് വളരെയധികം പുരോഗതി വന്നിട്ടുണ്ട്. ഇപ്പോള്‍ നമ്മുടെ നഗ്‌നനേത്രങ്ങള്‍ കൊണ്ട് ഇത് തിരിച്ചറിയാന്‍ വളരെയധികം ബുദ്ധിമുട്ടാണ്. താഴെ ഉള്ള ഗ്രാഫ് കഴിഞ്ഞ 8 കൊല്ലങ്ങളായി ഇത് എത്രത്തോളം ഉന്നതി പ്രാപിച്ചു എന്ന് വ്യക്തമാകും.

നമ്മുടെ കണ്ണുകള്‍ക്കും കാതുകള്‍ക്കും ബുദ്ധിക്കും ഡീപ്ഫേക്ക് നിര്‍മിതികള്‍ തിരിച്ചറിയാന്‍ പ്രയാസകരമായിരിക്കും. പക്ഷെ അത് തിരിച്ചറിയുന്ന സോഫ്റ്റ്‌വെയറുകള്‍ ധാരാളമുണ്ട്. AI ഉപയോഗിച്ച് ചെയ്യുന്ന എന്തിനും നിയതമായ പാറ്റേണുകള്‍ ഉണ്ടാകും. ഈ പാറ്റേണുകള്‍ തിരിച്ചറിയുകയാണ് ഇങ്ങനെയുള്ള ഡിസ്‌ക്രിമിനേറ്റിങ് AI സോഫ്റ്റ്‌വെയര്‍ ചെയ്യുന്നത്. താഴെ കാണുന്നത് ഈ സോഫ്റ്റ്‌വെയറിനു നാം ആദ്യം നിര്‍മ്മിച്ച AI ഡീപ്ഫയ്ക് ചിത്രം കൊടുത്തു.

 Deepfake AI discrete software output

ഡീപ്‌ഫേക്ക് ഡിസ്ക്രിമിനേറ്റിങ് AI സോഫ്റ്റ്‌വെയർ  ഔട്ട്പുട്ട്

നമ്മുടെ നഗ്‌നനേത്രങ്ങള്‍ക്കു യാഥാര്‍ഥ്യമാണോ എന്ന് മനസ്സിലാക്കുവാന്‍ ബുദ്ധിമുട്ടുള്ള ഈ ചിത്രത്തെ കുറിച്ച് Discriminating (വ്യതിരിക്ത)സോഫ്റ്റ്വെയര്‍ പറയുന്നത് 99 % ഇത് ഡീപ്ഫേക്ക് ആണെന്നാണ്. ടെക്സ്റ്റും ശബ്ദങ്ങളും ഈ രീതിയില്‍ പരിശോധിക്കുവാന്‍ സാധിക്കും.

അതേസമയം കോപ്പിറൈറ്റഡ് ഇമേജ് സൈറ്റ് ആയ Envato യില്‍ നിന്ന് ഒരു ഒരു പൂച്ചയുടെ ഒറിജിനല്‍ ചിത്രം ഡീപ് ഫേക്ക് നിര്‍ധാരണം ചെയ്യാന്‍ കൊടുത്തപ്പോള്‍ കിട്ടുന്ന ഫലം നോക്കൂ.

Deepfake AI discrete software output

ഡീപ്‌ഫേക്ക് ഡിസ്ക്രിമിനേറ്റിങ് AI സോഫ്റ്റ്‌വെയർ ഔട്ട്പുട്ട്

നൽകിയിരിക്കുന്ന ചിത്രം AI സൃഷ്ടിച്ചതല്ലെന്ന് ഉയർന്ന ആത്മവിശ്വാസത്തോടെ ഇത് പറയുന്നു.

ഡീപ്‌ഫേക്ക് തിരിച്ചറിയുന്നതിൽ ഡിസ്ക്രിമിനേറ്റിങ് എ.ഐ.യുടെ പങ്ക്:

ഡീപ്‌ഫേക്ക് (Deepfake)  എ.ഐയെ തിരിച്ചറിയാൻ കൃത്രിമ ബുദ്ധിയുള്ള (AI) സംവിധാനം, പ്രത്യേകിച്ചും ഡിസ്ക്രിമിനേറ്റിങ് മോഡലുകൾ ഉപയോഗിക്കുന്നു. ഇവയുടെ പ്രവർത്തനം ചുരുക്കത്തിൽ പറയാം:

  • ഫേഷ്യല്‍ ഫീച്ചറുകള്‍ വിശകലനം

എ.ഐ. മോഡലുകള്‍ മനുഷ്യന്റെ മുഖത്തിലുള്ള സ്വാഭാവിക ചലനങ്ങള്‍, കണ്ണിന്റെ ഉതിപ്പ്, അധരചലനം, തൊലിയിലെ പ്രകാശം തുടങ്ങിയവ സൂക്ഷ്മമായി വിശകലനം ചെയ്യുന്നു. ഡീപ്ഫേക്കില്‍ ഇവ കൃത്യതയില്ലാതെ കാണപ്പെടാറുണ്ട്.

  • മൈക്രോ-എക്‌സ്പ്രഷനുകള്‍ (Subtle Expressions)

മനുഷ്യന്‍ ചെയ്യുന്ന സൂക്ഷ്മമായ മുഖവികാരങ്ങള്‍ (micro-expressions) പകര്‍ത്താന്‍ ഡീപ്ഫേക്ക് എഞ്ചിനുകള്‍ക്ക് സാധിക്കാറില്ല. ഡിസ്‌ക്രിമിനേറ്റിങ് എ.ഐ. ഇത്തരം എക്‌സ്പ്രഷനുകള്‍ പരിശോധിച്ച് വ്യത്യാസം കണ്ടുപിടിക്കുന്നു.

  • ഫ്രെയിം-ടു-ഫ്രെയിം കണ്‍സിസ്റ്റന്‍സി

ഓരോ ഫ്രെയിമിലും മുഖഭാഗങ്ങള്‍ തുല്യമായി മാറുന്നുണ്ടോ എന്ന് എ.ഐ. പരിശോധിക്കുന്നു. ഡീപ്ഫേക്ക് വീഡിയോകളില്‍ ഇത്തരം കണ്‍സിസ്റ്റന്‍സി കുറവായിരിക്കും.

  • ശബ്ദം-മുഖചലന കോര്‍ഡിനേഷന്‍

സംസാരിക്കുന്ന സമയത്ത് ശബ്ദം അധരചലനത്തോട് പൊരുത്തപ്പെടുന്നതുണ്ടോ എന്ന് എ.ഐ. പരിശോധിക്കുന്നു. പൊരുത്തക്കേട് ഉണ്ടെങ്കില്‍ അത് ഒരു സൂചനയായി ഉപയോഗിക്കുന്നു.

  • ബയോമെട്രിക് ഇന്‍ഡിക്കേറ്ററുകള്‍

കണ്ണിന്റെ തിളക്കം, ചെറു നാഡി ചലനങ്ങള്‍, ഹൃദയമിടിപ്പിന്റെ മൂര്‍ച്ച എന്നിവ പോലുള്ള സൂക്ഷ്മമായ ബയോഫിസിക്കല്‍ ഡാറ്റയും പുതിയ എ.ഐ. മോഡലുകള്‍ പരിശോധിക്കുന്നു.

  • പിക്സല്‍ ലെവല്‍ അനാലിസിസ് (Pixel-level Analysis)

ഡീപ്ഫേക്ക് ചിത്രങ്ങളില്‍ ചില പിക്സല്‍ ലെവല്‍ അപാകതകള്‍ കാണാം – പ്രത്യേകിച്ച് മുഖത്തിന്റെയും ചുറ്റുപാടുകളുടെയും അതിര്‍ത്തികളില്‍. എ.ഐ. മോഡലുകള്‍ ഇത്തരം സൂക്ഷ്മമായ പിശകുകള്‍ തിരിച്ചറിയാന്‍ പ്രായോഗികമായി പരിശീലിപ്പിച്ചിരിക്കുന്നു.

  • ലൈറ്റിംഗ് ഇന്‍കണ്‍സിസ്റ്റന്‍സി (Lighting Inconsistency)

പ്രകാശം പ്രകൃതിപ്രദമായ രീതിയില്‍ വീണിട്ടുണ്ടോ? വിയര്‍പ്പിന്റെ കണം, നിഴല്‍, കണ്ണിലെ പ്രതിബിംബം. ഡീപ്ഫേക്ക് ചിത്രങ്ങളില്‍ ഇത് കൃത്യതയില്ലാതെയായിരിക്കും.

  • ഐറിസ് & കണ്ണിലെ പ്രതിബിംബം (Iris and Reflections)

കണ്ണിന്റെ അകത്ത് പ്രതിഫലിക്കുന്ന വെളിച്ചം (reflection), pupil dilation, തുടങ്ങിയവ സാധാരണ എഐ ജനറേറ്റഡ് ചിത്രങ്ങളില്‍ യാഥാര്‍ത്ഥ്യത്തോട് പൊരുത്തപ്പെടുന്നില്ല. GAN-നെറ്റുകള്‍ക്കിത് പകര്‍ത്താന്‍ ബുദ്ധിമുട്ടാണ്.

ചിത്രങ്ങള്‍ പരിശോധിക്കുന്നതിനുള്ള ചില ഓൺലൈൻ ടൂളുകൾ 

ഡീപ്‌ഫെയ്ക്കും  നൈതികതയും  പകർപ്പവകാശ ലംഘനവും 

നൈതികതയുടെ നിര്‍വചനങ്ങള്‍ മാറ്റുന്ന തരത്തിലേക്ക് AI യും ഡീപ്‌ഫെയ്ക്കുംകാര്യങ്ങള്‍ കൊണ്ടുവന്നെത്തിച്ചിരിക്കുന്നു. ഒന്നാമതായി പറയുകയാണെങ്കില്‍ ഈ GAN അല്ലെങ്കില്‍ GPT മോഡല്‍ ഉണ്ടാക്കുമ്പോള്‍ തന്നെ പകര്‍പ്പവകാശ ലംഘനം നടന്നു കഴിഞ്ഞു. ChatGPT, Dalle പോലെയുള്ള മോഡലുകള്‍ നമുക്ക് ചിന്തിക്കാന്‍കഴിയുന്നതിനും അപ്പുറത്തുള്ള ഡാറ്റ ശേഖരം ട്രെയിന്‍ ചെയ്തു കഴിഞ്ഞു.

പഠിപ്പിച്ചത് മാത്രമേ മോഡലുകള്‍ക്ക് ചെയ്യാന്‍ കഴിയൂ. രവീന്ദ്ര നാഥ ടാഗോറിന്റെ രചനകളുടെ സവിശേഷതകള്‍ മനസ്സിലാക്കിയാല്‍ മാത്രമേ മോഡലിന് മഴയെ പറ്റി രവീന്ദ്ര നാഥ ടാഗോറിന്റെ ഭാവത്തില്‍ കവിത രചിക്കുവാന്‍ കഴിയൂ. വാന്ഗോഗിന്റെ ചിത്രങ്ങള്‍ അപഗ്രഥിച്ച GAN മോഡലിന് മാത്രമേ അദ്ദേഹത്തിന്റെ രീതിയില്‍ ചിത്രം വരയ്ക്കാന്‍ കഴിയു.

ലാര്‍ജ് ലാംഗ്വേജ് മോഡലുകളും (LLM) ജനറേറ്റീവ് അഡ്വേര്‍സേറിയല്‍ നെറ്റ്‌വര്‍ക്കുകളും (GAN) പകര്‍പ്പവകാശ മേഖലയില്‍ കാര്യമായ വെല്ലുവിളികള്‍ ഉയര്‍ത്തുന്നു. ഈ AI സിസ്റ്റങ്ങള്‍ വിപുലമായ ഡാറ്റാസെറ്റുകളില്‍ പരിശീലിപ്പിക്കപ്പെടുന്നു, പലപ്പോഴും പകര്‍പ്പവകാശമുള്ള മെറ്റീരിയലുകള്‍ ഉള്‍പ്പെട്ടേക്കാവുന്ന പൊതുവായി ലഭ്യമായ ഉള്ളടക്കത്തില്‍ നിന്നാണ്. വ്യക്തമായ അനുമതിയില്ലാതെ ഈ കൃതികള്‍ ഉപയോഗിക്കുന്നത് അത്തരം പ്രവര്‍ത്തനങ്ങളുടെ നിയമസാധുതയെക്കുറിച്ച് ചോദ്യങ്ങള്‍ ഉയര്‍ത്തുന്നു.

AI പരിശീലനം ‘ന്യായമായ ഉപയോഗത്തിന്’ കീഴിലാണെന്ന് ചിലര്‍ വാദിക്കുമ്പോള്‍, നിയമപരമായ വ്യാഖ്യാനങ്ങള്‍ അധികാരപരിധിയിലുടനീളം വ്യത്യാസപ്പെടുന്നു, ഇത് പ്രശ്‌നം പരിഹരിക്കപ്പെടാതെ അവശേഷിക്കുന്നു. കൂടാതെ, AI- ജനറേറ്റഡ് ഔട്ട്പുട്ടുകള്‍-ടെക്സ്റ്റോ ചിത്രങ്ങളോ സംഗീതമോ ആകട്ടെ-പലപ്പോഴും മനുഷ്യന്റെ സര്‍ഗ്ഗാത്മകതയുമായി സാമ്യമുള്ളതാണ്, ഉടമസ്ഥാവകാശത്തെക്കുറിച്ചുള്ള ചോദ്യങ്ങള്‍ സങ്കീര്‍ണ്ണമാക്കുന്നു. അത്തരം ഔട്ട്പുട്ടുകളില്‍ അബദ്ധവശാല്‍ പകര്‍പ്പവകാശമുള്ള മെറ്റീരിയല്‍ ആവര്‍ത്തിക്കുകയാണെങ്കില്‍, അവ ബൗദ്ധിക സ്വത്തവകാശ നിയമങ്ങള്‍ ലംഘിക്കാന്‍ സാധ്യതയുള്ള ഡെറിവേറ്റീവ് വര്‍ക്കുകളായി തരംതിരിക്കപ്പെടും.

AI സൃഷ്ടിച്ച ഉള്ളടക്കത്തിന്റെ ഉടമസ്ഥാവകാശം വരെ അവ്യക്തത വ്യാപിക്കുന്നു. AI-ക്ക് നിയമപരമായ വ്യക്തിത്വം ഇല്ലാത്തതിനാല്‍, നിലവിലെ നിയമങ്ങള്‍ സാധാരണയായി AI-യുടെ ഉപയോക്താവിനോ ഡെവലപ്പര്‍ക്കോ ഉടമസ്ഥാവകാശം നല്‍കുന്നു. എന്നിരുന്നാലും, ഔട്ട്പുട്ട് നിലവിലുള്ള പ്രത്യേക സൃഷ്ടികളെ ശക്തമായി പ്രതിഫലിപ്പിക്കുന്ന സാഹചര്യങ്ങളെ ഈ ചട്ടക്കൂട് വേണ്ടത്ര അഭിസംബോധന ചെയ്യുന്നില്ല.

AI പരിശീലന ഡാറ്റാസെറ്റുകളിലെ സുതാര്യതയുടെ അഭാവം ഈ പ്രശ്നത്തെ സങ്കീര്‍ണ്ണമാക്കുന്നു, AI- ജനറേറ്റഡ് ഔട്ട്പുട്ടുകളിലെ നിര്‍ദ്ദിഷ്ട ഘടകങ്ങളുടെ ഉത്ഭവം കണ്ടെത്തുന്നത് ബുദ്ധിമുട്ടാക്കുന്നു. ഇത് മനഃപൂര്‍വമല്ലാത്ത കോപ്പിയടി, ഡെവലപ്പര്‍മാര്‍ക്കും ഉപയോക്താക്കള്‍ക്കും ഒരുപോലെ നിയമപരമായ അപകടസാധ്യതകള്‍ എന്നിവ പോലുള്ള ധാര്‍മ്മിക പ്രതിസന്ധികള്‍ സൃഷ്ടിക്കുന്നു.

പകർപ്പവകാശത്തിൻ്റെ ഭാവി

AI യുഗത്തിലെ പകര്‍പ്പവകാശത്തിന്റെ ഭാവി, സ്രഷ്ടാക്കളുടെ അവകാശങ്ങള്‍ സംരക്ഷിക്കുന്നതിനൊപ്പം നവീകരണത്തെ പ്രോത്സാഹിപ്പിക്കുന്ന ഒരു സമതുലിതമായ നിയമ ചട്ടക്കൂട് സൃഷ്ടിക്കുന്നതിനെ ആശ്രയിച്ചിരിക്കുന്നു. സുതാര്യമായ ഡാറ്റാസെറ്റ് ഉപയോഗം, ലൈസന്‍സിംഗ് കരാറുകള്‍, ദുരുപയോഗത്തിനെതിരെ കൂടുതല്‍ കര്‍ശനമായ നിര്‍വ്വഹണം എന്നിവ ആവശ്യമായ AI- നിര്‍ദ്ദിഷ്ട നിയന്ത്രണങ്ങള്‍ നയനിര്‍മ്മാതാക്കള്‍ സ്ഥാപിച്ചേക്കാം.

AI പരിശീലനത്തെ വ്യക്തമായി അഭിസംബോധന ചെയ്യുന്നതിനായി പുതിയ ചട്ടക്കൂടുകള്‍ ‘ന്യായമായ ഉപയോഗം’ പുനര്‍ നിര്‍വചിച്ചേക്കാം. ദീര്‍ഘകാലാടിസ്ഥാനത്തില്‍, പകര്‍പ്പവകാശം എന്ന ആശയം തന്നെ വികസിച്ചേക്കാം. AI പരിശീലനത്തില്‍ ഉപയോഗിക്കുന്ന സ്രഷ്ടാക്കള്‍ക്കായി പങ്കിട്ട ഉടമസ്ഥാവകാശ മോഡലുകള്‍ക്കോ നഷ്ടപരിഹാര സംവിധാനങ്ങള്‍ക്കോ വ്യവസ്ഥകള്‍ ഉണ്ടാവേണ്ടതാണ് .

ഉള്ളടക്ക സൃഷ്ടിയില്‍ AI അവിഭാജ്യമാകുമ്പോള്‍, നവീകരണം പ്രാപ്തമാക്കുന്നതിനൊപ്പം ബൗദ്ധിക സ്വത്തിനെ ബഹുമാനിക്കുന്ന ഒരു ഭാവി ഉറപ്പാക്കാന്‍ സ്രഷ്ടാക്കളും സാങ്കേതിക വിദഗ്ധരും നയരൂപീകരണക്കാരും തമ്മിലുള്ള സഹകരണം വളര്‍ത്തിയെടുക്കുന്നത് അത്യന്താപേക്ഷിതമാണ്.

സുതാര്യതയും ഉത്തരവാദിത്തവുമാണ് മറ്റൊരു നിര്‍ണായക പ്രശ്‌നം. LLM-കളും GAN-കളും പോലെയുള്ള AI സിസ്റ്റങ്ങള്‍ ‘ബ്ലാക്ക് ബോക്‌സുകള്‍’ ആയി പ്രവര്‍ത്തിക്കുന്നു, തീരുമാനങ്ങള്‍ അല്ലെങ്കില്‍ ഔട്ട്പുട്ടുകള്‍ എങ്ങനെ സൃഷ്ടിക്കപ്പെടുന്നു എന്ന് മനസ്സിലാക്കാന്‍ ബുദ്ധിമുട്ടാണ്. ഈ അതാര്യത, അവരുടെ മോഡലുകള്‍ മൂലമുണ്ടാകുന്ന ദോഷങ്ങള്‍ക്ക് ഡെവലപ്പര്‍മാരെ ഉത്തരവാദികളാക്കുന്നതില്‍ വെല്ലുവിളികള്‍ സൃഷ്ടിക്കുന്നു.

മാത്രവുമല്ല, AI- സൃഷ്ടിച്ച പ്രവൃത്തികളുടെ ഉടമസ്ഥതയെയും ക്രെഡിറ്റിനെയും ചുറ്റിപ്പറ്റിയുള്ള ധാര്‍മ്മിക പ്രതിസന്ധികള്‍ ഉടലെടുക്കുന്നു. ഒരു AI ഒരു നിര്‍ദ്ദിഷ്ട കലാകാരന്റെ ശൈലി അനുകരിക്കുകയോ അല്ലെങ്കില്‍ വാചകം കോപ്പിയടിക്കുകയോ ചെയ്താല്‍, ധാര്‍മ്മിക ഉപയോഗത്തെക്കുറിച്ചുള്ള ചോദ്യം മുന്നിലെത്തും.

നിയമങ്ങളും ടെക്‌നോളജിയും വേറൊരു തലത്തിലേക്ക് Deep Fake നെ എത്തിക്കുന്നു. ഈ കാര്യങ്ങളിലേക്ക് നിയമങ്ങള്‍ ഉണ്ടാക്കുന്നത് തന്നെ അത്യന്തം ദുഷ്‌കരമാണ് . അടുത്തിടെ, പ്രശസ്ത വാര്‍ത്താ ഏജന്‍സിയായ ഏഷ്യന്‍ ന്യൂസ് ഇന്റര്‍നാഷണല്‍ (ANI), ChatGPT യുടെ സ്രഷ്ടാക്കളായ OpenAI ക്കെതിരെ പകര്‍പ്പവകാശ ലംഘന കേസ് ഫയല്‍ ചെയ്തു. ഈ കേസ് ഇന്ത്യയില്‍ ആദ്യമായി ഇന്ത്യയിലെ പകര്‍പ്പവകാശ നിയമ മേഖലയില്‍ പുതിയ നിയമപരമായ മാതൃകകള്‍ രൂപപ്പെടുത്തുന്നതിനുള്ള വാതില്‍  തുറക്കുന്നു.

content highlights: Deepfake AI: The Step of Creation and the Shadow of Deception

ഷഫീക് റഹ്‌മാന്‍
കഴിഞ്ഞ 2 പതിറ്റാണ്ടായി IT മേഖലയില്‍ പ്രവര്‍ത്തിക്കുന്നു. Artificial Intelligence Enthusiast ആണ്. ഇപ്പോള്‍ AI അധിഷ്ഠിതമായി സോഫ്റ്റ്‌വെയര്‍ ഡെവലപ്പ് ചെയ്യുന്ന കമ്പനിയുടെ സഹസ്ഥാപകന്‍ ആണ്.