Data is the new oil (ഡേറ്റ ആണ് പുതിയ എണ്ണ) എന്ന് നിങ്ങൾ പലവട്ടം കേട്ടിട്ടുണ്ടാകണം. കഴിഞ്ഞ വർഷം സ്പ്രിങ്ക്ലർ വിവാദമുണ്ടായപ്പോൾ കേരളത്തിലെ ആളുകൾ തലങ്ങും വിലങ്ങും എടുത്തു വീശിയ പ്രയോഗമാണിത്. ഇതൊരു പുതിയ പ്രയോഗമല്ല. പത്തു വർഷം മുൻപ് സൂപ്പർ മാർക്കറ്റ് ആയ ടെസ്കോയുമായി ചേർന്ന് ഒരു ലോയൽറ്റി പ്രോഗ്രാം (ക്ലബ് കാർഡ്) തുടങ്ങിയ ക്ലൈവ് ഹംബിയാണ് ഈ പ്രയോഗം ആദ്യമായി നടത്തിയത് എന്നാണ് ഇപ്പോൾ പൊതുവേ കരുതപ്പെടുന്നത്. ഈ പ്രയോഗത്തിന് പല അർഥതലങ്ങളുണ്ട്. അതു പറയുന്നതിനു മുൻപ് എന്താണ് ഡേറ്റ എന്നും എന്താണ് എണ്ണ എന്നും മനസിലാക്കണം.
ഡേറ്റ എന്ന വാക്കിന് കൃത്യമായ മലയാള പരിഭാഷ ഇല്ല. വസ്തുതകൾ, അടിസ്ഥാന വിവരങ്ങൾ എന്നൊക്കെയാണ് ഏകദേശ പരിഭാഷ. ഇവിടെ ‘ശേഖരിക്കപ്പെട്ട വസ്തുതകൾ’ എന്ന പരിഭാഷയാണ് ഞാൻ ഉപയോഗിക്കാൻ പോകുന്നത്. അതിന് എന്റെ ബന്ധുവും സ്റ്റാറ്റിസ്റ്റിക്കൽ ഡിപ്പാർട്മെന്റിലെ മുൻ ഉദ്യോഗസ്ഥനുമായ മഞ്ഞപ്ര ഉണ്ണികൃഷ്ണനോട് കടപ്പാട്. എണ്ണ ‘അസംസ്കൃത എണ്ണ, അഥവാ ക്രൂഡ് ഓയിൽ’ ആണ്. ഗൾഫ് രാജ്യങ്ങളെ സന്പന്നമാക്കുകയും നമ്മുടെയൊക്കെ കാറുകൾ മുതൽ വിമാനം വരെ ഓടിക്കാൻ ഉപയോഗിക്കുകയും ചെയ്യുന്ന ഇന്ധനങ്ങളുടെ അടിസ്ഥാനമായ അതേ പെട്രോളിയം തന്നെ. പത്തൊന്പതാം നൂറ്റാണ്ടിന്റെ അവസാനം മുതൽ ക്രൂഡ് ഓയിൽ എങ്ങനെ രാജ്യങ്ങളുടെ സന്പത്തിന്റെയും ശക്തിയുടെയും അടിസ്ഥാനമായോ അതുപോലെയാണ് ഡേറ്റ നാളത്തെ ലോകത്ത് പ്രസക്തമാകാൻ പോകുന്നതെന്നാണ് ‘ഡേറ്റ ഈസ് ദി ന്യൂ ഓയിൽ’ എന്ന പ്രയോഗത്തിന്റെ ഒരു അർഥതലം.
അറിയാതെ കിടക്കുന്നത്
ഇതിന് വേറെയും അർഥങ്ങളുണ്ട്. ദശ ലക്ഷക്കണക്കിന് വർഷങ്ങൾ അറേബ്യൻ മരുഭൂമിയുടെ കീഴെ എണ്ണയുടെ ശേഖരം ഉണ്ടായിരുന്നു. അതവിടെ ഉണ്ടെന്നുപോലും അറിയാതെ കഷ്ടപ്പെട്ട് ഒട്ടകങ്ങളെ വളർത്തിയും എണ്ണപ്പന കൃഷി ചെയ്തും പല തലമുറകൾ അതിനു മുകളിൽ ജീവിച്ചു പോയി. ഇപ്പോഴും എത്രയോ സ്ഥലങ്ങളിൽ എണ്ണ ശേഖരങ്ങൾക്കു മുകളിലും ചുറ്റിലുമായി എത്രയോ ആളുകൾ നെൽകൃഷി നടത്തിയും മീൻ പിടിച്ചും ദരിദ്രരായി ജീവിക്കുന്നു. അതുപോലെയാണ് ഡേറ്റയും. നമ്മുടെ ചുറ്റും വിലപ്പെട്ട ഡേറ്റ ഉണ്ടെന്ന് പോലും അറിയാതെ ലോകത്ത് അനവധി ആളുകൾ ദരിദ്രരായി ജീവിക്കുകയാണ്.
മണലാരണ്യങ്ങൾക്ക് മുകളിൽ ജീവിച്ചിരുന്ന നാടോടികളോ കടലിൽ മീൻ പിടിച്ചിരുന്ന മുക്കുവരോ അല്ല ക്രൂഡ് ഓയിൽ കണ്ടുപിടിച്ചതും വീണ്ടെടുത്തതും. അതിന് ആധുനിക ശാസ്ത്രത്തിൽ അറിവുള്ളവർ (പലപ്പോഴും വിദേശങ്ങളിൽനിന്നു വന്ന) വേണ്ടിവന്നു. ഡേറ്റയുടെ കാര്യവും അങ്ങനെ തന്നെയാണ്. നമ്മുടെ കൈയിലും ചുറ്റിലും ഡേറ്റ ഉണ്ടെന്ന് നമുക്കു തന്നെ അറിയില്ല. അതറിയാനും വീണ്ടെടുക്കാനും ഉപയോഗിക്കാനും നമുക്കുള്ള വിജ്ഞാനം മതിയാവില്ല താനും. പലപ്പോഴും മറ്റു രാജ്യങ്ങളിൽനിന്ന് ആളുകൾ വരേണ്ടി വരും.
നമ്മുടെ പാടത്തിനും പറന്പിനും കീഴെ എണ്ണ ഉണ്ടെന്ന് അറിഞ്ഞാൽ പോലും അത് കുഴിച്ചെടുക്കാനുള്ള സംവിധാനങ്ങൾക്ക് ശതകോടികളുടെ ചെലവുണ്ട്. അതറിയുന്ന കന്പനികൾ വളരെ കുറച്ചേ ആദ്യകാലത്ത് ഉണ്ടായിരുന്നുള്ളൂ. അപ്പോൾ നമ്മുടെ പറന്പിലുള്ള എണ്ണ കുഴിച്ചെടുക്കാനുള്ള അവകാശം ചെറിയൊരു വിലയ്ക്ക് കന്പനികൾക്ക് നൽകുക എന്നത് മാത്രമാണ് മാർഗമുണ്ടായിരുന്നത്. ഡേറ്റയുടെ കാര്യവും അതുതന്നെയാണ്. നമ്മുടെ അടുത്ത് വിലയുള്ള ഡേറ്റ ഉണ്ടെന്ന് അറിഞ്ഞാൽ പോലും അത് ഉപയോഗിക്കാനുള്ള അറിവ് നമുക്ക് ഇല്ലെങ്കിൽ അതുള്ളവർക്ക് ചെറിയ വിലയ്ക്ക് നൽകുക മാത്രമാണ് നമുക്ക് ചെയ്യാനാകുന്നത്.
ക്രിസ്തുവിനും നാലായിരം വർഷങ്ങൾക്ക് മുൻപേ കണ്ടുപിടിച്ച വസ്തുവാണ് ക്രൂഡ് ഓയിൽ. എങ്കിലും പത്തൊന്പതാം നൂറ്റാണ്ട് വരെ അതിന് ഇത്രമാത്രം വിലയോ പ്രസക്തിയോ ഉണ്ടായിരുന്നില്ല. ഒരു കാലത്ത് അസംസ്കൃത എണ്ണയിലെ പെട്ടെന്ന് ബാഷ്പീകരിക്കപ്പെടുന്ന ഭാഗങ്ങളെല്ലാം ബാഷ്പീകരിച്ചു കളഞ്ഞതിനു ശേഷം ബാക്കിയാകുന്ന ബിറ്റുമിൻ (ടാർ) ആയിരുന്നു ആകെ വിലയുണ്ടായിരുന്ന വസ്തു. ഇന്നിപ്പോൾ വിമാനത്തിൽ ഉപയോഗിക്കുന്ന ഏവിയേഷൻ ഫ്യൂവൽ മുതൽ കപ്പലിൽ ഉപയോഗിക്കുന്ന ബങ്കർ ഓയിൽ വരെ റിഫൈനറിയിൽ ഡിസ്റ്റിൽ ചെയ്ത് എടുത്തതിന് ശേഷം കിട്ടുന്ന ഏറ്റവും വില കുറഞ്ഞ വസ്തുവാണ് ടാർ.
ഡേറ്റയുടെ കാര്യവും ഇതുപോലെയാണ്. ഏതു ഡേറ്റയിൽ ഏതൊക്കെ വിലയാണ് ഉള്ളതെന്നുള്ള അറിവ് മുൻകൂട്ടി നമുക്കില്ല. ഇന്റേണൽ കന്പസ്റ്റൈൻ എൻജിൻ (Internal combustion engine) വന്നപ്പോൾ പെട്രോളിന് വിലയുണ്ടായതു പോലെ മറ്റു രംഗങ്ങളിലുണ്ടാകുന്ന വ്യതിയാനങ്ങൾ ഡേറ്റയുടെ വിലയിൽ മാറ്റമുണ്ടാക്കും. ഇത്തരത്തിൽ എണ്ണയും ഡേറ്റയും തമ്മിൽ അനവധി സാമ്യങ്ങളുണ്ട്.
ഡേറ്റ പുതിയ എണ്ണയാകുന്നത് ?
അതിന് ഡേറ്റ എന്താണെന്നറിയണം, ഡേറ്റയെപ്പറ്റി സെൻസ് ഉണ്ടാകണം, അതുപയോഗിക്കാൻ സെൻസിബിലിറ്റി ഉണ്ടാകണം. ഇതിപ്പോൾ വർഷാവർഷം ഐഎഎസ് അക്കാദമിയിൽ അടവെയ്ക്കുന്ന സിലബസിൽ ഡേറ്റ ഉണ്ടോ? അഞ്ചു വർഷം കൂടുന്പോൾ നമ്മൾ തെരഞ്ഞെടുക്കുന്ന ജനപ്രതിനിധികൾക്ക് ഡേറ്റയുടെ വിലയെപ്പറ്റി ശരിയായ അറിവ് ഉണ്ടോ? എന്തിന് എല്ലാ ഡേറ്റകളുടെയും ആധാരമായ നമുക്ക് ഈ ഡേറ്റയെപ്പറ്റി വല്ല വിവരവും ഉണ്ടോ. നമ്മളെപ്പറ്റിയല്ലേ പൂന്താനം “കുങ്കുമത്തിന്റെ ഗന്ധമറിയാതെ കുങ്കുമം ചുമന്നീടുന്നു ഗർദ്ദഭം” എന്നു പാടിയത്? അതിന്റെ അർഥമല്ലേ പൊതുജനം കഴുത എന്ന പ്രയോഗം?
അപ്പോൾ നമ്മൾ ചുമക്കുന്ന, കുങ്കുമത്തോളം വിലപിടിപ്പുള്ള ഈ ഡേറ്റ എവിടെയാണുള്ളത്? എന്തുകൊണ്ടാണ് എണ്ണപ്പാടത്തിന് മുകളിൽ ഒട്ടകങ്ങളുമായി കറങ്ങുന്ന നാടോടിയെപ്പോലെ ഇത്രമാത്രം ഡേറ്റയുടെ അധിപനായിട്ടും നമ്മൾ കഷ്ടപ്പെടേണ്ടി വരുന്നത്?
ശേഖരിക്കപ്പെട്ട വസ്തുതയാണ് ഡേറ്റ എന്നു പറഞ്ഞല്ലോ. ഇവിടെ രണ്ടു കാര്യങ്ങൾ പ്രധാനമാണ്. വസ്തുതയും ശേഖരണവും. ഇതു രണ്ടും ഉണ്ടെങ്കിലേ ഡേറ്റ ആവുകയുള്ളൂ. ഡേറ്റ ആയാലേ വിലയുണ്ടാകൂ. ഒരു മനുഷ്യൻ ജനിക്കുന്പോൾ മുതൽ വസ്തുതകളുടെ ഖനിയാണ്. ഓരോ ദിവസവും നമ്മൾ ജീവിക്കുന്പോൾ കൂടുതൽ കൂടുതൽ വസ്തുതകൾ നമ്മൾ ഉണ്ടാക്കുന്നു. ഇവ ഓരോന്നിനും വ്യത്യസ്തമായ മൂല്യമാണുള്ളത്. ഉദാഹരണത്തിന് ഒരു കുട്ടി ജനിക്കുന്പോൾ ആ കാര്യം നമ്മൾ പലയിടങ്ങളിൽ രേഖപ്പെടുത്താറുണ്ട്. അതിനൊരു മൂല്യമുണ്ട്. ഡെമോഗ്രഫി ഈസ് ഡെസ്ടിനി. ഇന്നത്തെ ജനസംഖ്യയാണ് നാളത്തെ രാജ്യത്തിന്റെ/പ്രദേശത്തിന്റെ ഭാവി നിർണയിക്കുന്നത്. പോപ്പുലേഷൻ ഡേറ്റ എന്നത് ലോകത്തെ ഏറ്റവും വലിയ സ്വർണ ഖനിയാണ്. ഇന്നത്തെ കുട്ടി നാളത്തെ കസ്റ്റമർ ആണ്. ബേബി ഫുഡ് തൊട്ട് സ്കൂളുകൾ വരെ ആ കുട്ടിക്ക് ആവശ്യമായി വരും. വസ്ത്ര കച്ചവടക്കാർ മുതൽ വാഹന കച്ചവടക്കാർക്ക് വരെ ലോകത്തെവിടെയെല്ലാമാണ് കുട്ടികൾ ഉണ്ടായിരിക്കുന്നത് എന്നതിൽ താത്പര്യമുണ്ട്.
മുൻപ് പറഞ്ഞ ഡേറ്റയിൽ ‘ഒരു കുട്ടി ജനിച്ചു’ എന്ന വിവരം മാത്രമേ ഉള്ളൂ. കുട്ടിയുടെ ഉയരം, തൂക്കം, ഏതെങ്കിലും തരത്തിലുള്ള അംഗവൈകല്യങ്ങൾ ഉണ്ടോ, ആണാണോ, പെണ്ണാണോ, മാതാപിതാക്കളുടെ വിദ്യാഭ്യാസം, വരുമാനം ഇതൊക്കെ പലപ്പോഴും ആശുപത്രി രേഖകളിൽ ഉണ്ടാകും. ഇത്തരം വ്യക്തിപര ഡേറ്റയുടെ മൂല്യം വ്യക്തിപരമല്ലാത്ത വിവരങ്ങളെക്കാൾ വളരെ കൂടുതലാണ്. ജനനം മുതൽ മരണം വരെ നമ്മൾ ഓരോ ദിവസവും ഇത്തരത്തിൽ ഡേറ്റ പോയിന്റുകൾ ഉണ്ടാക്കിക്കൊണ്ടിരിക്കയാണ്. ഫേസ്ബുക്കിൽ ഓൺലൈനായിരിക്കുന്ന ഓരോ മിനിറ്റിലും നമ്മൾ പുതിയ പുതിയ ഡേറ്റ അവിടെ അവശേഷിപ്പിക്കുകയാണ്. ഓരോ പ്രാവശ്യവും സ്വിഗിയിൽ ഭക്ഷണം ഓർഡർ ചെയ്യുന്പോൾ നമുക്ക് കിട്ടുന്നത് ഭക്ഷണവും അവർക്ക് കിട്ടുന്നതു ഡേറ്റയുമാണ്. വാട്സ്ആപ്പ് മുതൽ ജി മെയിൽ വരെ നമ്മൾ നിത്യവും ഉപയോഗിക്കുന്ന പലതും ഡേറ്റ വലിച്ചെടുക്കുന്ന യന്ത്രങ്ങളാണ്. നമുക്ക് സൗജന്യമായോ ലാഭകരമായോ എന്തെങ്കിലും ലഭിക്കുന്നുണ്ടെങ്കിൽ അവരുടെയും പ്രധാന ലക്ഷ്യം ഡേറ്റ തന്നെയാണ്.
ഡേറ്റയും കെഎസ്ആർടിസിയും
നാലാം വ്യവസായ വിപ്ലവത്തിന്റെ കാലത്തെ സന്പദ്വ്യവസ്ഥയിലെ അടിസ്ഥാന അസംസ്കൃത വസ്തു ഡേറ്റ ആണ്. അത് വലിച്ചെടുക്കാനുള്ള സംവിധാനമാണ് ഇന്റർനെറ്റ് ഓഫ് തിംഗ്സ് ആയി വികസിക്കപ്പെടുന്നത്. ഇതറിഞ്ഞേ നമുക്ക് നാളത്തെ ലോകത്തിന് തയാറെടുക്കാനാകൂ. ഒരുദാഹരണം പറയാം: ഇന്ന് കേരളത്തിൽ നഷ്ടത്തിൽ നടക്കുന്ന ഒരു പ്രസ്ഥാനമാണ്, 1965 ൽ രൂപീകൃതമായതെന്ന് വിക്കിപ്പീഡിയ പറയുന്ന കെഎസ്ആർടിസി. 1937 ലുണ്ടായ ട്രാൻവൻകൂർ സ്റ്റേറ്റ് ട്രാൻസ്പോർട്ട് ഡിപ്പാർട്മെന്റിന്റെ തുടർച്ചയാണത്. ഒരു ദിവസം മുപ്പത് ലക്ഷത്തിലധികം യാത്രക്കാർ കെഎസ്ആർടിസി വാഹനങ്ങൾ ഉപയോഗിക്കുന്നുവെന്നാണ് വെബ്സൈറ്റ് പറയുന്നത്. ഇത് കേരള ജനസംഖ്യയുടെ പത്തിൽ ഒന്നു വരും. ഇതിൽ ഒരാൾ ഒരു പ്രാവശ്യം ഒന്നിലേറെ ബസുകളിൽ കയറുന്നു എന്ന് കരുതിയാൽ പോലും പതിനഞ്ചു ലക്ഷമായി. രണ്ടിൽ കൂടുതൽ ബസിൽ കുറച്ചു പേർ കയറുന്നു എന്ന് വിചാരിച്ചാൽ പോലും പത്തുലക്ഷം ആളുകൾ ഓരോ ദിവസവും കെഎസ്ആർടിസി കസ്റ്റമർ ആണ്. അവരുടെ പ്രായം, ലിംഗം, തൊഴിൽ, വിദ്യാഭ്യാസം, ഇ മെയിൽ, കോൺടാക്ട് നന്പർ, ഇവരിൽ എത്ര പേർ സ്ഥിരം കെഎസ്ആർടിസിയിൽ യാത്ര ചെയ്യുന്നു, ആരൊക്കെയാണ് ആഴ്ചാവസാനം യാത്ര ചെയ്യുന്നത്, അതിൽ നാട്ടുകാർ എത്ര, മറു നാട്ടുകാർ എത്ര, മലയാളം അറിയുന്നവർ എത്ര, അറിയാത്തവർ എത്ര തുടങ്ങി അവരെപ്പറ്റി എന്ത് വിവരശേഖരമാണ് കെഎസ്ആർടിസി നടത്തിയിട്ടുള്ളത്?
ഡേറ്റ, ഓയിൽ ആണെന്ന് പ്രവചിച്ച ക്ലൈവ് ഹന്പി എന്ന മഹാൻ ടെസ്കോ സൂപ്പർ മാർക്കറ്റിൽ വരുന്ന എല്ലാ ഉപഭോക്താക്കൾക്കും ഒരു ലോയൽറ്റി കാർഡ് ഉണ്ടാക്കുക വഴി അവരുടെ വിവരങ്ങൾ ശേഖരിക്കുകയാണ് ചെയ്തത്. ആ അറിവ് വെറുതെയായില്ല. ഹന്പി കോടീശ്വരനായി.
ഇതാണ് ഡേറ്റയുടെ ശക്തി. ഇന്നും കെഎസ്ആർടിസിയെ എങ്ങനെ രക്ഷപ്പെടുത്താം എന്ന ചർച്ചകളിൽ എത്ര ബസുകൾ കട്ടപ്പുറത്തിരിക്കുന്നു, ഏതൊക്കെ ബസ് സ്റ്റാൻഡുകൾ വാടകയ്ക്കു കൊടുക്കാം എന്ന തരത്തിലാണ് ചർച്ചകൾ പുരോഗമിക്കുന്നത്. ഡേറ്റയുടെ സാധ്യതകളെ ആരും കാണുന്നതേയില്ല.
ലോകത്തെ ഒരു ആധുനിക ലോജിസ്റ്റിക്സ് കന്പനി കെഎസ്ആർടിസിയെ വിലയ്ക്കെടുക്കാൻ ചിന്തിക്കുന്നു എന്ന് കരുതുക. അവർ കെഎസ്ആർടിസിയുടെ മൂല്യം കണക്കാക്കുന്പോൾ ആദ്യം ചിന്തിക്കുന്നത് നിരത്തിലോടുന്നതോ കട്ടപ്പുറത്തിരിക്കുന്നതോ ആയ ബസുകളെയോ, പണിയെടുക്കുന്നതോ പണിയെടുക്കാത്തതോ ആയ ജോലിക്കാരെയോ, കേരളത്തിലെ എല്ലാ നഗരങ്ങളിലും അവർക്കുള്ള റിയൽ എസ്റ്റേറ്റിനെയോ പറ്റി ആയിരിക്കില്ല. കേരളത്തിലെ ഗ്രാമങ്ങളിൽനിന്ന് പോലുമുള്ള മില്യൺ യാത്രക്കാരെക്കുറിച്ച് ആയിരിക്കും. അവരുടെ ഡേറ്റയും അവരെപ്പറ്റിയുള്ള ഡേറ്റയും ആണ് ഏറ്റവും മൂല്യമുള്ളത്. പക്ഷേ ഈ ഊരുതെണ്ടിയുടെ കൈയിൽ എന്താണുള്ളത്? അതില്ലെങ്കിൽ ഗുരുവിന്റെ ഖബറിൽ മണ്ണുവാരിയിടേണ്ടി വരും!
ഇനിയുള്ള കാലത്ത് ഡേറ്റ ഉണ്ടെങ്കിൽ കന്പനികൾക്ക് ആസ്തിയും ലാഭവും ഒന്നുമില്ലെങ്കിലും വില താനേ ഉണ്ടാകും. എന്തുകൊണ്ടാണ് ലോകത്തുള്ള ആർക്കും ഫ്രീ ആയി ഇമെയിൽ ഉണ്ടാക്കി കൊടുക്കാമെന്ന് പറഞ്ഞ, ചരിത്രത്തിൽ ലാഭം ഉണ്ടാക്കാതിരുന്ന ഹോട്ട് മെയിൽ എന്ന സ്ഥാപനത്തെ മൈക്രോസോഫ്റ്റ് 2800 കോടി രൂപയ്ക്കു വാങ്ങിയത്? എന്തുകൊണ്ടാണ് നാട്ടുകാർക്ക് മുഴുവൻ ഫ്രീ ആയി മണ്ടത്തരം കൈമാറാൻ അവസരമുണ്ടാക്കിയ വാട്ട്സ്ആപ്പിനെ ഫേസ്ബുക്ക് 28,000 കോടി രൂപയ്ക്കു വാങ്ങിയത്? അതുപയോഗിക്കുന്നവരുടെ ഡേറ്റ തന്നെയാണ് അതിന്റെ ഏറ്റവും വലിയ മൂല്യം. അവിടത്തെ സെർവറോ പ്രോഗ്രാമോ ജോലിക്കാരോ ഒന്നുമല്ല. പക്ഷേ ഡേറ്റക്ക് മൂല്യം ഉണ്ടാകണമെങ്കിൽ ആദ്യം ഡേറ്റ ഉണ്ടാകണം. രണ്ടാമത് അത് കംപ്യൂട്ടറുകൾക്ക് ഉപയോഗിക്കാൻ പറ്റുന്ന രീതിയിൽ ആയിരിക്കണം. മൂന്നാമത് അവ ഉപയോഗിക്കാൻ അറിയണം.
യുഎഇയിലെ നിർമിത ബുദ്ധി
2019 ൽ യുഎഇയിലെ ‘നിർമിത ബുദ്ധിയുടെ’ മന്ത്രിയെ കണ്ട കാര്യം ഞാൻ അനവധി തവണ പറഞ്ഞിട്ടുണ്ട്. എന്തുകൊണ്ടാണ് കേരളത്തിന്റെ മൂന്നിലൊന്ന് ജനസംഖ്യയുള്ള യുഎഇ എന്ന ചെറിയ രാജ്യം നിർമിത ബുദ്ധിയുടെ കാര്യത്തിൽ ലോകത്തെ മുൻകിട രാജ്യങ്ങളിൽ ഒന്നായത്? നിർമിത ബുദ്ധിയുടെ പൂർണമായ വളർച്ചയ്ക്കും ഉപയോഗത്തിനും നമുക്കു വേണ്ടത് ഡേറ്റ ആണ്. ഡേറ്റയുടെ കാര്യത്തിൽ അതിന്റെ വ്യാപ്തി, വൈവിധ്യം, വേഗത ഇവയാണ് പ്രധാനമായിട്ടുള്ളത്. എത്രമാത്രം ഡേറ്റ ലഭ്യമാണ്? അവ എത്ര വൈജ്യാത്യം ഉള്ളതാണ്? എത്ര വേഗത്തിൽ ലഭ്യമാണ്? ചെറിയ രാജ്യമായ ദുബായിക്ക് ഡേറ്റയുടെ അളവും അത്രത്തോളം കുറവായിരിക്കുമല്ലോ. 140 കോടി ജനസംഖ്യയുള്ള ഇന്ത്യയുമായി ഒരു കോടിയിൽ താഴെ ജനസംഖ്യയുള്ള ദുബായിക്ക് ഡേറ്റ വോളിയത്തിന്റെ കാര്യത്തിൽ മത്സരിക്കാൻ ഒറ്റനോട്ടത്തിൽ കഴിവില്ല. മൂന്ന് കോടി ജനസംഖ്യയുള്ള കേരളത്തിൽ പോലും അതിനേക്കാൾ കൂടുതൽ ഡേറ്റ ഉണ്ടാകും.
പക്ഷേ ദുബായിൽ ഒരാളുടെ ജനനം മുതൽ മരണം വരെയുള്ള എല്ലാ ഡേറ്റയും കംപ്യൂട്ടറൈസ്ഡ് ആണ്. ആളുകൾ യാത്രക്ക് സ്മാർട്ട് കാർഡുകളും സാധനങ്ങൾ വാങ്ങാൻ ക്രെഡിറ്റ് കാർഡും ഉപയോഗിക്കുന്നു. ഓരോ യാത്രയിലും കച്ചവടത്തിലും ആളുകളുടെ ഡേറ്റ കുന്നുകൂട്ടുകയാണ്. അവ അതിവേഗതയിൽ അത് ഉപയോഗിക്കാൻ അറിയാവുന്നവർക്ക് ലഭ്യമാവുകയാണ്.
ബ്രിട്ടീഷുകാർ ഭരിച്ച രാജ്യമായതിനാൽ നമുക്ക് വളരെ വ്യാപകമായ ഡേറ്റ കളക്ഷൻ സംവിധാനം ഉണ്ട്. പക്ഷെ ഇവ പലപ്പോഴും ഡിജിറ്റൽ അല്ല. ഒരു ഡേറ്റയും ആർക്കും കൊടുക്കാതിരിക്കുക എന്നതാണ് നമ്മുടെ പൊതു രീതി. സർക്കാർ ഡേറ്റ വിദേശ കന്പനികൾക്ക് കൊടുക്കില്ല എന്ന് പറയുന്നത് സ്വാഭാവികം, നാട്ടുകാർക്ക് കൊടുക്കാൻ നിബന്ധനകൾ ഉള്ളതും മനസിലാക്കാം. പക്ഷെ വിവിധ സർക്കാർ ഡിപ്പാർട്ട്മെന്റുകൾ തമ്മിൽ പോലും ഡേറ്റ പരസ്പരം കൈമാറുന്നില്ല എന്നതാണ് സത്യം. ഇവിടെയാണ് കുങ്കുമത്തിന്റെയും ഗർദ്ദഭത്തിന്റെയും കഥ പ്രസക്തമാകുന്നത്. ഇത് ഡേറ്റയെപ്പറ്റിയുള്ള അറിവുകളുടെ ഒരു തുടക്കം മാത്രം. എന്താണ് ബിഗ് ഡേറ്റ, ഡേറ്റ അനലിറ്റിക്സ്, എങ്ങനെയാണ് ഡേറ്റയിൽ നിന്നു നിർമിത ബുദ്ധി ഉണ്ടാകുന്നത്, എന്താണ് ഡേറ്റയിലെ സ്വകാര്യത, സർക്കാരിൽ നിന്നും സ്വിഗിയിൽ നിന്നും പിടിച്ചെടുക്കപ്പെടുന്ന നമ്മുടെ ഡേറ്റക്ക് നമുക്ക് എന്ത് അവകാശമുണ്ട്, നമ്മുടെ സമ്മതമില്ലാതെ വിവരങ്ങൾ ശേഖരിക്കാമോ, ശേഖരിച്ചാൽ അത് വിൽക്കാമോ? വിറ്റാൽ കിട്ടുന്ന പണത്തിന്റെ ഒരംശത്തിന് നമുക്കും അവകാശമുള്ളതല്ലേ? എന്നീ ചോദ്യങ്ങൾക്കൊക്കെ ഉത്തരവുമായി പിന്നീടൊരിക്കൽ വരാം. ചിലപ്പോൾ ഇക്കാര്യത്തിൽ ഒരു സീരീസ് തന്നെ വേണ്ടി വരും.
മുരളി തുമ്മാരുകുടി
ഡേറ്റ എന്ന വാക്കിന് കൃത്യമായ മലയാള പരിഭാഷ ഇല്ല. വസ്തുതകൾ, അടിസ്ഥാന വിവരങ്ങൾ എന്നൊക്കെയാണ് ഏകദേശ പരിഭാഷ. ഇവിടെ ‘ശേഖരിക്കപ്പെട്ട വസ്തുതകൾ’ എന്ന പരിഭാഷയാണ് ഞാൻ ഉപയോഗിക്കാൻ പോകുന്നത്. അതിന് എന്റെ ബന്ധുവും സ്റ്റാറ്റിസ്റ്റിക്കൽ ഡിപ്പാർട്മെന്റിലെ മുൻ ഉദ്യോഗസ്ഥനുമായ മഞ്ഞപ്ര ഉണ്ണികൃഷ്ണനോട് കടപ്പാട്. എണ്ണ ‘അസംസ്കൃത എണ്ണ, അഥവാ ക്രൂഡ് ഓയിൽ’ ആണ്. ഗൾഫ് രാജ്യങ്ങളെ സന്പന്നമാക്കുകയും നമ്മുടെയൊക്കെ കാറുകൾ മുതൽ വിമാനം വരെ ഓടിക്കാൻ ഉപയോഗിക്കുകയും ചെയ്യുന്ന ഇന്ധനങ്ങളുടെ അടിസ്ഥാനമായ അതേ പെട്രോളിയം തന്നെ. പത്തൊന്പതാം നൂറ്റാണ്ടിന്റെ അവസാനം മുതൽ ക്രൂഡ് ഓയിൽ എങ്ങനെ രാജ്യങ്ങളുടെ സന്പത്തിന്റെയും ശക്തിയുടെയും അടിസ്ഥാനമായോ അതുപോലെയാണ് ഡേറ്റ നാളത്തെ ലോകത്ത് പ്രസക്തമാകാൻ പോകുന്നതെന്നാണ് ‘ഡേറ്റ ഈസ് ദി ന്യൂ ഓയിൽ’ എന്ന പ്രയോഗത്തിന്റെ ഒരു അർഥതലം.
അറിയാതെ കിടക്കുന്നത്
ഇതിന് വേറെയും അർഥങ്ങളുണ്ട്. ദശ ലക്ഷക്കണക്കിന് വർഷങ്ങൾ അറേബ്യൻ മരുഭൂമിയുടെ കീഴെ എണ്ണയുടെ ശേഖരം ഉണ്ടായിരുന്നു. അതവിടെ ഉണ്ടെന്നുപോലും അറിയാതെ കഷ്ടപ്പെട്ട് ഒട്ടകങ്ങളെ വളർത്തിയും എണ്ണപ്പന കൃഷി ചെയ്തും പല തലമുറകൾ അതിനു മുകളിൽ ജീവിച്ചു പോയി. ഇപ്പോഴും എത്രയോ സ്ഥലങ്ങളിൽ എണ്ണ ശേഖരങ്ങൾക്കു മുകളിലും ചുറ്റിലുമായി എത്രയോ ആളുകൾ നെൽകൃഷി നടത്തിയും മീൻ പിടിച്ചും ദരിദ്രരായി ജീവിക്കുന്നു. അതുപോലെയാണ് ഡേറ്റയും. നമ്മുടെ ചുറ്റും വിലപ്പെട്ട ഡേറ്റ ഉണ്ടെന്ന് പോലും അറിയാതെ ലോകത്ത് അനവധി ആളുകൾ ദരിദ്രരായി ജീവിക്കുകയാണ്.
മണലാരണ്യങ്ങൾക്ക് മുകളിൽ ജീവിച്ചിരുന്ന നാടോടികളോ കടലിൽ മീൻ പിടിച്ചിരുന്ന മുക്കുവരോ അല്ല ക്രൂഡ് ഓയിൽ കണ്ടുപിടിച്ചതും വീണ്ടെടുത്തതും. അതിന് ആധുനിക ശാസ്ത്രത്തിൽ അറിവുള്ളവർ (പലപ്പോഴും വിദേശങ്ങളിൽനിന്നു വന്ന) വേണ്ടിവന്നു. ഡേറ്റയുടെ കാര്യവും അങ്ങനെ തന്നെയാണ്. നമ്മുടെ കൈയിലും ചുറ്റിലും ഡേറ്റ ഉണ്ടെന്ന് നമുക്കു തന്നെ അറിയില്ല. അതറിയാനും വീണ്ടെടുക്കാനും ഉപയോഗിക്കാനും നമുക്കുള്ള വിജ്ഞാനം മതിയാവില്ല താനും. പലപ്പോഴും മറ്റു രാജ്യങ്ങളിൽനിന്ന് ആളുകൾ വരേണ്ടി വരും.
നമ്മുടെ പാടത്തിനും പറന്പിനും കീഴെ എണ്ണ ഉണ്ടെന്ന് അറിഞ്ഞാൽ പോലും അത് കുഴിച്ചെടുക്കാനുള്ള സംവിധാനങ്ങൾക്ക് ശതകോടികളുടെ ചെലവുണ്ട്. അതറിയുന്ന കന്പനികൾ വളരെ കുറച്ചേ ആദ്യകാലത്ത് ഉണ്ടായിരുന്നുള്ളൂ. അപ്പോൾ നമ്മുടെ പറന്പിലുള്ള എണ്ണ കുഴിച്ചെടുക്കാനുള്ള അവകാശം ചെറിയൊരു വിലയ്ക്ക് കന്പനികൾക്ക് നൽകുക എന്നത് മാത്രമാണ് മാർഗമുണ്ടായിരുന്നത്. ഡേറ്റയുടെ കാര്യവും അതുതന്നെയാണ്. നമ്മുടെ അടുത്ത് വിലയുള്ള ഡേറ്റ ഉണ്ടെന്ന് അറിഞ്ഞാൽ പോലും അത് ഉപയോഗിക്കാനുള്ള അറിവ് നമുക്ക് ഇല്ലെങ്കിൽ അതുള്ളവർക്ക് ചെറിയ വിലയ്ക്ക് നൽകുക മാത്രമാണ് നമുക്ക് ചെയ്യാനാകുന്നത്.
ക്രിസ്തുവിനും നാലായിരം വർഷങ്ങൾക്ക് മുൻപേ കണ്ടുപിടിച്ച വസ്തുവാണ് ക്രൂഡ് ഓയിൽ. എങ്കിലും പത്തൊന്പതാം നൂറ്റാണ്ട് വരെ അതിന് ഇത്രമാത്രം വിലയോ പ്രസക്തിയോ ഉണ്ടായിരുന്നില്ല. ഒരു കാലത്ത് അസംസ്കൃത എണ്ണയിലെ പെട്ടെന്ന് ബാഷ്പീകരിക്കപ്പെടുന്ന ഭാഗങ്ങളെല്ലാം ബാഷ്പീകരിച്ചു കളഞ്ഞതിനു ശേഷം ബാക്കിയാകുന്ന ബിറ്റുമിൻ (ടാർ) ആയിരുന്നു ആകെ വിലയുണ്ടായിരുന്ന വസ്തു. ഇന്നിപ്പോൾ വിമാനത്തിൽ ഉപയോഗിക്കുന്ന ഏവിയേഷൻ ഫ്യൂവൽ മുതൽ കപ്പലിൽ ഉപയോഗിക്കുന്ന ബങ്കർ ഓയിൽ വരെ റിഫൈനറിയിൽ ഡിസ്റ്റിൽ ചെയ്ത് എടുത്തതിന് ശേഷം കിട്ടുന്ന ഏറ്റവും വില കുറഞ്ഞ വസ്തുവാണ് ടാർ.
ഡേറ്റയുടെ കാര്യവും ഇതുപോലെയാണ്. ഏതു ഡേറ്റയിൽ ഏതൊക്കെ വിലയാണ് ഉള്ളതെന്നുള്ള അറിവ് മുൻകൂട്ടി നമുക്കില്ല. ഇന്റേണൽ കന്പസ്റ്റൈൻ എൻജിൻ (Internal combustion engine) വന്നപ്പോൾ പെട്രോളിന് വിലയുണ്ടായതു പോലെ മറ്റു രംഗങ്ങളിലുണ്ടാകുന്ന വ്യതിയാനങ്ങൾ ഡേറ്റയുടെ വിലയിൽ മാറ്റമുണ്ടാക്കും. ഇത്തരത്തിൽ എണ്ണയും ഡേറ്റയും തമ്മിൽ അനവധി സാമ്യങ്ങളുണ്ട്.
ഡേറ്റ പുതിയ എണ്ണയാകുന്നത് ?
അതിന് ഡേറ്റ എന്താണെന്നറിയണം, ഡേറ്റയെപ്പറ്റി സെൻസ് ഉണ്ടാകണം, അതുപയോഗിക്കാൻ സെൻസിബിലിറ്റി ഉണ്ടാകണം. ഇതിപ്പോൾ വർഷാവർഷം ഐഎഎസ് അക്കാദമിയിൽ അടവെയ്ക്കുന്ന സിലബസിൽ ഡേറ്റ ഉണ്ടോ? അഞ്ചു വർഷം കൂടുന്പോൾ നമ്മൾ തെരഞ്ഞെടുക്കുന്ന ജനപ്രതിനിധികൾക്ക് ഡേറ്റയുടെ വിലയെപ്പറ്റി ശരിയായ അറിവ് ഉണ്ടോ? എന്തിന് എല്ലാ ഡേറ്റകളുടെയും ആധാരമായ നമുക്ക് ഈ ഡേറ്റയെപ്പറ്റി വല്ല വിവരവും ഉണ്ടോ. നമ്മളെപ്പറ്റിയല്ലേ പൂന്താനം “കുങ്കുമത്തിന്റെ ഗന്ധമറിയാതെ കുങ്കുമം ചുമന്നീടുന്നു ഗർദ്ദഭം” എന്നു പാടിയത്? അതിന്റെ അർഥമല്ലേ പൊതുജനം കഴുത എന്ന പ്രയോഗം?
അപ്പോൾ നമ്മൾ ചുമക്കുന്ന, കുങ്കുമത്തോളം വിലപിടിപ്പുള്ള ഈ ഡേറ്റ എവിടെയാണുള്ളത്? എന്തുകൊണ്ടാണ് എണ്ണപ്പാടത്തിന് മുകളിൽ ഒട്ടകങ്ങളുമായി കറങ്ങുന്ന നാടോടിയെപ്പോലെ ഇത്രമാത്രം ഡേറ്റയുടെ അധിപനായിട്ടും നമ്മൾ കഷ്ടപ്പെടേണ്ടി വരുന്നത്?
ശേഖരിക്കപ്പെട്ട വസ്തുതയാണ് ഡേറ്റ എന്നു പറഞ്ഞല്ലോ. ഇവിടെ രണ്ടു കാര്യങ്ങൾ പ്രധാനമാണ്. വസ്തുതയും ശേഖരണവും. ഇതു രണ്ടും ഉണ്ടെങ്കിലേ ഡേറ്റ ആവുകയുള്ളൂ. ഡേറ്റ ആയാലേ വിലയുണ്ടാകൂ. ഒരു മനുഷ്യൻ ജനിക്കുന്പോൾ മുതൽ വസ്തുതകളുടെ ഖനിയാണ്. ഓരോ ദിവസവും നമ്മൾ ജീവിക്കുന്പോൾ കൂടുതൽ കൂടുതൽ വസ്തുതകൾ നമ്മൾ ഉണ്ടാക്കുന്നു. ഇവ ഓരോന്നിനും വ്യത്യസ്തമായ മൂല്യമാണുള്ളത്. ഉദാഹരണത്തിന് ഒരു കുട്ടി ജനിക്കുന്പോൾ ആ കാര്യം നമ്മൾ പലയിടങ്ങളിൽ രേഖപ്പെടുത്താറുണ്ട്. അതിനൊരു മൂല്യമുണ്ട്. ഡെമോഗ്രഫി ഈസ് ഡെസ്ടിനി. ഇന്നത്തെ ജനസംഖ്യയാണ് നാളത്തെ രാജ്യത്തിന്റെ/പ്രദേശത്തിന്റെ ഭാവി നിർണയിക്കുന്നത്. പോപ്പുലേഷൻ ഡേറ്റ എന്നത് ലോകത്തെ ഏറ്റവും വലിയ സ്വർണ ഖനിയാണ്. ഇന്നത്തെ കുട്ടി നാളത്തെ കസ്റ്റമർ ആണ്. ബേബി ഫുഡ് തൊട്ട് സ്കൂളുകൾ വരെ ആ കുട്ടിക്ക് ആവശ്യമായി വരും. വസ്ത്ര കച്ചവടക്കാർ മുതൽ വാഹന കച്ചവടക്കാർക്ക് വരെ ലോകത്തെവിടെയെല്ലാമാണ് കുട്ടികൾ ഉണ്ടായിരിക്കുന്നത് എന്നതിൽ താത്പര്യമുണ്ട്.
മുൻപ് പറഞ്ഞ ഡേറ്റയിൽ ‘ഒരു കുട്ടി ജനിച്ചു’ എന്ന വിവരം മാത്രമേ ഉള്ളൂ. കുട്ടിയുടെ ഉയരം, തൂക്കം, ഏതെങ്കിലും തരത്തിലുള്ള അംഗവൈകല്യങ്ങൾ ഉണ്ടോ, ആണാണോ, പെണ്ണാണോ, മാതാപിതാക്കളുടെ വിദ്യാഭ്യാസം, വരുമാനം ഇതൊക്കെ പലപ്പോഴും ആശുപത്രി രേഖകളിൽ ഉണ്ടാകും. ഇത്തരം വ്യക്തിപര ഡേറ്റയുടെ മൂല്യം വ്യക്തിപരമല്ലാത്ത വിവരങ്ങളെക്കാൾ വളരെ കൂടുതലാണ്. ജനനം മുതൽ മരണം വരെ നമ്മൾ ഓരോ ദിവസവും ഇത്തരത്തിൽ ഡേറ്റ പോയിന്റുകൾ ഉണ്ടാക്കിക്കൊണ്ടിരിക്കയാണ്. ഫേസ്ബുക്കിൽ ഓൺലൈനായിരിക്കുന്ന ഓരോ മിനിറ്റിലും നമ്മൾ പുതിയ പുതിയ ഡേറ്റ അവിടെ അവശേഷിപ്പിക്കുകയാണ്. ഓരോ പ്രാവശ്യവും സ്വിഗിയിൽ ഭക്ഷണം ഓർഡർ ചെയ്യുന്പോൾ നമുക്ക് കിട്ടുന്നത് ഭക്ഷണവും അവർക്ക് കിട്ടുന്നതു ഡേറ്റയുമാണ്. വാട്സ്ആപ്പ് മുതൽ ജി മെയിൽ വരെ നമ്മൾ നിത്യവും ഉപയോഗിക്കുന്ന പലതും ഡേറ്റ വലിച്ചെടുക്കുന്ന യന്ത്രങ്ങളാണ്. നമുക്ക് സൗജന്യമായോ ലാഭകരമായോ എന്തെങ്കിലും ലഭിക്കുന്നുണ്ടെങ്കിൽ അവരുടെയും പ്രധാന ലക്ഷ്യം ഡേറ്റ തന്നെയാണ്.
ഡേറ്റയും കെഎസ്ആർടിസിയും
നാലാം വ്യവസായ വിപ്ലവത്തിന്റെ കാലത്തെ സന്പദ്വ്യവസ്ഥയിലെ അടിസ്ഥാന അസംസ്കൃത വസ്തു ഡേറ്റ ആണ്. അത് വലിച്ചെടുക്കാനുള്ള സംവിധാനമാണ് ഇന്റർനെറ്റ് ഓഫ് തിംഗ്സ് ആയി വികസിക്കപ്പെടുന്നത്. ഇതറിഞ്ഞേ നമുക്ക് നാളത്തെ ലോകത്തിന് തയാറെടുക്കാനാകൂ. ഒരുദാഹരണം പറയാം: ഇന്ന് കേരളത്തിൽ നഷ്ടത്തിൽ നടക്കുന്ന ഒരു പ്രസ്ഥാനമാണ്, 1965 ൽ രൂപീകൃതമായതെന്ന് വിക്കിപ്പീഡിയ പറയുന്ന കെഎസ്ആർടിസി. 1937 ലുണ്ടായ ട്രാൻവൻകൂർ സ്റ്റേറ്റ് ട്രാൻസ്പോർട്ട് ഡിപ്പാർട്മെന്റിന്റെ തുടർച്ചയാണത്. ഒരു ദിവസം മുപ്പത് ലക്ഷത്തിലധികം യാത്രക്കാർ കെഎസ്ആർടിസി വാഹനങ്ങൾ ഉപയോഗിക്കുന്നുവെന്നാണ് വെബ്സൈറ്റ് പറയുന്നത്. ഇത് കേരള ജനസംഖ്യയുടെ പത്തിൽ ഒന്നു വരും. ഇതിൽ ഒരാൾ ഒരു പ്രാവശ്യം ഒന്നിലേറെ ബസുകളിൽ കയറുന്നു എന്ന് കരുതിയാൽ പോലും പതിനഞ്ചു ലക്ഷമായി. രണ്ടിൽ കൂടുതൽ ബസിൽ കുറച്ചു പേർ കയറുന്നു എന്ന് വിചാരിച്ചാൽ പോലും പത്തുലക്ഷം ആളുകൾ ഓരോ ദിവസവും കെഎസ്ആർടിസി കസ്റ്റമർ ആണ്. അവരുടെ പ്രായം, ലിംഗം, തൊഴിൽ, വിദ്യാഭ്യാസം, ഇ മെയിൽ, കോൺടാക്ട് നന്പർ, ഇവരിൽ എത്ര പേർ സ്ഥിരം കെഎസ്ആർടിസിയിൽ യാത്ര ചെയ്യുന്നു, ആരൊക്കെയാണ് ആഴ്ചാവസാനം യാത്ര ചെയ്യുന്നത്, അതിൽ നാട്ടുകാർ എത്ര, മറു നാട്ടുകാർ എത്ര, മലയാളം അറിയുന്നവർ എത്ര, അറിയാത്തവർ എത്ര തുടങ്ങി അവരെപ്പറ്റി എന്ത് വിവരശേഖരമാണ് കെഎസ്ആർടിസി നടത്തിയിട്ടുള്ളത്?
ഡേറ്റ, ഓയിൽ ആണെന്ന് പ്രവചിച്ച ക്ലൈവ് ഹന്പി എന്ന മഹാൻ ടെസ്കോ സൂപ്പർ മാർക്കറ്റിൽ വരുന്ന എല്ലാ ഉപഭോക്താക്കൾക്കും ഒരു ലോയൽറ്റി കാർഡ് ഉണ്ടാക്കുക വഴി അവരുടെ വിവരങ്ങൾ ശേഖരിക്കുകയാണ് ചെയ്തത്. ആ അറിവ് വെറുതെയായില്ല. ഹന്പി കോടീശ്വരനായി.
ഇതാണ് ഡേറ്റയുടെ ശക്തി. ഇന്നും കെഎസ്ആർടിസിയെ എങ്ങനെ രക്ഷപ്പെടുത്താം എന്ന ചർച്ചകളിൽ എത്ര ബസുകൾ കട്ടപ്പുറത്തിരിക്കുന്നു, ഏതൊക്കെ ബസ് സ്റ്റാൻഡുകൾ വാടകയ്ക്കു കൊടുക്കാം എന്ന തരത്തിലാണ് ചർച്ചകൾ പുരോഗമിക്കുന്നത്. ഡേറ്റയുടെ സാധ്യതകളെ ആരും കാണുന്നതേയില്ല.
ലോകത്തെ ഒരു ആധുനിക ലോജിസ്റ്റിക്സ് കന്പനി കെഎസ്ആർടിസിയെ വിലയ്ക്കെടുക്കാൻ ചിന്തിക്കുന്നു എന്ന് കരുതുക. അവർ കെഎസ്ആർടിസിയുടെ മൂല്യം കണക്കാക്കുന്പോൾ ആദ്യം ചിന്തിക്കുന്നത് നിരത്തിലോടുന്നതോ കട്ടപ്പുറത്തിരിക്കുന്നതോ ആയ ബസുകളെയോ, പണിയെടുക്കുന്നതോ പണിയെടുക്കാത്തതോ ആയ ജോലിക്കാരെയോ, കേരളത്തിലെ എല്ലാ നഗരങ്ങളിലും അവർക്കുള്ള റിയൽ എസ്റ്റേറ്റിനെയോ പറ്റി ആയിരിക്കില്ല. കേരളത്തിലെ ഗ്രാമങ്ങളിൽനിന്ന് പോലുമുള്ള മില്യൺ യാത്രക്കാരെക്കുറിച്ച് ആയിരിക്കും. അവരുടെ ഡേറ്റയും അവരെപ്പറ്റിയുള്ള ഡേറ്റയും ആണ് ഏറ്റവും മൂല്യമുള്ളത്. പക്ഷേ ഈ ഊരുതെണ്ടിയുടെ കൈയിൽ എന്താണുള്ളത്? അതില്ലെങ്കിൽ ഗുരുവിന്റെ ഖബറിൽ മണ്ണുവാരിയിടേണ്ടി വരും!
ഇനിയുള്ള കാലത്ത് ഡേറ്റ ഉണ്ടെങ്കിൽ കന്പനികൾക്ക് ആസ്തിയും ലാഭവും ഒന്നുമില്ലെങ്കിലും വില താനേ ഉണ്ടാകും. എന്തുകൊണ്ടാണ് ലോകത്തുള്ള ആർക്കും ഫ്രീ ആയി ഇമെയിൽ ഉണ്ടാക്കി കൊടുക്കാമെന്ന് പറഞ്ഞ, ചരിത്രത്തിൽ ലാഭം ഉണ്ടാക്കാതിരുന്ന ഹോട്ട് മെയിൽ എന്ന സ്ഥാപനത്തെ മൈക്രോസോഫ്റ്റ് 2800 കോടി രൂപയ്ക്കു വാങ്ങിയത്? എന്തുകൊണ്ടാണ് നാട്ടുകാർക്ക് മുഴുവൻ ഫ്രീ ആയി മണ്ടത്തരം കൈമാറാൻ അവസരമുണ്ടാക്കിയ വാട്ട്സ്ആപ്പിനെ ഫേസ്ബുക്ക് 28,000 കോടി രൂപയ്ക്കു വാങ്ങിയത്? അതുപയോഗിക്കുന്നവരുടെ ഡേറ്റ തന്നെയാണ് അതിന്റെ ഏറ്റവും വലിയ മൂല്യം. അവിടത്തെ സെർവറോ പ്രോഗ്രാമോ ജോലിക്കാരോ ഒന്നുമല്ല. പക്ഷേ ഡേറ്റക്ക് മൂല്യം ഉണ്ടാകണമെങ്കിൽ ആദ്യം ഡേറ്റ ഉണ്ടാകണം. രണ്ടാമത് അത് കംപ്യൂട്ടറുകൾക്ക് ഉപയോഗിക്കാൻ പറ്റുന്ന രീതിയിൽ ആയിരിക്കണം. മൂന്നാമത് അവ ഉപയോഗിക്കാൻ അറിയണം.
യുഎഇയിലെ നിർമിത ബുദ്ധി
2019 ൽ യുഎഇയിലെ ‘നിർമിത ബുദ്ധിയുടെ’ മന്ത്രിയെ കണ്ട കാര്യം ഞാൻ അനവധി തവണ പറഞ്ഞിട്ടുണ്ട്. എന്തുകൊണ്ടാണ് കേരളത്തിന്റെ മൂന്നിലൊന്ന് ജനസംഖ്യയുള്ള യുഎഇ എന്ന ചെറിയ രാജ്യം നിർമിത ബുദ്ധിയുടെ കാര്യത്തിൽ ലോകത്തെ മുൻകിട രാജ്യങ്ങളിൽ ഒന്നായത്? നിർമിത ബുദ്ധിയുടെ പൂർണമായ വളർച്ചയ്ക്കും ഉപയോഗത്തിനും നമുക്കു വേണ്ടത് ഡേറ്റ ആണ്. ഡേറ്റയുടെ കാര്യത്തിൽ അതിന്റെ വ്യാപ്തി, വൈവിധ്യം, വേഗത ഇവയാണ് പ്രധാനമായിട്ടുള്ളത്. എത്രമാത്രം ഡേറ്റ ലഭ്യമാണ്? അവ എത്ര വൈജ്യാത്യം ഉള്ളതാണ്? എത്ര വേഗത്തിൽ ലഭ്യമാണ്? ചെറിയ രാജ്യമായ ദുബായിക്ക് ഡേറ്റയുടെ അളവും അത്രത്തോളം കുറവായിരിക്കുമല്ലോ. 140 കോടി ജനസംഖ്യയുള്ള ഇന്ത്യയുമായി ഒരു കോടിയിൽ താഴെ ജനസംഖ്യയുള്ള ദുബായിക്ക് ഡേറ്റ വോളിയത്തിന്റെ കാര്യത്തിൽ മത്സരിക്കാൻ ഒറ്റനോട്ടത്തിൽ കഴിവില്ല. മൂന്ന് കോടി ജനസംഖ്യയുള്ള കേരളത്തിൽ പോലും അതിനേക്കാൾ കൂടുതൽ ഡേറ്റ ഉണ്ടാകും.
പക്ഷേ ദുബായിൽ ഒരാളുടെ ജനനം മുതൽ മരണം വരെയുള്ള എല്ലാ ഡേറ്റയും കംപ്യൂട്ടറൈസ്ഡ് ആണ്. ആളുകൾ യാത്രക്ക് സ്മാർട്ട് കാർഡുകളും സാധനങ്ങൾ വാങ്ങാൻ ക്രെഡിറ്റ് കാർഡും ഉപയോഗിക്കുന്നു. ഓരോ യാത്രയിലും കച്ചവടത്തിലും ആളുകളുടെ ഡേറ്റ കുന്നുകൂട്ടുകയാണ്. അവ അതിവേഗതയിൽ അത് ഉപയോഗിക്കാൻ അറിയാവുന്നവർക്ക് ലഭ്യമാവുകയാണ്.
ബ്രിട്ടീഷുകാർ ഭരിച്ച രാജ്യമായതിനാൽ നമുക്ക് വളരെ വ്യാപകമായ ഡേറ്റ കളക്ഷൻ സംവിധാനം ഉണ്ട്. പക്ഷെ ഇവ പലപ്പോഴും ഡിജിറ്റൽ അല്ല. ഒരു ഡേറ്റയും ആർക്കും കൊടുക്കാതിരിക്കുക എന്നതാണ് നമ്മുടെ പൊതു രീതി. സർക്കാർ ഡേറ്റ വിദേശ കന്പനികൾക്ക് കൊടുക്കില്ല എന്ന് പറയുന്നത് സ്വാഭാവികം, നാട്ടുകാർക്ക് കൊടുക്കാൻ നിബന്ധനകൾ ഉള്ളതും മനസിലാക്കാം. പക്ഷെ വിവിധ സർക്കാർ ഡിപ്പാർട്ട്മെന്റുകൾ തമ്മിൽ പോലും ഡേറ്റ പരസ്പരം കൈമാറുന്നില്ല എന്നതാണ് സത്യം. ഇവിടെയാണ് കുങ്കുമത്തിന്റെയും ഗർദ്ദഭത്തിന്റെയും കഥ പ്രസക്തമാകുന്നത്. ഇത് ഡേറ്റയെപ്പറ്റിയുള്ള അറിവുകളുടെ ഒരു തുടക്കം മാത്രം. എന്താണ് ബിഗ് ഡേറ്റ, ഡേറ്റ അനലിറ്റിക്സ്, എങ്ങനെയാണ് ഡേറ്റയിൽ നിന്നു നിർമിത ബുദ്ധി ഉണ്ടാകുന്നത്, എന്താണ് ഡേറ്റയിലെ സ്വകാര്യത, സർക്കാരിൽ നിന്നും സ്വിഗിയിൽ നിന്നും പിടിച്ചെടുക്കപ്പെടുന്ന നമ്മുടെ ഡേറ്റക്ക് നമുക്ക് എന്ത് അവകാശമുണ്ട്, നമ്മുടെ സമ്മതമില്ലാതെ വിവരങ്ങൾ ശേഖരിക്കാമോ, ശേഖരിച്ചാൽ അത് വിൽക്കാമോ? വിറ്റാൽ കിട്ടുന്ന പണത്തിന്റെ ഒരംശത്തിന് നമുക്കും അവകാശമുള്ളതല്ലേ? എന്നീ ചോദ്യങ്ങൾക്കൊക്കെ ഉത്തരവുമായി പിന്നീടൊരിക്കൽ വരാം. ചിലപ്പോൾ ഇക്കാര്യത്തിൽ ഒരു സീരീസ് തന്നെ വേണ്ടി വരും.
മുരളി തുമ്മാരുകുടി