செயற்கை நுண்ணறிவு : நவீன அடிமை யுகம் – பாகம் 1

ம்பானி நட்டமடைந்து விட்டார் என மெல்லப் புலம்புகின்றன முதலாளித்துவ ஊடகங்கள். ரிலையன்ஸ் ஜியோ எதிர்பார்த்தபடி லாபம் ஈட்டாததோடு கடந்த 2017, மார்ச் மாதக் கணக்கின் படி சுமார் 22.50 ஆயிரம் கோடி நட்டத்தை சம்பாதித்துள்ளது என்கின்றன ஊடகங்கள். தொலைத் தொடர்புத் துறையின் சக்கரவர்த்தியாக முடிசூடிக் கொள்ள வேண்டும் என்கிற அம்பானியின் கனவு மெல்லக் கலைந்து வருவதாக சில பொருளாதார ஆய்வாளர்கள் ஆருடம் கூறத் துவங்கி விட்டனர்.

எனினும் முகேஷ் அம்பானி தனது இலவசங்களை நிறுத்தவில்லை; தொடர்ந்து இலவச டேட்டாக்களை அள்ளி வீசி வருகிறார். இந்தக் காலாண்டின் துவக்கத்திலிருந்து தனது சேவைகளுக்குக் கட்டணம் வசூலிப்பதாக சொல்லிக் கொண்டாலும்,”கட்டணம்” என்ற பெயரில் சோளப் பொரியை வாங்கிக் கொண்டு யானை மந்தையையே கொடுக்கிறார் அம்பானி. ரிலையன்ஸ் நட்டமடைந்திருப்பதாக ஊடகங்கள் சொன்னாலும், ஏர்டெல் வோடஃபோன் போன்ற போட்டியாளர்களின் பீதி குறையவில்லை – ரிலையன்ஸ் ஜியோவுக்கு சற்றும் குறையாத அளவில் டேட்டாக்களை வாரி வழங்கி வருகின்றனர்.

அவர்களிடம் இருக்கிறது கொடுக்கிறார்கள்; சும்மா கிடைப்பதைப் பயன்படுத்திக் கொள்வதில் என்ன தவறு; அம்பானியிடம் இல்லாத காசு பணமா, அவருக்கெல்லாம் லாபம் ஒரு பொருட்டா – என சிலிர்ப்பவர்களின் வியப்பு இன்னும் குறையவில்லை. அம்பானி எதற்கும் அசராமல் இலவசங்களையும் மலிவு விலை இணையத் தொடர்பையும் கொடுத்துக் கொண்டேயிருக்கிறார்.

***

யன் ராண்டின் “பௌண்டெய்ன் ஹெட் (Fountainhead)” நாவலில் வரும் ‘இலட்சிய’ முதலாளியான கெய்ல் வைனாண்டின் இந்திய வடிவமா அம்பானி? அள்ளித் தெளிக்கப்படும் இலவசங்களின் நோக்கம் தான் என்ன?

அம்பானியின் வாயிலிருந்தே கேட்போம் :

“நான்காம் தொழிற்புரட்சியின் எரிபொருளாக மின் தரவுகளே (data) இருக்கப் போகின்றது” எனக் கடந்த 2016-ம் ஆண்டு மார்ச் மாதம் உரையாற்றிய அம்பானி, “மின் தரவுகள் எண்ணெய் என்றால், நுண்ணுணர் மின் தரவுகள் (intelligent data) பெட்ரோலாகும்” என்றார்.

ஓராண்டுக்குப் பின் பெரும் நட்டத்தைச் சந்தித்திருக்கும் ரிலையன்ஸ் ஜியோ மறுபுறம் இணையப் பரவலை (internet penetration) பொருத்தவரை பாய்ச்சல் வேகத்தில் முன்னேறியுள்ளதை வியப்புடன் பார்க்கிறார்கள் முதலாளிய பொருளாதார வல்லுனர்கள். தகவல் தொடர்பைப் பொருத்தவரை வர்த்தக ரீதியில் ரிலையன்ஸ் பெரும் தோல்வியைச் சந்தித்திருந்தாலும், இணையப் பரவலில் வெற்றிகளைச் சந்தித்துள்ளது. இந்த வெற்றி உடனடியாக லாபத்தை வழங்கி விடவில்லை என்பது உண்மை தான்.

ஆனால் உடனடி லாபம் கிட்டாதெனினும், எதிர்காலத்தில் முதலாளியச் சந்தையின் ஆட்ட விதிகளைத் தீர்மானிக்கவிருப்பது இணையப் பரவலும் அதனால் குவியவிருக்கும் மின் தரவுகளும் தான். குரல் அழைப்புகள் மெல்ல மெல்ல மின் தரவுப் பொதிகளின் பரிமாற்றங்களாக மாறி வருகின்றது. மேலும் தொலைபேசி மட்டுமின்றி தொலைகாட்சிப் பெட்டி மற்றும் வீடுகளில் உள்ள மின்னணுவியல் சாதனங்கள் அனைத்தும் திறன் சாதனங்களாக (Smart Devices) மாறுவதும், அவையனைத்தும் இணையத்தின் மூலம் இணைக்கப்படுவதுமான ஒரு நிலையை நோக்கி தொழில்நுட்பங்கள் முன்னேறிச் செல்கின்றன.

இணையப் பரவலும், இணையத்தின் மூலம் இணைக்கப்படும் பொருட்களின் எண்ணிக்கையும் அதிகரிக்க அதிகரிக்க, மின் தரவுகள் மலையாகக் குவியும் போக்கும் அதிகரிக்கும். மின் தரவுகளைக் கட்டுப்படுத்துவதும், அதனைப் பகுப்பாய்வதன் அடிப்படையிலான தொழில் நடவடிக்கைகளுமே நான்காம் தொழிற்புரட்சிக் காலத்தின் வெற்றி தோல்விகளை நிர்ணயிக்கவிருக்கின்றன என்பதை அம்பானி முன்கூட்டியே உணர்ந்துள்ளார்.

அது என்ன நான்காம் தொழிற்புரட்சி? அம்பானி சொல்லும் நுண்ணுணர் மின் தரவுகள் (Intelligent Data) என்பது என்ன? நான்காம் தொழிற்புரட்சிக்கும் மின் தரவுகளுக்கும் என்ன தொடர்பு?

***

ரோப்பாவில் ஏற்பட்ட மறுமலர்ச்சிக் காலம் அறிவியல் துறையில் ஏராளமான புதிய கண்டுபிடிப்புகளை உந்தித்தள்ளியது. மறுமலர்ச்சிக் காலகட்டத்தைத் தொடர்ந்து சுமார் 1780-ல் இருந்து 1840 வரையிலான காலப் பகுதியில் கைவினைப் பட்டறைகளின் இடத்தை ஒருங்கிணைந்த பெரிய ஆலைகள் பிடித்தன. நீராவியின் ஆற்றல் தொழிற்துறையில் மலைக்கத்தக்க வளர்ச்சியைத் தூண்டியது. உலோகவியல், வேதியியல், இயற்பியல், இயந்திரவியல் போன்ற துறைகளில் ஏற்பட்ட புதிய கண்டுபிடிப்புகள் வளர்ந்து வந்த ஆலைத் தொழில் உற்பத்திக்குத் தேவையான புதிய இயந்திரங்களை படைத்தளித்தன.

1870-ல் இருந்து 1915 வரையிலான காலகட்டத்தில் தொழிற்துறையில் ஏற்பட்ட நவீன வளர்ச்சியும், மிகப் பெருமளவில் எஃகு உற்பத்தித் தொழில்நுட்பங்கள் கண்டுபிடிக்கப்பட்டதும் இரண்டாம் தொழிற்புரட்சிக்கு வித்திட்டன. குறிப்பாக பெரும் ஆலைகளின் பொருத்தும் வரிசை இயந்திரமயமானதும் (Mechanised Assembly line) இப்போக்கை உந்தித்தள்ளியது.  இதே காலகட்டத்தில் மின்சாரத்தின் பயன்பாடு பரவலாகி அதன் பங்குக்கு தொழிற்துறை உற்பத்தியை மேலும் அதிகரிக்கச் செய்தது. பத்தொன்பதாம் நூற்றாண்டின் இறுதியில் துவங்கி இருபதாம் நூற்றாண்டின் தொடக்க காலகட்டம் வரையில் தொலைபேசி வலைப்பின்னல் பரவலாகத் துவங்கியது. இந்தப் போக்கின் விளைவாக உலகளாவிய அளவில் சந்தையைக் கட்டுப்படுத்தும் ஆற்றலை ஏகபோக மூலதனம் பெற்றது.

1960 மற்றும் 1970-களில் ஆய்வுக்கட்டத்தில் இருந்து, பின்னர் 1980-களில் பரவலான மின்னணுவியல் தொழில்நுட்பம் மூன்றாம் தொழிற்புரட்சிக்கு கட்டியம் கூறியது. இந்தக் காலகட்டத்தைத் தொடர்ந்து தொழிற்துறை அதிவேகமாக கணினிமயமாகியது. இதன் தொடர்ச்சியாக ஆலை உற்பத்தி மற்றும் சந்தை ஆகியவற்றைக் கையாள்வதில் இணையத் தொழில்நுட்பம் பெரும் பாத்திரமாற்றத் தொடங்கியது. பல்வேறு நாடுகளின் பங்குச் சந்தைகளை மொய்த்துக் கொண்ட நிதிமூலதனச் சூதாடிகள், உலகின் மறுகோடிக்கு கண் சிமிட்டும் நேரத்தில் தமது மூலதனத்தை அப்படியே பெயர்த்து எடுத்துச் செல்வதை இணையம் எளிமையாக்கிக் கொடுத்தது.

உலக வர்த்தகக் கழகம், உலக வங்கி, பன்னாட்டு நாணய நிதியம் மற்றும் ஏகாதிபத்திய அரசுகளின் மூலம் மேலிருந்து அதிகாரம் செலுத்தி, தேசிய எல்லைகளைத் தகர்த்து தனது உலக மேலாதிக்கத்தை நிலைநாட்டிக் கொண்ட ஏகாதிபத்திய நிதிமூலதனம், தகவல் தொழில்நுட்பம் வழங்கிய மேற்கண்ட சாத்தியங்களின் மூலம் தேசியத்தின் வேர்களை கீழிருந்தும் அரித்து அறுத்தது.

***

மூன்றாம் தொழிற்புரட்சியின் நீட்சியாக நான்காம் தொழிற்புரட்சி  வருகின்றது. இணையத்தின் பரவலால் உற்பத்தியாகும் அபரிமிதமான மின் தரவுகளே இப்புதிய போக்கை தனித்து அடையாளம் காட்டுகின்றன. மேலும், கணினித் துறையிலும், ஆலை உற்பத்தித் துறையிலும் ஏற்பட்டுள்ள அபரிமிதமான வளர்ச்சிகள் இணைய தொழில்நுட்பத்தின் மூலம் மையப்பட்ட ரீதியில் இணைக்கப்பட்டுள்ளன. பொருட்களின் இணையம் (Internet of Things – IOT) என அழைக்கப்படும் இப்புதிய போக்கு, மலை மலையாக மின் தரவுகளை உற்பத்தி செய்து குவிக்கின்றது.

இவ்வாறு குவியும் மின் தரவுகள் மீப்பெரும் மின் தரவுகள் (Big Data) என்று அழைக்கப்படுகின்றது. இந்த மீப்பெரும் மின் தரவுக் குவியலை பகுப்பாய்வு செய்வது சந்தையைப் ‘புரிந்து கொள்வதற்கும்’ நடப்பில் இருக்கும் தொழில்நுட்பங்களின் துல்லியத்தை அதிகரிப்பதற்கும் உதவும் என்பதை கூகுள், ஐ.பி.எம், மைக்ரோசாப்ட் உள்ளிட்ட பெரும் பன்னாட்டுத் தொழிற்கழகங்கள் புரிந்து கொண்டன. இதே காலகட்டத்தில் உருவான மீப்பெரும் மின் தரவுப் பகுப்பாய்வு (Big Data & Analytics) தொழில்நுட்பம், நான்காம் தொழிற்புரட்சிக் காலத்தின் முக்கியமான நிகழ்வாகும். பின்வரும் தொழில்நுட்ப முன்னேற்றங்கள் இக்காலகட்டத்தின் தனித்த அடையாளங்களாகும்.

ரோபோட்டிக்ஸ் எனப்படும் தானியங்கிப் பொறி பல்வேறு உற்பத்தித் தொழில்களில் தானியங்கல் (Automation) முறையை அறிமுகப்படுத்தியுள்ளது. மீநுண் தொழில்நுட்பம் (Nano Technology) எனப்படும் அணு, மூலக்கூறு, மீமூலக்கூறு அளவில் பொருட்களை கையாளும் தொழிற்கலை, அணு மற்றும் மூலக்கூறியல் விஞ்ஞானத்தில் பெரும் பாய்ச்சலான வளர்ச்சியை உண்டாக்கும் என எதிர்பார்க்கப்படுகின்றது. தற்போது இவ்வறிவியல் ஆய்வுக் கட்டத்தில் உள்ளது.

அதே போல் ஆய்வுக் கட்டத்தில் உள்ள குவையக் கணியத் தொழில்நுட்பம் (Quantum computing) கணினிகளின் செயற்திறனை நடப்பில் உள்ளதை விடப் பன்மடங்கு உயர்த்தும் என எதிர்பார்க்கப்படுகின்றது. முப்பரிமாண அச்சுத் தொழில்நுட்பம் (3D Printing) மற்றும் உயிரித் தொழில்நுட்பமும் தற்போது ஆய்வுக் கட்டத்தில் உள்ளன.

நான்காம் தொழிற்புரட்சிக் கட்டத்தில் செயற்கை நுண்ணறிவுத் (Artificial Intelligence) துறையில் ஏற்பட்டுள்ள வளர்ச்சியும், அந்த வளர்ச்சியில் மீப்பெரும் மின் தரவுப் பகுப்பாய்வு ஆற்றியுள்ள பங்கும் குறிப்பிடத்தக்கதாகும். இத்தொழில்நுட்பங்களின் வளர்ச்சிக்குப் பங்காற்றியுள்ள மின் தரவுகளின் குவிதல் சமீபத்திய ஆண்டுகளில் வியப்பூட்டும் அளவுகளை எட்டியுள்ளது.

***

தொன்னூறுகளின் துவக்கத்தில் உலகளாவிய இணைய வலைப்பின்னலின் மூலம் ஒவ்வொரு நொடியிலும் சுமார் 100 ஜி.பி அளவுக்கான மின் தரவுகளே உற்பத்தியாயின. இன்றோ ஒவ்வொரு நொடியும் ஐம்பதாயிரம் ஜி.பி டேட்டா உற்பத்தியாவதாக கார்ட்னர் எனும் ஆய்வு நிறுவனம் வெளியிட்டுள்ள புள்ளிவிவரம் தெரிவிக்கின்றது. உலகம் முழுவதும் ஒரு நாளில் உற்பத்தியாகும் மின் தரவுகளை டி.வி.டி தட்டில் எழுதி அவற்றை ஒன்றன் மேல் ஒன்றாக அடுக்கினால் அது நான்கு ஈஃபில் டவர்களின் உயரத்துக்கு வரும் என்கிறது ஃபோர்ப்ஸ் பத்திரிக்கையில் 2015-ல் வெளியான ஒரு கட்டுரை. இன்று அதன் அளவு ஐந்து ஈஃபில் டவர்களின் உயரத்தையும் விஞ்சக் கூடும்.

ஜி.பி கணக்குகள் கொஞ்சம் புரிந்து கொள்ள சிரமமாக இருக்கும்; நாம் பின்வருமாறு புரிந்து கொள்வோம். அதாவது ஒவ்வொரு நாளும் உற்பத்தியாகும் மின் தரவுகளின் அளவு என்பது 53 லட்சம் கோடிப் பாடல்களின் அளவுக்கு ஈடானது. அல்லது அவை வீடியோக்களாக இருந்து அவற்றை ஓடவிட்டால், சுமார் 90 ஆண்டுகளுக்கு தொடர்ச்சியாக ஓடும். நினைவில் கொள்ளுங்கள் – இவை ஒரே ஒரு நாளில் உற்பத்தியாகும் மின் தரவுகளின் கணக்கு மட்டுமே. இந்த மொத்த மின் தரவில் 90% சதவீதம் கட்டமைவற்ற மின் தரவுகள் (Unstructured Data) என்று வகைப்படுத்தப்படுகின்றன.

கட்டமைவற்ற மின் தரவுகள் எனப்படுபவை யாவை? முகநூல், டிவிட்டர், வாட்ஸ்-அப் போன்ற சமூகவலைத்தளங்களில் பதிவேற்றப்படும் புகைப்படங்கள், நிலைத்தகவல்கள் துவங்கி, நாம் குறிப்பிட்ட சமூகவலைத்தளங்களில் எதைப் பார்க்கிறோம், எதற்கு விருப்பம் தெரிவிக்கிறோம், யாரையெல்லாம் பின் தொடர்கிறோம் என்பவை உள்ளிட்டு – எப்போது எங்கே பயணிக்கிறோம் என்கிற விவரங்கள் வரை மின் தரவுகளாக சேமிக்கப்படுகின்றன. இது தவிர, இணையத்தில் பொருட்கள் வாங்குவது, அல்லது இணையம் மூலம் பணப்பரிவர்த்தனைகளில் ஈடுபடுவது, யூடியூபில் வீடியோக்கள் பார்ப்பது உள்ளிட்ட நமது நடவடிக்கைகள் பற்றிய அனைத்து விவரங்களும் மின் தரவுகளாக சேமிக்கப்படுகின்றன.

உதாரணமாக யூடியூபில் ஒருவர் எவ்வளவு நேரம் காணொளிகள் பார்க்க செலவிடுகிறார், எந்த மாதிரியான காணொளிகளைப் பார்க்கிறார், எந்த வரிசையில் பார்க்கிறார், எவற்றுக்கெல்லாம் விருப்பம் தெரிவிக்கிறார், எவற்றைப் பகிர்கிறார் போன்ற விவரங்களும் மின் தரவுகளாக சேமிக்கப்படுகின்றன.

இணையமே பயன்படுத்தாத, வெறும் கருப்பு வெள்ளை கைப்பேசி மட்டுமே பயன்படுத்துகின்றவராக இருந்தாலும் கூட, அந்தக் கைப்பேசி ஒவ்வொரு சில நொடிகளுக்கும் அருகில் இருக்கும் செல்பேசி கோபுரத்துடனான தனது தொடர்பை உறுதி செய்து கொண்டுதானிருக்கிறது. இவ்வாறு ஒவ்வொரு செல்பேசி கோபுரத்துக்கு அனுப்பப்படும் சிக்னல்களும் மின் தரவுகளாக சேமிக்கப்படுகின்றது.

மேலும், இணையத்துடன் இணைக்கப்பட்ட மருத்துவ உபகரணங்கள், சென்சார் பொருத்தப்பட்ட வாகனங்கள், வீடுகளில் பயன்படுத்தப்படும் திறன் தொலைக்காட்சிப் பெட்டி (Smart TV) உள்ளிட்ட திறன் சாதனங்கள் என இணையத்தால் இணைக்கப்பட்ட பொருட்கள் (Internet of Things) அனைத்தும் மின் தரவுகளை உற்பத்தி செய்கின்றன. சமூக வலைத்தள நடவடிக்கைகள் – படங்கள், காணொளிகள் பகிர்வது, விருப்பம் தெரிவிப்பது, இணைய உரையாடல், யூடியூப் போன்ற தளங்களில் காணொளிகள் பார்ப்பது குறித்த விவரங்கள் போன்றவை அனைத்தும் உலகளவில் குவிந்து வரும் மின் தரவுகளுக்கான மிக முக்கியமான மூலங்களாக உள்ளன.

மேலே பட்டியலிடப்பட்ட வழிகளில் உற்பத்தியாகி பின்னர் சேமிக்கப்படும் மின் தரவுகள் அனைத்தும் “கட்டமைவற்ற மின் தரவுகள்” என்று வகைப்படுத்தப்படுகின்றன. அதாவது இவையனைத்தும் முன்தீர்மானிக்கப்பட்ட கட்டமைவு ஏதுமில்லாத மின் தரவுகள். அதே நேரத்தில், கணினிகளில் நிறுவப்பட்டுள்ள மைக்ரோசாப்ட் வேர்ட், எக்செல் போன்ற ஏதாவது ஒரு குறிப்பிட்ட மென்பொருளை இயக்கியதன் மூலமோ, மின்னஞ்சல்களின் வழியாகவோ உருவாகும் மின் தரவுகளின் உட்கட்டமைப்பு முன்தீர்மானிக்கப்பட்டது. இவை கட்டமைவான மின் தரவுகள் (Structured Data) என வகைப்படுத்தப்படுகின்றன.

***

ட்டமைவற்ற மின்தரவுகளை எதற்காக சேமிக்க வேண்டும்? சுமார் பத்தாண்டுகளுக்கு முன் ”அதிகமாக இருப்பதும் ஒன்றுமில்லாதிருப்பதும் வேறுவேறல்ல” என்கிற கண்ணோட்டமே இது விசயத்தில் நிலவி வந்தது. அதாவது, கைநிறைய அள்ளிய கழுதை விட்டையைப் போல், அன்றாடம் வந்து குவியும் மின் தரவுகளை வைத்துக் கொண்டு எதுவும் செய்ய முடியாது என்றும், அது ஒரு சுமையாகவுமே கருதப்பட்டது.

ஏனெனில், மிகப் பெரிய அளவில் குவியும் கட்டமைவற்ற மின் தரவுகளைப் பகுப்பாய்வுக்கு (data analytics) உட்படுத்த அப்போதிருந்த தொழில்நுட்பங்கள் போதுமானதாக இல்லை. அந்த சமயத்தில் பிரபலமாக இருந்த மின் தரவுப் பகுப்பாய்வு மென்பொருட்கள், கட்டமைவான மின் தரவுகளைக் கையாள்வதற்கு ஏற்பத்தான் வடிவமைக்கப்பட்டிருந்தன. மேலும், தேவைப்படாத மின் தரவுகளைச் சேமித்து வைப்பதும் தொழில் நுட்பரீதியில் மிகவும் செலவு பிடிக்கத்தக்கதாக இருந்தது.

கட்டமைவற்ற மின் தரவுகளை பகுத்தாயும் திறன் கொண்ட தொழில்நுட்பம் சுதந்திர மென்பொருள் (Open Source) குழுக்களால் உருவாக்கப்பட்டன. குறிப்பாக ஓப்பன் சோர்ஸ் நிறுவனமான அப்பாச்சே உருவாக்கிய ஹடூப் (Apache Hadoop) எனும் மென்பொருள் கட்டமைவற்ற மீப்பெரும் மின் தரவுப் பகுப்பாய்வுக்கு இருந்த தடைகளை உடைத்தது. இன்று சந்தையில் பிரபலமாக உள்ள பெரும்பாலான மீப்பெரும் மின் தரவுப் பகுப்பாய்வு மென்பொருட்கள், அப்பாச்சே ஹடூப்பின் செயல் அடிப்படைகளை உட்செரித்துக் கொண்டே உருவாக்கப்பட்டன. மீப்பெரும் மின் தரவுகளைப் பகுத்தாயும் தொழில்நுட்பங்கள் வளர்ந்த பின் செயற்கை நுண்ணறிவுத் தொழில்நுட்பம் ஒரு புதிய வேகத்தில் வளரத் துவங்கியது.

இனி, மீப்பெரும் மின் தரவுக் குவியலில் ஆகப் பெரும்பான்மையாக உள்ள கட்டமைவற்ற மின் தரவுகளில் மிக முக்கிய பங்காற்றும் சமூக வலைத்தளங்கள் வடிவமைக்கப்பட்டிருக்கும் முறை குறித்துப் பார்ப்போம்.

(தொடரும்)

– சாக்கியன், வினவு
புதிய கலாச்சாரம், ஜூலை 2017

http://www.vinavu.com/2017/10/02/data-is-the-new-oil-of-the-new-era-of-fourth-industrial-revolution/

Last Updated on Monday, 04 December 2017 08:22