கம்ப்யூட்டர் என்றாலே ஆங்கிலத்திலேயே இயங்கக்கூடியது என்று பலரும் நினைத்துக் கொண்டிருக்கின்றனர். இதற்கு முக்கிய காரணங்கள்- கணித்திரையகத்தில் ஆங்கிலத்திற்கான முக்கியத்துவம், கணிப்பொறியின் ஆங்கில அச்சு முறைகள் மற்றும் கணிப்பொறியைப் பற்றி வெளிநாட்டுப் புது செய்திகளும், அறிவிப்புகளுமே இப்படி ஒரு மாயையை மக்கள் மனதில் பதித்துள்ளன.
ஆனால் இவையனைத்தும் ஒரு தவறான கருத்தாகும். கம்ப்யூட்டரில் ஆங்கிலம் போல எந்த இந்திய மொழியையும் பயன்படுத்திக் கொள்ளலாம். இன்றைய நிலையில் கம்ப்யூட்டரில் தமிழ்ப் பயன்பாடு இரு நிலைகளில் பயன்படுகிறது. அவை அச்சுவேலை மற்றும் தகவல் தொடர்பு பணிகளே ஆகும். கம்ப்யூட்டர் வாயிலாக அச்சு வேலைகளில் அச்சகம், விளம்பர நிறுவனங்கள், பதிப்பகங்கள், தட்டச்சு மையங்களில் பயன்படுகிறது. தகவல் தொடர்பில் மல்டிமீடியா, கடிதப்போக்குவரத்து, இணையம் ஈமெயில், செல்லுலர், பேஜர் என முக்கியப் பணிகளிலும் தமிழ் மொழி கம்ப்யூட்டர் வாயிலாகப் பயன்படுத்தப்படுகிறது. இவ்வாறு பல்வேறு துறைகளிலும் பயன்படும் தமிழ்மொழி எப்படி கணிப்பொறியில் பொருந்துகிறது? செயல்படுகிறது? சிக்கல்கள், தீர்வுகள் ஆகியன பற்றி இப்போது காண்போமா?
கம்ப்ட்டரில் தமிழ்ப் பயன்பாடு அறிவதற்கு முன் கம்ப்யூட்டர் எவ்வாறு செயல்படுகிறது என்பதை முதலில் காண்போம். ஒரு கம்ப்ட்டர் பூஜ்யம், ஒன்று ஆகிய எண்கள் அடங்கிய பைனரி எண்களைக் கொண்டுதான் செயல்படுகிறது. அதற்கு ஆங்கிலமோ, தமிழோ அல்லது வேறு எந்த மொழியோ புரியாது. இருப்பினும், ஒரு கணிப்பொறிரயை எந்தத் துறையிலும் பயன்படுத்த முடியுமா? என்று வியக்க வைக்கும் அளவிற்கு நம் அன்றாட வாழ்க்கையில் கணிப்பொறி பயன்பட்டு வருவதை நாம் அறிவோம். உதாரணத்திற்கு நாம் தினமும் படிக்கும் பத்திரிகையில் இருந்து விண்ணில் செலுத்தும் செயற்கைக் கோள் வரை கணிப்பொறி பயன்படுத்தப்படுகிறது. ஆனால் எந்தத் துறையில் பயன்படுத்தினாலும் சரி, அந்தத்துறைக்குத் தேவையான தகவல்களை அதாவது டேட்டாவை எண்களாகத்தான் சேமிக்க வேண்டும். கணிப்பொறியை ஒரு கணிப்பானாக (Calculator) நாம் பயன்படுத்தும் பொழுது எந்தத் சிக்கலும் ஏற்படாது. ஏனென்றால் அதற்குத் தேவையான தகவல்கள் எண்கள் தான். அதே கணிப்பொறியை நாம் அச்சுத்துறைக்குப் பயன்படுத்தும் பொழுது நாம் பேசும் ஒரு மொழியின் எழுத்துக்களைத்தான் பயன்படுத்திச் சேமிக்க வேண்டும் அல்லவா! அதனால் ஒரு கணிப்பொறி செயல்பாட்டுத் தேவையின்படி நாம் ஒவ்வொரு எழுத்தையும் ஒவ்வொரு எண்ணாக மாற்றித்தான் சேமிக்கவேண்டும். ஒரு மொழியை நாம் கணிப்பொறியில் பயன்படுத்த வேண்டுமென்றால் அந்த மொழியின் ஒவ்வொரு எழுத்துக்கும் ஒவ்வொரு எண்ணை நிர்ணயிக்க வேண்டும். இவ்வாறு நிர்ணயிக்கும் முறையை நாம் “குறியீட்டு முறை” (Character Encoding) என்று அழைக்கிறோம்.
நாம் இந்த குறியீட்டு முறையைப் பயன்படுத்தி ஒரு புத்தகத்தின் பக்கங்களைச் சேமித்துவிடுகிறோம் என்று வைத்துக்கொள்வோம். பிறகு அதை நாம் அச்சிட்டோர் அல்லது கணிப்பொறி திரையிலோ பார்க்க விரும்பும் பொழுது அந்த எண்ணை எழுத்துக்களாக மாற்றித்தானே பார்க்கவேண்டும். இதற்காக கணிப்பொறியில் எழுத்துரு (Font) என்ற ஃபைல் பயன்படுத்தப்படுகிறது. இந்த எழுத்துரு ஒவ்வொரு எண்ணுக்கும் என்ன வடிவம் என்பதை குறிப்பிட்டு விடும்.
ஆங்கில மொழிக்கு “ஆஸ்கி” ASCII (American Standard Code For Information Interchange) அல்லது அதன் அடிப்படையில் உருவாக்கப்பட்ட விண்டோஸ் ஆன்ஸி என்ற குறியீட்டு முறையைப் பயன்படுத்துகிறார்கள். தமிழில் ஒவ்வொரு மென்பொருள் எழுத்துரு தனியார் தயாரிப்பாளரும் ஒவ்வொரு குறியீட்டு முறையைப் பயன்படுத்தி வந்தார்கள். இதனால் ஒரு எழுத்துரு குறியீட்டு முறையைப் பயன்படுத்திச் சேமித்த தகவல்களை மற்றொரு எழுத்துரு குறியீட்டு முறையைப் பயன்படுத்தும் மென் பொருளால் அறிய முடியாத நிலை நிலவியது.
மேலும் புனேயில் உள்ள சி-டாக் நிறுவனம் பல்வேறு அறிவியல் அறிஞர்களின் கூட்டுடன் இஸ்கி (Indian Standard Code for Information Interchange-ISCII) என்ற குறியீட்டு முறையை அறிமுகப்படுத்தியது. இந்த இஸ்கி முறையானது இந்தியாவில் மொழிகள் அனைத்திற்கும் பொதுவனாதாகும் இந்திய மத்திய அரசு நிறுவனங்கள் மற்றும் மாவட்ட ஆட்சி மையங்களில் புகழ்பெற்ற அளவுக்குப் பொதுமக்களிடம் இக்குறியீடு புகழ்பெறாததால் தோல்வியைத் தழுவியது.
இந்த நிலையை மாற்றிட, ஆங்கிலம் போல் தமிழிலும் எல்லோரும் ஒரே குறியீட்டு முறையை பயன்படுத்த வேண்டும். சென்னையில் 1999-ஆம் ஆண்டு பிப்ரவரி 7-8 தேதிகளில் நடைபெற்ற உலகத்தமிழிணைய மாநாட்டில் தமிழக அரசு இதற்கு தேவையான முயற்சிகளை மேற்கொண்டு சர்வதேச அங்கீகாரம் பெற்ற பொதுவான ஆஸ்கி குறியீட்டு முறையை அறிவித்தது. தற்போது யுனிகோட் சக்தி வாய்ந்த சர்வதேச குறியீட்டு முறையாக மாறியுள்ளது.
ஆனால் இவையனைத்தும் ஒரு தவறான கருத்தாகும். கம்ப்யூட்டரில் ஆங்கிலம் போல எந்த இந்திய மொழியையும் பயன்படுத்திக் கொள்ளலாம். இன்றைய நிலையில் கம்ப்யூட்டரில் தமிழ்ப் பயன்பாடு இரு நிலைகளில் பயன்படுகிறது. அவை அச்சுவேலை மற்றும் தகவல் தொடர்பு பணிகளே ஆகும். கம்ப்யூட்டர் வாயிலாக அச்சு வேலைகளில் அச்சகம், விளம்பர நிறுவனங்கள், பதிப்பகங்கள், தட்டச்சு மையங்களில் பயன்படுகிறது. தகவல் தொடர்பில் மல்டிமீடியா, கடிதப்போக்குவரத்து, இணையம் ஈமெயில், செல்லுலர், பேஜர் என முக்கியப் பணிகளிலும் தமிழ் மொழி கம்ப்யூட்டர் வாயிலாகப் பயன்படுத்தப்படுகிறது. இவ்வாறு பல்வேறு துறைகளிலும் பயன்படும் தமிழ்மொழி எப்படி கணிப்பொறியில் பொருந்துகிறது? செயல்படுகிறது? சிக்கல்கள், தீர்வுகள் ஆகியன பற்றி இப்போது காண்போமா?
கம்ப்ட்டரில் தமிழ்ப் பயன்பாடு அறிவதற்கு முன் கம்ப்யூட்டர் எவ்வாறு செயல்படுகிறது என்பதை முதலில் காண்போம். ஒரு கம்ப்ட்டர் பூஜ்யம், ஒன்று ஆகிய எண்கள் அடங்கிய பைனரி எண்களைக் கொண்டுதான் செயல்படுகிறது. அதற்கு ஆங்கிலமோ, தமிழோ அல்லது வேறு எந்த மொழியோ புரியாது. இருப்பினும், ஒரு கணிப்பொறிரயை எந்தத் துறையிலும் பயன்படுத்த முடியுமா? என்று வியக்க வைக்கும் அளவிற்கு நம் அன்றாட வாழ்க்கையில் கணிப்பொறி பயன்பட்டு வருவதை நாம் அறிவோம். உதாரணத்திற்கு நாம் தினமும் படிக்கும் பத்திரிகையில் இருந்து விண்ணில் செலுத்தும் செயற்கைக் கோள் வரை கணிப்பொறி பயன்படுத்தப்படுகிறது. ஆனால் எந்தத் துறையில் பயன்படுத்தினாலும் சரி, அந்தத்துறைக்குத் தேவையான தகவல்களை அதாவது டேட்டாவை எண்களாகத்தான் சேமிக்க வேண்டும். கணிப்பொறியை ஒரு கணிப்பானாக (Calculator) நாம் பயன்படுத்தும் பொழுது எந்தத் சிக்கலும் ஏற்படாது. ஏனென்றால் அதற்குத் தேவையான தகவல்கள் எண்கள் தான். அதே கணிப்பொறியை நாம் அச்சுத்துறைக்குப் பயன்படுத்தும் பொழுது நாம் பேசும் ஒரு மொழியின் எழுத்துக்களைத்தான் பயன்படுத்திச் சேமிக்க வேண்டும் அல்லவா! அதனால் ஒரு கணிப்பொறி செயல்பாட்டுத் தேவையின்படி நாம் ஒவ்வொரு எழுத்தையும் ஒவ்வொரு எண்ணாக மாற்றித்தான் சேமிக்கவேண்டும். ஒரு மொழியை நாம் கணிப்பொறியில் பயன்படுத்த வேண்டுமென்றால் அந்த மொழியின் ஒவ்வொரு எழுத்துக்கும் ஒவ்வொரு எண்ணை நிர்ணயிக்க வேண்டும். இவ்வாறு நிர்ணயிக்கும் முறையை நாம் “குறியீட்டு முறை” (Character Encoding) என்று அழைக்கிறோம்.
நாம் இந்த குறியீட்டு முறையைப் பயன்படுத்தி ஒரு புத்தகத்தின் பக்கங்களைச் சேமித்துவிடுகிறோம் என்று வைத்துக்கொள்வோம். பிறகு அதை நாம் அச்சிட்டோர் அல்லது கணிப்பொறி திரையிலோ பார்க்க விரும்பும் பொழுது அந்த எண்ணை எழுத்துக்களாக மாற்றித்தானே பார்க்கவேண்டும். இதற்காக கணிப்பொறியில் எழுத்துரு (Font) என்ற ஃபைல் பயன்படுத்தப்படுகிறது. இந்த எழுத்துரு ஒவ்வொரு எண்ணுக்கும் என்ன வடிவம் என்பதை குறிப்பிட்டு விடும்.
ஆங்கில மொழிக்கு “ஆஸ்கி” ASCII (American Standard Code For Information Interchange) அல்லது அதன் அடிப்படையில் உருவாக்கப்பட்ட விண்டோஸ் ஆன்ஸி என்ற குறியீட்டு முறையைப் பயன்படுத்துகிறார்கள். தமிழில் ஒவ்வொரு மென்பொருள் எழுத்துரு தனியார் தயாரிப்பாளரும் ஒவ்வொரு குறியீட்டு முறையைப் பயன்படுத்தி வந்தார்கள். இதனால் ஒரு எழுத்துரு குறியீட்டு முறையைப் பயன்படுத்திச் சேமித்த தகவல்களை மற்றொரு எழுத்துரு குறியீட்டு முறையைப் பயன்படுத்தும் மென் பொருளால் அறிய முடியாத நிலை நிலவியது.
மேலும் புனேயில் உள்ள சி-டாக் நிறுவனம் பல்வேறு அறிவியல் அறிஞர்களின் கூட்டுடன் இஸ்கி (Indian Standard Code for Information Interchange-ISCII) என்ற குறியீட்டு முறையை அறிமுகப்படுத்தியது. இந்த இஸ்கி முறையானது இந்தியாவில் மொழிகள் அனைத்திற்கும் பொதுவனாதாகும் இந்திய மத்திய அரசு நிறுவனங்கள் மற்றும் மாவட்ட ஆட்சி மையங்களில் புகழ்பெற்ற அளவுக்குப் பொதுமக்களிடம் இக்குறியீடு புகழ்பெறாததால் தோல்வியைத் தழுவியது.
இந்த நிலையை மாற்றிட, ஆங்கிலம் போல் தமிழிலும் எல்லோரும் ஒரே குறியீட்டு முறையை பயன்படுத்த வேண்டும். சென்னையில் 1999-ஆம் ஆண்டு பிப்ரவரி 7-8 தேதிகளில் நடைபெற்ற உலகத்தமிழிணைய மாநாட்டில் தமிழக அரசு இதற்கு தேவையான முயற்சிகளை மேற்கொண்டு சர்வதேச அங்கீகாரம் பெற்ற பொதுவான ஆஸ்கி குறியீட்டு முறையை அறிவித்தது. தற்போது யுனிகோட் சக்தி வாய்ந்த சர்வதேச குறியீட்டு முறையாக மாறியுள்ளது.
No comments:
Post a Comment