யூனிகோட்டை ஒருங்குறியாக்க வேண்டாம் !
Apr 26th, 2004 by இரா. செல்வராசு
தமிழ்-உலகம் யாஹூ மின்குழுமத்தில் யூனிகோடு பற்றிய கலந்துரையாடல் நடக்கிறது என்று அறிந்து நானும் சென்று அங்கு உறுப்பினனாய் ஆனேன். யூனிகோட்டிற்கு மாற இன்னும் தயக்கம் நிறையப் பேருக்கு இருக்கிறது. ஆனால் சிலர் சொல்லும் காரணங்கள் சரியானதாக இல்லை.
உதாரணத்திற்கு அகர வரிசைப் படுத்த இது சரியில்லை என்று ஒரு கருத்து. ஆனால், யூனிகோடு என்பது சகலத்திற்கும் தீர்வான ஒரு சர்வ நிவாரணி அல்ல. இது அடிப்படையாய் எழுத்துக்களுக்கு(உண்மையில் எழுத்து வடிவங்களுக்கு) ஒரு எண்ணைச் சமன்படுத்தும் ஒரு அட்டவணை தான். அகர வரிசைப் படுத்துவது எல்லாம் அதன் மேல் எழுதப் படும் நிரலிகளின் பணி என்பதை யூனிகோடு சேர்த்தியமும் தெளிவாகச் சொல்லி இருக்கிறது
Collation in general must proceed at the level of language or language variant, not at the script or codepoint levels.
நிற்க. யூனிகோடு முறைக்கு மாறுவதா வேண்டாமா என்பது ஒரு புறம் இருக்க, சகலத்தையும் தமிழ்ப் படுத்துகிறேன் பேர்வழி என்று யூனிகோடு என்கிற பெயரை ஒருங்குறி என்று தமிழ்ப் படுத்தி இருப்பது வேடிக்கையாக இருக்கிறது. இதையே ஒன்றியக் குறி என்றும் சில இடங்களில் வழங்குகிறார்கள். இது ஏன்? யூனிகோடு என்பது ஒரு பெயர் (proper noun). அதனை இப்படி மாற்றுவது சரியல்ல. ஆஸ்கி, தஸ்கி, இசுக்கி (!) என்றெல்லாம் வழக்கத்தில் இருக்க, யூனிகோடு மட்டும் என்ன செய்தது? பல சிக்கலான ஆங்கிலச் சொற்களுக்குத் தமிழ்ப் பதங்கள் கண்டுபிடித்துக் கொடுக்கும் இராம.கி-யே இப்படி பாவிக்கிறார் என்றாலும், இது சரியில்லை என்பது என் கருத்து.
Consortium என்பதற்குச் சேர்த்தியம் என்கிற பதம் வேண்டுமானால் நன்றாக இருக்கிறது.
சில நாட்களுக்கு முன்னால் RedHat என்பதை ஏன் செந்தொப்பி என்று எழுதக் கூடாது என்று வெங்கட் எழுதி இருந்தார். அதைப் போன்றது தான் இதுவும்.
அதனால், மாறுவதற்கு இன்னும் கொஞ்சம் தயங்கினாலும் பரவாயில்லை. யூனிகோட்டை ஒருங்குறியாக்காதீர்கள்.
செல்வராஜ், யூனிகோடை விண்டோஸ்98ல் தெரிய வைக்க என்ன செய்ய வேண்டும்? இந்தியாவில் குறிப்பாக பிரவுசிங் மையங்களில் எக்ஸ்பி இருப்பதாக தெரியவில்லை. அங்கு என்ன செய்வது?
யூனிஸ்க்ரைப் இயந்திரத்திற்கான DLL கோப்பை இற்றைப்படுத்த வேண்டும். ஒரு தமிழ் யூனிகோட் எழுத்துரு இருக்க வேண்டும். புதிய, அதாவது IE6.0 இருந்தால் அதுவே போதும். IE உள்ளே சென்று ‘tamil’ எழுத்துருவுக்கு புதிதாகச் சேர்த்த தமிழ் யூனிகோடு எழுத்துருவை அடையாளம் காட்டி விட்டால் அவ்வளவுதான்.
பிரபு, எனக்கு விண்டோஸ்-98ல் நேரடி அனுபவம் இல்லை. பத்ரி சொல்வதைப் பார்த்தால், அது ஒன்றும் பெரிய சிக்கல் அல்ல போலத் தான் தெரிகிறது. கூகிளில் தேடிப் பார்த்தேன் – எழில்நிலாவில் சில கட்டுரைகளும், கிருபா சங்கர் எழுதிய ஒரு வேடிக்கைக் கட்டுரையும் தெரிந்தது. ஓப்பன் ஆபீஸ் பாவிக்கச் சொல்கிறார் முகுந்த்.
நன்றி ஓகே..நானே முயல்கிறேன். இல்லை கிருபாவை தொலைபேசியில் தொடர்பு கொண்டால் போயிற்று..
என்னிடமும் விண்டோஸ்98 இல்லாத்தால் சில சந்தேகங்கள் இன்னும் தீராமல் இருக்கின்றன. இந்த முறை ஊருக்கு வந்ததும் எல்லாம் விளங்கிவிடும் என்று நினைக்கிறேன்.
சமீபத்தில் இந்தியா சென்ற போது, சிறிது சிரமப்பட்டது உண்மைத்தான். நல்ல வேளையாக முரசு இருந்ததால் சமாளித்தேன். Dynamic Font உபயோகிக்கும் தலங்கள் indic support இல்லாத Win2000 லைவிட நன்றாக தெரிகிறது. கையோடு Tamil Fonts வைத்திருப்பது நல்லது…//யூனிஸ்க்ரைப் இயந்திரத்திற்கான DLL கோப்பை இற்றைப்படுத்த வேண்டும். // அதற்க்கு முன் பிரவுசிங் மையம் நடத்துபவரை “காக்கா” பிடிக்க வேண்டும்…
நான் தமிழகத்தில் சில மாதங்களுக்கு முன் இருந்தபோது எனது பதிவுகளே விண்டோஸ்98ல் சரியாகத் தெரியவில்லை. இத்தனைக்கும் தானியங்கி எழுத்துரு கூட அமைத்திருக்கிறேன். ஒருவேளை அது யூனிஸ்கிரைப் dll பிரச்சினையாய் இருந்திருக்குமோ?
அகத்தியர் என்றொரு மடற்குழு இருக்கிறது. அது எட்டாண்டுகளுக்கு முன்னர் தோற்றுவிக்கப்பட்டது. தற்சமயம் அதில் 39000 மடல்கள் இருக்கின்றன.
ஆரம்பத்தில் இணைமதியில் மடல்கள் எழுதப்பட்டன. பின்னர் திஸ்க்கிக்கு மாற்றப்பட்டன.
இப்போது முப்பதேழாயிரத்து அறுநூறு மடல்கள் யூனிக்கோடிற்கு மாற்றப்பட்டு ஒரு குறிப்பிட்ட பிரத்தியேக வலைத்தளத்தில் சேமிக்கப்பட்டுள்ளன
ஜேபி ஐயா, உங்கள் வருகைக்கும், அகத்தியர் குழுமடல்கள் யூனிகோட்டிற்கு மாற்றப்படுவது குறித்துத் தெரிவித்தமைக்கும் நன்றி. ‘அகத்தியர்’ குழு இருப்பு பற்றித் தெரிந்திருந்தாலும் அதிகமாய் அந்தப் பக்கம் வந்ததில்லை.
இந்தப் பதிவிடுகை வந்த காலத்தில் இருந்து இப்போதைக்கு எனது கருத்தில் கொஞ்சம் மாறுபாடு இருக்கிறது.
இராம.கி அவர்களின் ‘கொம்பும் காலும் அன்றி உயிரும் மெய்யும் இடம்பெற வேண்டும்’ என்கிற கருத்தில் உடன்பாடு ஏற்படுகிறது. யூனிகோடு என்பதை ஒருங்குறி ஆக்க வேண்டாம் என்கிற கருத்தில் இன்னும் மாற்றமில்லை. ஆனால் ‘வலுவானது நிற்கும்’ என்கிற சித்தாந்தத்தில் ‘ஒருங்குறி’ என்பதன் புழக்கமும் அதிகரித்திருப்பதை உணர்கிறேன். நானே கூடச் சிலசமயம் பாவிக்க ஆரம்பித்திருக்கிறேன்.