ஒருங்குறியும் தமிழ் எழுத்தும்
Nov 11th, 2007 by இரா. செல்வராசு
தமிழில் எத்தனை எழுத்துக்கள் என்று கேட்டால் நீங்கள் என்ன சொல்லுவீர்கள்?
நீங்கள் எந்த ஊர்க்காரராக இருந்தாலும், எந்தப் பள்ளியில் தமிழ் பயின்றிருந்தாலும், இந்தக் கேள்விக்குப் பதிலாக 247 எழுத்துக்கள் (மற்றும் சில வடமொழி எழுத்துக்கள் ~ கிரந்தம்) என்று தான் படித்திருப்பீர்கள். உயிர் பன்னிரண்டு, மெய் பதினெட்டு, உயிர்மெய் இருநூற்றுப் பதினாறு, ஆய்தம் ஒன்று சேர்த்து ஆக மொத்தம் இருநூற்று நாற்பத்தியேழு.
இருநூற்று நாற்பத்தியேழு எழுத்துக்கள்.
இந்தக் கொத்தில் (set) சொல்லப்பட்ட ஒவ்வொன்றும் முழுதாய் ‘எழுத்து’ என்றே வழங்கப்படும். இரண்டாயிரம் மூவாயிரம் ஆண்டுகளுக்கு முன்பே தொல்காப்பியரால் வகுக்கப்பட்ட இலக்கண நூல் முதல் இவை ஒவ்வொன்றும் ‘எழுத்து’ என்றே வழங்கப்பெறும் தகுதியுடையவை. ‘தொல்காப்பியம் நீ படித்திருக்கிறாயா?’ என்று கேட்டால் ‘இல்லை’ என்றே பதில் சொல்ல வேண்டியிருக்கும் என்றாலும், படித்தவர்கள் சொல்வதைக் கொஞ்சம் கேட்டுக் கொள்ளலாமே! (இராம.கி யின் தொல்காப்பியமும் குறியேற்றங்களும் – ஒன்று இரண்டு மூன்று நான்கு ஐந்து ஆறு ஏழு). இப்போது அழிந்துவிட்ட சில எழுத்துக்களையும் சேர்த்து அவர் எழுத்துக்கள் இருநூற்று ஐம்பத்தாறு என்று ஒரு கணக்குச் சொல்வதையும் ஒருபுறம் வைத்துக் கொள்ளலாம்.
சரி. இப்போது எதற்காக இந்த எழுத்துக் கூட்டற்கணக்கு என்று கேட்கிறீர்களா ?
நிற்க. அதற்குப் பதில் சொல்லும் முன், ஒருங்குறி (அ) யூனிக்கோடு என்றால் என்ன என்பதையும் பார்ப்போம். இதனை வேறு எங்கும் துழாவாமல் யூனிக்கோடு இணைய தளத்திற்கே சென்று பார்ப்போம். அதற்கும் முன், சமயம் கிட்டினால் ஆதியிலே இருந்த ஆசுக்கியில் (ASCII) ஆரம்பித்து ஆன்சி (ANSI) தசுக்கி (TSCII) தாம் (TAM) தூம்(!!) என்று குதியாட்டம் போட்டு எளிமையாக விளக்கிய தமிழ்மணம் காசியின் தொடர் கட்டுரைகளைப் (என் கோடு, உன் கோடு, யுனிகோடு, தனி கோடு) படித்துக் கொள்ளுங்கள். ஒரு பாமரன் பாமரனுக்குச் சொன்னது என்று காசி எச்சரிக்கையோடு ஆரம்பித்தாலும், பெரும்பாலும் சரியான விளக்கங்களே. மிகவும் அகலமாகவும் தேவையான அளவிற்கு ஆழமாகவும் செல்லும் இந்த விளக்கங்கள் எளிமையான நடையில் சொல்லப் பட்டிருக்கின்றன.
Unicode provides a unique number for every character, no matter what the platform, no matter what the program, no matter what the language.
யூனிக்கோடு என்பது எழுத்துக்களை அடிப்படையாகக் கொண்ட ஒரு குறியேற்றம் (character-based encoding). அதோடு, குறிப்பாக அது எழுத்து-வடிவங்களை அடிப்படையாகக் கொண்டது (glyph-based encoding) அன்று. இதற்கு முன்பிருந்த இசுக்கி (ISCII), தசுக்கி(TSCII) இவை எல்லாம் வடிவங்களை அடிப்படையாகக் கொண்டு அமைக்கப் பட்டவை.
எழுத்துக்களையும் எண்களாகவே பாவிக்கும் கணினிகளுக்கு உலக மொழிகள் எல்லாவற்றின் எழுத்துக்களையும் தனித்தனியே இனங்கண்டுகொள்ளத் தரப்படுத்தப்படும் ஒரு குறியீடு. எளிமையாகச் சொல்வதானால், உலகின் மொழிகளில் உள்ள எல்லா எழுத்துக்களையும் ஒரு அட்டவணையில் எழுதி அவை ஒவ்வொன்றுக்கும் ஒரு தனி (unique) எண் அல்லது குறிப்புள்ளி (code-point) ஒதுக்கித் தருவது. இதனால் கணினியானது எந்த மொழி என்று சாய்வுகள் ஏதுமின்றி குருட்டாம்போக்கில் அதற்குக் கொடுக்கப்பட்ட குறிப்புள்ளிக்கு ஒதுக்கப்பட்ட எழுத்தை, அது எந்த மொழியாக இருந்தாலும் வெளிப்படுத்தும். இதனால் ஒரே ஆவணத்தில் பல மொழிகளிலும் எழுதுவது போன்றவையும் சாத்தியமாகிறது.
மேற்சொன்னதில் முக்கியமாகக் கவனிக்க வேண்டியது: A unique number for EVERY CHARACTER !
இந்த முடிபின்படி தமிழின் ஒவ்வொரு எழுத்துக்கும் ஒரு குறிப்புள்ளி கொடுக்கப் பட்டிருக்க வேண்டும். அப்படி இருந்திருந்தால் ஒரு உதாரணத்துக்கு ‘அம்மா’ என்ற சொல்லுக்கு மூன்று குறிப்புள்ளிகள் போதுமானதாக இருந்திருக்கும். ‘அ’வுக்கு ஒன்று ‘ம்’க்கு ஒன்று; மற்றும் ‘மா’வுக்கு ஒன்று. ‘Ma’ என்று ஆங்கில மொழியில் எழுதுவதற்கு Mக்கு ஒன்று aவுக்கு ஒன்று என்று இரண்டு குறிப்புள்ளிகள் மட்டுமே தேவையென இருப்பதோடு ஒப்பிட்டுப் பாருங்கள். அப்படி எளிமையாக நேரடியாக (linear model) இருந்திருக்க வேண்டிய ஒன்று, தேவையின்றித் தமிழையும் இந்திய மொழிக் குடும்பத்தோடு (indic languages) சேர்த்த காரணத்தால் சற்றுக் குதறிப் போயிருக்கிறது.
இந்தக் குதறலுக்கு ஒரு எடுத்துக்காட்டைப் பார்ப்போம். தற்போதைய யூனிக்கோட்டுத் தமிழில் ‘அம்மா’வை இப்படித் தான் பிளந்து போட்டிருக்கிறார்கள்.
0B85: அ TAMIL LETTER A (Tamil)
0BAE: ம TAMIL LETTER MA (Tamil)
0BCD: ் TAMIL SIGN VIRAMA (Tamil)
0BAE: ம TAMIL LETTER MA (Tamil)
0BBE: ா TAMIL VOWEL SIGN AA (Tamil)
(குறிப்பு: 0B85 0BAE போன்றவை குறிப்புள்ளிகளைக் குறிக்கும் பதினறும எண்கள். அவை நமக்குப் பழக்கமான பத்தடிமான எண் முறையில் முறையே [2949, 2990, 3021, 2990, 3006] என்று அமையும். இந்த எண்களை வரிசையாகக் கொடுத்தால் கணினி ‘அம்மா’ என்று சொல்லும். யூனிக்கோடு முறையில் 2949 என்பது எப்போதும் ‘அ’கரத்தையே குறிக்கும்).
‘அம்மா’ என்று மூன்று எழுத்துக்கள் கொண்ட, மூன்றே குறிப்புள்ளிகளால் குறிக்கப்பட்டிருக்கக் கூடிய, அதே சொல்லுக்குத் தற்போதைய முறையில் மூன்றுக்குப் பதிலாக ஐந்து குறிப்புள்ளிகள் தேவைப்படுகின்றன. சரி, இங்கே வரும் புள்ளியும் (0BCD) காலும் (0BBE) தனி எழுத்துக்கள் அல்லவே! தனி எழுத்துக்களையே குறியேற்றம் செய்கிறோம் என்று சொல்லும் யூனிக்கோடு சேர்த்தியத்தின் குறிக்கோள் இங்கு உடைந்து போகிறதே!
மெய்யும் உயிரும் சேர்ந்தால் உயிர்மெய் என்கிற அடிப்படையில் அமைந்திருந்தாலும் கூட அதில் ஒரு இலக்கண நியதி இருக்கிறது. அப்படியும் இல்லை. ஒரு சிலர், தொல்காப்பியத்தில் உயிரும் மெய்யுமே அடிப்படை எழுத்துக்கள்; பிற உயிர்மெய் எழுத்துக்கள் எல்லாம் சார்பெழுத்துக்கள் என்று புரிந்துகொள்வதாகக் கூறுகின்றனர். அப்படியே எடுத்துக் கொண்டாலும், சார்பெழுத்துக்களும் முழுமையாக எழுத்துக்களே என்று அவற்றிற்கும் தனிக்குறிப்புள்ளிகளை யூனிக்கோடு தந்திருக்க வேண்டும். இல்லையெனில் அடிப்படையான உயிருக்கும் மெய்க்கும் குறிப்புள்ளிகள் தந்திருக்க வேண்டும். அவற்றை விடுத்து ‘விராமா’ என்று வடமொழிப் பெயரிட்டுத் தமிழ்ப்புள்ளிக்கும், காலுக்கும், ‘சார்பு உயிர்’ (dependent vowels) என்று சுழி, கொம்பு முதலியனவற்றிற்கும் குறிப்புள்ளிகள் கொடுத்திருப்பது அவர்களுடைய குறிக்கோளைப் பொருத்தளவிலேயே ஏற்புடையதன்று. மிகவும் பிழையான ஒன்று.
வலையிலும் பதிவுகளிலும் கூகுளிலும் தமிழ் தெரிகிறது என்பது மகிழ்வான ஒன்று தான். ஆரம்ப காலங்களில் கணினியில் தமிழ் கொண்டு வர இருந்த சிக்கல்கள் தீர்ந்து இன்று பரவலாக பயன்படுத்த முடிகிறது என்பது நன்று தான். ஆனால் தற்போதைய குறியேற்றத்தில் பிரச்சினைகள் சில உண்டு என்பதும் அதனைத் தவிர்க்கச் சுற்றிவளைத்து மூக்கைத் தொடும் சில முறைகளையும் நாம் கையாள வேண்டியிருக்கிறது என்பதையும் நினைவில் வைத்துக் கொள்ளவேண்டும்.
இந்தச் சுற்றி வளைக்கும் தேவை என்ன என்று சற்று விரிவாகப் பார்க்க, இன்னும் சற்று ஆழமாகக் கணினியின் ‘பைட்’ (byte) அளவிற்குச் செல்ல வேண்டும். எழுத்துருக் கோப்புக்களின் வேலை பற்றி மேற்சுட்டிய காசியின் கட்டுரை விரிவாகச் சொல்லுகிறது. சாரையாய் வரும் பைட்டுகள் ஒவ்வொன்றிற்கும் சமனான எழுத்து வடிவத்தைத் தரும் வேலையை எழுத்துருக் கோப்புகள் செய்கின்றன. (இது சற்று எளிய விளக்கம் தான் – யூனிக்கோடு விஷயத்தில் பைட்டுகளுக்குப் பதிலாகக் குறிப்புள்ளிகள் என்று எடுத்துக் கொள்ள வேண்டும். UTF-8 போன்ற முறைகள் ஒன்றிற்கும் மேற்பட்ட பைட்டுத் தொடர்களைக் குறிப்புள்ளிகளாக மாற்றுகின்றன. UTF-8 பற்றி என்னுடைய இந்தப் பதிவும் சில விவரங்களை விளக்கமாகச் சொல்லும்).
கணினிகளில் இன்று யூனிக்கோடு தமிழ் தெரிய இரண்டு விஷயங்கள் வேண்டும்.
ஒன்று – ஒரு ஒருங்குறி எழுத்துரு (font):இது ஒவ்வொரு குறிப்புள்ளி அல்லது குறிப்புள்ளி வரிசைக்கு என்ன வடிவத்தை நல்க (render) வேண்டும் என்று அமைக்கப்பட்டிருக்கும் ஒரு அட்டவணை. அதில் சிறப்பு வடிவங்கள், கூட்டெழுத்து வடிவங்கள் இவை இருக்கலாம்.
(அகரமேறிய அட்சர-மெய் அல்லாது, புள்ளிகொண்ட தூய மெய்யெழுத்துக்களின் காரணமாகத் தமிழ் எழுத்தில் கூட்டெழுத்துக்கள் இல்லை என்பதும் தமிழின் ஒரு சிறப்பு. அதையும் யூனிக்கோடு குழுமத்தினர் சரியாகப் புரிந்து கொண்டிருக்கின்றனரா என்று தெரியவில்லை. அதனால் தான் உயிர்மெய் எழுத்துக்களைக் கூட்டெழுத்துக்கள் வரிசையில் சேர்த்துப் பார்க்கிறார்கள் போலும்).
இரண்டு – குறிப்புள்ளி வரிசையைப் புரிந்து கொண்டு முன்னும் பின்னுமாக வடிவங்களை மாற்றிப் போட்டுச் சரியான வடிவத்தைத் தரும் ‘பலக்கிய எழுத்துவடிவ நல்கு எந்திரம்’ (complex script rendering engine). உதாரணத்துக்கு, ‘0BE7’ ‘0BCA’ என்னும் குறிப்புள்ளிகளுக்கான வடிவம்: ‘க’ மற்றும் ‘ொ’. இவற்றில் இரண்டாவதாக உள்ள வடிவத்தை (இதை என்னவென்று அழைப்பது?!) இரண்டாக உடைத்து ஒன்றைக் ககரத்தின் முன்னும் ஒன்றைப் பின்னும் போட்டுக் ‘கொ’ என்னும் வடிவத்தைக் கொண்டு வர வேண்டும். இந்த வேலையைத் தான் ‘பலக்கிய எழுத்து நல்கு எந்திரம்’ செய்கிறது. அதனால் தான் சரியான முறையில் யூனிக்கோட்டுத் தமிழைக் கணினிகளில் பார்க்க முடிகிறது.
இதெல்லாம் எனக்குத் தெரியாதே. நான் ஒன்றும் நிரல் எழுதவோ எழுதியவர்களிடம் பெற்றுச் சேர்த்துக் கொள்ளவே செய்யவில்லையே என்று நினைக்கிறீர்களா? உண்மை. இதனை சாதாரணப் பயனர் எழுத அவசியம் இல்லை. எழுதவும் எளிதானதல்ல. மைக்ரோசாவ்ட் கணினிகளில் யூனிசுக்ரைபு (uniscribe) என்னும் நிரல் இந்த வேலையைச் செய்கிறது. அது விண்டோஸின் அண்மைய வெளியீடுகளில் உள்ளடங்கி வருகிறது. பழைய விண்டோசு 98 கணினிகளில் இது இருக்காது (அல்லது சரியான கோப்பு இருக்காது). சில காலம் முன்பு மைக்ரோசாவ்டின் usp10.dll என்னும் கோப்பைத் தரவிறக்கிக் கொண்டால் விண்டோசு98 கணினிகளிலும் சரியாகத் தெரியும் என்று பலர் தரவிறக்கிக் கொள்ள வேண்டியிருந்ததை எண்ணிப் பாருங்கள். அதுவே இந்தப் பலக்கிய வேலையைச் செய்யும் நிரல். இது இல்லாவிட்டால் எழுத்துக்கள் உடைந்து உடைந்து தெரியும். உதாரணத்துக்கு ‘இது கொடுமை’ என்பது உடைந்து இப்படி இருக்கும் – இது ௧ொடுமை
ஒரு எழுத்திற்கு ஒரு குறிப்புள்ளி என்று அமைந்திருப்பின் இந்த பலக்கிய (complex) வேலையின்றி நேரடி (linear) வேலையாக, அகரத்தின் குறிப்புள்ளி வந்தால் ‘அ’ என்னும் எழுத்தைக் கொடு; மகர மெய்யின் குறிப்புள்ளி வந்தால் ‘ம்’ என்னும் எழுத்தைக் கொடு; மாகாரக் குறிப்புள்ளி வந்தால் ‘மா’ என்னும் உயிர்மெய் எழுத்தைக் கொடு; வரிசையாகச் சேர்த்தால் ‘அம்மா’ என்னும் சொல் வந்தாயிற்று என்று இருந்திருக்கலாம். அவ்வளவு தான்.
மைக்ரோசாவ்ட் அல்லாத பிற திறமூலக் கணியியங்குதளங்களில் இது எப்படி வேலை செய்கிறது? அங்கும் இந்த நிரலை யாரேனும் எழுதியாக வேண்டும். லினக்சு போன்ற இயங்குதளங்களில் Pango என்னும் ஒரு திறமூல நிரல் (அல்லது அது போன்ற வேறு ஒன்று) இந்த வேலையைச் செய்யப் பயன்படுகிறது.
இங்கும் சிக்கல் இருக்கிறது. இது போன்ற நிரல்கள் ஒவ்வொரு புது இயங்குதளங்களிலும் யாரேனும் எழுதியாக வேண்டும். புதிதாக இன்று கைக்கணினிகளில் தமிழைக் கொண்டுவர வேண்டும் எனில் அந்தக் கைக்கணி இயங்குதளங்களிலும் இந்த நிரல் இருக்க வேண்டும் (யுனிக்கோடு எழுத்துருவும் வேண்டும்). செல்பேசிகளில் தமிழ் தெரிய அங்கும் இந்த நிரல் எழுதப் பட வேண்டும். அப்படியாக எழுதப்படும் நிரல் பயனர் பயன்படுத்தும் கணிமொழியில் இருந்து பயன்படுத்த முடிவதாய் இருக்க வேண்டும். உதாரணத்துக்கு, வெவ்வேறு கணிமொழிகளில் (PHP, Ruby, Python) தமிழ்த் தளங்கள் அமைக்க நேர்ந்தால் அவற்றிலிருந்தும் இவற்றைப் (uniscribe or equivalent) பயன்படுத்த முடியவேண்டும். இல்லையெனில் ௧ொடுமை (கொடுமை)யாகத் தான் இருக்கும். அதோடு இப்படிப் பல இடங்களில் எழுதப்படும் நிரல்கள் எல்லாம் ஒன்றற்கொன்று பெரிதும் வேறுபடாமல் இயங்க வேண்டும். இல்லையெனில் ஒவ்வொரு இடத்திலும் ஒவ்வொரு மாதிரியாக வேறுபட்டுக் கிடக்கும். பல காலமாக, FireFox என்னும் திறமூல உலாவி மென்பொருளில் justify செய்யப்பட்ட தமிழ் வரிகள் உடைந்தே தெரியும். அதற்கும் இந்த யூனிக்கோடு நல்கும் எந்திரத்தில் இருந்த ஒரு குறையே காரணம். இப்போது சரி செய்துவிட்டார்களா என்று எனக்குத் தெரியவில்லை. கீழ்க்காணும் ‘காசி’யின் பதிவைப் பார்த்தால் இல்லை என்றே தோன்றுகிறது.
செல்பேசிகளில் தமிழ் தெரிவதற்கும் குறிப்பிட்ட செல்பேசி நிறுவனத்தார் அந்த நிரல்களைச் சேர்க்கும் வரை காத்திருக்க வேண்டும். நோக்கியா செல்பேசி ஒன்றில் தமிழ்ப்பதிவு சரியாகத் தெரிவதைக் காசி குறிப்பிட்டிருக்கிறார். ஆனால் இது இன்னும் பரவலாகப் பிற செல்பேசிகளில் பரவவில்லை என்பதையும் குறிப்பிட வேண்டும். ஒவ்வொரு செல்பேசி இயங்குதளத்திலும் சரியான நிரல் நிறுவப்படும் வரை தமிழ் உடைந்தோ தெரியாமலோ தான் இருக்கும். சரியான முறையில் எல்லா எழுத்துக்களுக்கும் குறியேற்றம் அமைக்கப்பட்டிருந்தால் இந்தப் பலக்கிய நிரல் அவசியமற்று இருந்திருக்கும். எந்தப் புதுக் கணித்தளமாய் இருந்தாலும் ஒன்றிற்கொன்று (codepoint to letter) முறையில் தமிழ் இயல்பாய்ப் பிரச்சினையின்றிப் பரவியிருக்கும்.
மேலும், ஒரு எழுத்திற்கு ஒரு குறிப்புள்ளி என்றிருந்தால் ஒரு ஆவணத்தில் எத்தனை எழுத்துக்கள் உள்ளன என்பதைக் கணக்கிடவும் மிகவும் எளிதாக இருந்திருக்கும். இப்போது உயிருக்கும் அகரமெய் எழுத்துக்களுக்கு ஒரு குறிப்புள்ளியும் ஏனையவற்றிற்கு இரண்டு குறிப்புள்ளிகளும் என்று அமைந்து எழுத்துக் கணக்கிற்குச் சிக்கலை உண்டு பண்ணும். காட்டுக்கு, ஒரு தளத்தில் தமிழில் பயனர் பெயர் பதிவு செய்ய அதிகபட்சம் இத்தனை எழுத்துக்கள் தான் இருக்க வேண்டும் என்றிருந்தால், அங்கே எழுத்துக்களைக் கூட்டத் தனியாகச் சிறப்பு நிரல் எழுத வேண்டியிருக்கலாம்.
நிரல்களை வைத்துச் சமாளித்துக் கொள்ளலாம் என்றாலும், அத்தகைய தேவையின்றி நேரடியாக எளிமையாக இருந்திருக்க வேண்டிய தமிழ்க் குறியேற்றம் இன்று ஒரு பலக்கிய தன்மையதாக ஆக்கப் பட்டிருப்பது ஒரு பின்னடைவே. இந்தக் குறைகளை நீக்க All Character Encoding என்று எல்லா எழுத்துக்களுக்கும் குறிப்புள்ளிகள் தரும் முறையை TANE/TUNE என்ற பெயரில் தமிழக அரசு சார் அமைப்பு யூனிக்கோட்டு சேர்த்தியத்திற்குப் பரிந்துரை செய்திருக்கிறது. அதனை ஆதரித்தும் எதிர்த்தும் தமிழ்க்குமுகத்திலும் பன்னாட்டரங்கிலும் வாதங்கள் எழுந்துள்ளன. இதன் எதிர்காலச் சாத்தியங்கள் எப்படி அமைந்தாலும் இந்தக் கட்டுரைப் பின்னணியும், தற்போதைய ஒருங்குறி முறைக் குறைகளும், மேற்கொண்டு இப்புலனத்தில் ஏற்படும் மாற்றங்களும் குறித்த விழிப்புணர்ச்சியும் புரிந்துணர்வும் தமிழ்க்குமுகத்தில் அதிகரிக்க வேண்டும். இதுபோன்ற பிறிதொரு சூழலில் நமக்கான தேவையைச் சரியான முறையில் எடுத்தியம்பிப் பெற்றுக் கொள்ளும் வல்லமையைத் தமிழுலகம் பெறவேண்டும்.
1.firefox இன் 3.0 கிளையில் pango வினை இயல்பிருப்பாக்குவதாக உறுதியளித்துள்ளார்கள். அது வந்தபிறகு இந்தப்பிரச்சினை இருக்காது என்று எதிர்பார்க்கலாம்.
2. ஒருங்குறிக்கான தமிழ் எழுத்து அட்டவணையினை அனுப்பியவர்களின் கவனக்குறைவே எம்மீது இந்த அரைகுறை முறைமை திணிக்கப்படக் காரணம் என்று சொல்லப்படுகிறது. இனி செய்ய எதுவும் இல்லை. ஆனால் இந்த வரலாற்றிலிருந்து நாம் பாடம் கற்றுக்கொண்டு இனிவருங்காலங்களிலாவது திறந்த நிலையில் அனைவரும் அறிய முக்கிய முடிவுகளை எடுக்கப் பழகிக்கொள்ள வேண்டும். செய்யும் பணியின் பெறுமதியை உணர்ந்து கவனக்குறைவின்றிச் செயற்பட வேண்டும்.
3. நோக்கியா செல்பேசியில் தமிழை கொண்டு வந்ததில் மகிழ்ந்திருப்பதை விட java 2 அல்லது அதற்கு சமானமான தொழிநுட்பத்தில் இயங்கும் ஏனைய செல்பேசிகளில் தமிழை நாமாக எப்படி தெரியப்பண்ணுவது என்பதுகுறித்து தேடி பகிரவேண்டும். அதுவே பயனுள்ளது.
ஆழமான பதிவு.
நன்றி.
நல்லதொரு பதிவு. நன்றி.
செல்வா
நல்ல மிக விவரமாக எழதப் பட்ட பதிவு.
நன்றி
மயிலாடுதுறை சிவா…
இதையெல்லாம் தமிழக அரசு முன்னெடுத்துச் செய்து வெற்றி பெறும் என்று நம்பிக்கை இல்லை.
உத்தமம் (INFITT) போன்ற பேருக்கு இருக்கும் அமைப்புகள் எப்போது பேருக்காகவே இருக்கும்.
“ம” என்று ஒரு எழுத்தை சேமிக்க எடுக்கும் இடமும் “கோ” என்ற ஒரு எழுத்தை சேமிக்க எடுக்கும் இடமும் ஒன்றாகத்தான் இருக்க வேண்டும் என்ற அடிப்படை அறிவு கூட இல்லாமல் வடிவமைக்கப்பட்ட கொடுமையை எங்கே போய் சொல்ல?
வடிவமைத்த புண்ணியவான்கள், அகரவரிசைப்படுத்த(sort alphabetically) வாய்பாடு எழுத கொஞ்சமாவது யோசித்திருந்தால் இப்படிப் பிளந்து போட்டிருக்க மாட்டார்கள்.
சிவா, டிஜே, மயூரன், உங்கள் கருத்துக்களுக்கு நன்றி.
மயூரன், நோக்கியாவின் பிற செல்பேசிகளிலும் தமிழ் தெரிய வைப்பது சிரமமாய் இருக்காது என்று எண்ணுகிறேன். சந்தை இருப்பின் நிறுவனங்கள் தாமாகவே முக்கியத்துவம் தந்து வசதிகளை வழங்கும்.
ஆனாலும் அடிப்படைக் குறைபாடுகள் நீங்கினால் நிறைவு உண்டாகும். TANE குறித்து நம்பிக்கை இழந்தும், பின் மீண்டும் நம்பிக்கை கொண்டும் இருக்கிறேன். வரும் மாதங்கள் சாத்தியங்களைச் சொல்லலாம். இருப்பினும், இக்குறைபாடுகளின் ஊடாகவும் நிரல்கள் கொண்டு மேற்செல்வது பற்றியும் அதே நேரத்தில் யோசிக்கலாம்.
பரி, நீண்ட காலம் கழித்து உங்கள் பின்னூட்டம் பார்ப்பதில் மகிழ்ச்சி. TANE முறையைப் பரிசீலிக்க யூனிக்கோடு இசைந்துள்ளது என்று அறிகிறேன். இருப்பினும், அதன் (தமிழக அரசு/கணித்தமிழ் சங்கம்) செயல்பாடுகள் வெளிப்படையாய் இல்லாமல், இத்துறையில் நீண்ட கால அனுபவம் கொண்டவர்களின் உள்ளீடு இல்லாமல் இருக்கிறதோ என்னும் ஐயம் உண்டு. சரியான முறையில் முறையீடும், விண்ணப்பமும் இன்றி இருக்கும் சிறு வாய்ப்பையும் தவற விடுவோமோ என்று தோன்றுகிறது. பார்க்கலாம்.
செல்வராஜ், இனிமேல் ஒருங்குறி குழுமம் ஏதும் பெரிய மாற்றம் செய்யும் என்று எனக்கு நம்பிக்கையில்லை. இந்த TANE/TUNE’ல் கூட ஒரு பிரச்சினை இருக்கு. PUA எல்லாம் பயன்படுத்தினால் கூகிள் போன்ற தேடுபொறிகளில் வேலை செய்யுமா என்பது சந்தேகமே. யோசிக்காமல் கோட்டைவிட்ட பிறகு இப்போது வருந்துகிறோம். ஆனால் என்ன இருந்தாலும் இந்த பிரச்சினைகள் எல்லாம் ஒரு மென்பொருளாளரின் தலைவலியே தவிர கடைநிலை பயனர் ஏதும் செய்யவேண்டியதில்லை. நீங்கள் கூறுவதுபோல் இது ஒன்றும் அவ்வளவு கஷ்டமில்லை. இன்னும் விரிவாக பதிய முயற்சி செய்கிறேன். இது பற்றி விவாதிக்க விருப்பமிருந்தால் அஞ்சலவும்!
நல்ல பதிவு. நன்றி.
சீனு, யக்ஞா, மற்றும் பிற பின்னூட்டம் இட்டவர்களுக்கும் நன்றி.
யக்ஞா, உங்கள் விரிவான பதிவையும் எதிர்நோக்குகிறேன். PUA பற்றி நீங்கள் கூறுவது மிகச்சரி. TANE-ஐ அங்கு வைப்பது சோதனைகளுக்கு உதவலாமே தவிர வேறு எள்ளளவும் பயனில்லை. பலரும் அவற்றைப் பயன்படுத்தலாம் என்பதால் தேடுபொறிகளில் சிக்கா. உங்களைப் போன்றே வேறு குறியேற்ற மாற்றங்களில் எந்த எதிர்பார்ப்பும் இல்லையென்றே எண்ணினேன். ஆனாலும், ஒருவேளை இப்போதைய த.நா. அரசு முனைப்புகளால், ஒருங்குறிச்சேர்த்தியத்தோடான கூட்டங்களால் பயன்விளையுமோ என்று ஒரு துளி எதிர்பார்ப்பு இருக்கிறது. புதுவைப்பட்டறையில் பொன்னவைக்கோவின் பேச்சைக் கேட்டீர்களா?
இவை கிடக்க, இந்தச் சிக்கலுக்கு நுட்பத் தீர்வுகள் பற்றி நன்கு தெரிந்து கொள்ள எனக்கு ஆர்வம் உண்டு. அது குறித்தும் உங்களோடு தொடர்பு கொள்கிறேன்.
மோசில்லா பயர்பாக்ஸ்-இல் தாங்கள் குறிப்பிட்டிருந்த பிழை இன்னும் சரிசெய்யப்படவில்லை. நன்றி.