• Home
  • என்னைப் பற்றி

இரா. செல்வராசு

விரிவெளித் தடங்கள்

Feed on
Posts
Comments
« ஒருங்குறியும் ஓகாரக் கொம்பும்
தமிழ்மணம் என்றொரு நொண்டிக் கழுதை »

ஒருங்குறியும் தமிழ் எழுத்தும்

Nov 11th, 2007 by இரா. செல்வராசு

தமிழில் எத்தனை எழுத்துக்கள் என்று கேட்டால் நீங்கள் என்ன சொல்லுவீர்கள்?

நீங்கள் எந்த ஊர்க்காரராக இருந்தாலும், எந்தப் பள்ளியில் தமிழ் பயின்றிருந்தாலும், இந்தக் கேள்விக்குப் பதிலாக 247 எழுத்துக்கள் (மற்றும் சில வடமொழி எழுத்துக்கள் ~ கிரந்தம்) என்று தான் படித்திருப்பீர்கள். உயிர் பன்னிரண்டு, மெய் பதினெட்டு, உயிர்மெய் இருநூற்றுப் பதினாறு, ஆய்தம் ஒன்று சேர்த்து ஆக மொத்தம் இருநூற்று நாற்பத்தியேழு.

ta letter

இருநூற்று நாற்பத்தியேழு எழுத்துக்கள்.

இந்தக் கொத்தில் (set) சொல்லப்பட்ட ஒவ்வொன்றும் முழுதாய் ‘எழுத்து’ என்றே வழங்கப்படும். இரண்டாயிரம் மூவாயிரம் ஆண்டுகளுக்கு முன்பே தொல்காப்பியரால் வகுக்கப்பட்ட இலக்கண நூல் முதல் இவை ஒவ்வொன்றும் ‘எழுத்து’ என்றே வழங்கப்பெறும் தகுதியுடையவை. ‘தொல்காப்பியம் நீ படித்திருக்கிறாயா?’ என்று கேட்டால் ‘இல்லை’ என்றே பதில் சொல்ல வேண்டியிருக்கும் என்றாலும், படித்தவர்கள் சொல்வதைக் கொஞ்சம் கேட்டுக் கொள்ளலாமே! (இராம.கி யின் தொல்காப்பியமும் குறியேற்றங்களும் – ஒன்று இரண்டு மூன்று நான்கு ஐந்து ஆறு ஏழு). இப்போது அழிந்துவிட்ட சில எழுத்துக்களையும் சேர்த்து அவர் எழுத்துக்கள் இருநூற்று ஐம்பத்தாறு என்று ஒரு கணக்குச் சொல்வதையும் ஒருபுறம் வைத்துக் கொள்ளலாம்.

சரி. இப்போது எதற்காக இந்த எழுத்துக் கூட்டற்கணக்கு என்று கேட்கிறீர்களா ?

நிற்க. அதற்குப் பதில் சொல்லும் முன், ஒருங்குறி (அ) யூனிக்கோடு என்றால் என்ன என்பதையும் பார்ப்போம். இதனை வேறு எங்கும் துழாவாமல் யூனிக்கோடு இணைய தளத்திற்கே சென்று பார்ப்போம். அதற்கும் முன், சமயம் கிட்டினால் ஆதியிலே இருந்த ஆசுக்கியில் (ASCII) ஆரம்பித்து ஆன்சி (ANSI) தசுக்கி (TSCII) தாம் (TAM) தூம்(!!) என்று குதியாட்டம் போட்டு எளிமையாக விளக்கிய தமிழ்மணம் காசியின் தொடர் கட்டுரைகளைப் (என் கோடு, உன் கோடு, யுனிகோடு, தனி கோடு) படித்துக் கொள்ளுங்கள். ஒரு பாமரன் பாமரனுக்குச் சொன்னது என்று காசி எச்சரிக்கையோடு ஆரம்பித்தாலும், பெரும்பாலும் சரியான விளக்கங்களே. மிகவும் அகலமாகவும் தேவையான அளவிற்கு ஆழமாகவும் செல்லும் இந்த விளக்கங்கள் எளிமையான நடையில் சொல்லப் பட்டிருக்கின்றன.

யூனிக்கோடு என்பது என்ன?

unicode 5.0

Unicode provides a unique number for every character, no matter what the platform, no matter what the program, no matter what the language.

யூனிக்கோடு என்பது எழுத்துக்களை அடிப்படையாகக் கொண்ட ஒரு குறியேற்றம் (character-based encoding). அதோடு, குறிப்பாக அது எழுத்து-வடிவங்களை அடிப்படையாகக் கொண்டது (glyph-based encoding) அன்று. இதற்கு முன்பிருந்த இசுக்கி (ISCII), தசுக்கி(TSCII) இவை எல்லாம் வடிவங்களை அடிப்படையாகக் கொண்டு அமைக்கப் பட்டவை.

எழுத்துக்களையும் எண்களாகவே பாவிக்கும் கணினிகளுக்கு உலக மொழிகள் எல்லாவற்றின் எழுத்துக்களையும் தனித்தனியே இனங்கண்டுகொள்ளத் தரப்படுத்தப்படும் ஒரு குறியீடு. எளிமையாகச் சொல்வதானால், உலகின் மொழிகளில் உள்ள எல்லா எழுத்துக்களையும் ஒரு அட்டவணையில் எழுதி அவை ஒவ்வொன்றுக்கும் ஒரு தனி (unique) எண் அல்லது குறிப்புள்ளி (code-point) ஒதுக்கித் தருவது. இதனால் கணினியானது எந்த மொழி என்று சாய்வுகள் ஏதுமின்றி குருட்டாம்போக்கில் அதற்குக் கொடுக்கப்பட்ட குறிப்புள்ளிக்கு ஒதுக்கப்பட்ட எழுத்தை, அது எந்த மொழியாக இருந்தாலும் வெளிப்படுத்தும். இதனால் ஒரே ஆவணத்தில் பல மொழிகளிலும் எழுதுவது போன்றவையும் சாத்தியமாகிறது.

மேற்சொன்னதில் முக்கியமாகக் கவனிக்க வேண்டியது: A unique number for EVERY CHARACTER !

இந்த முடிபின்படி தமிழின் ஒவ்வொரு எழுத்துக்கும் ஒரு குறிப்புள்ளி கொடுக்கப் பட்டிருக்க வேண்டும். அப்படி இருந்திருந்தால் ஒரு உதாரணத்துக்கு ‘அம்மா’ என்ற சொல்லுக்கு மூன்று குறிப்புள்ளிகள் போதுமானதாக இருந்திருக்கும். ‘அ’வுக்கு ஒன்று ‘ம்’க்கு ஒன்று; மற்றும் ‘மா’வுக்கு ஒன்று. ‘Ma’ என்று ஆங்கில மொழியில் எழுதுவதற்கு Mக்கு ஒன்று aவுக்கு ஒன்று என்று இரண்டு குறிப்புள்ளிகள் மட்டுமே தேவையென இருப்பதோடு ஒப்பிட்டுப் பாருங்கள். அப்படி எளிமையாக நேரடியாக (linear model) இருந்திருக்க வேண்டிய ஒன்று, தேவையின்றித் தமிழையும் இந்திய மொழிக் குடும்பத்தோடு (indic languages) சேர்த்த காரணத்தால் சற்றுக் குதறிப் போயிருக்கிறது.

இந்தக் குதறலுக்கு ஒரு எடுத்துக்காட்டைப் பார்ப்போம். தற்போதைய யூனிக்கோட்டுத் தமிழில் ‘அம்மா’வை இப்படித் தான் பிளந்து போட்டிருக்கிறார்கள்.

0B85: அ TAMIL LETTER A (Tamil)
0BAE: ம TAMIL LETTER MA (Tamil)
0BCD: ் TAMIL SIGN VIRAMA (Tamil)
0BAE: ம TAMIL LETTER MA (Tamil)
0BBE: ா TAMIL VOWEL SIGN AA (Tamil)

(குறிப்பு: 0B85 0BAE போன்றவை குறிப்புள்ளிகளைக் குறிக்கும் பதினறும எண்கள். அவை நமக்குப் பழக்கமான பத்தடிமான எண் முறையில் முறையே [2949, 2990, 3021, 2990, 3006] என்று அமையும். இந்த எண்களை வரிசையாகக் கொடுத்தால் கணினி ‘அம்மா’ என்று சொல்லும். யூனிக்கோடு முறையில் 2949 என்பது எப்போதும் ‘அ’கரத்தையே குறிக்கும்).

tamil unicode block

‘அம்மா’ என்று மூன்று எழுத்துக்கள் கொண்ட, மூன்றே குறிப்புள்ளிகளால் குறிக்கப்பட்டிருக்கக் கூடிய, அதே சொல்லுக்குத் தற்போதைய முறையில் மூன்றுக்குப் பதிலாக ஐந்து குறிப்புள்ளிகள் தேவைப்படுகின்றன. சரி, இங்கே வரும் புள்ளியும் (0BCD) காலும் (0BBE) தனி எழுத்துக்கள் அல்லவே! தனி எழுத்துக்களையே குறியேற்றம் செய்கிறோம் என்று சொல்லும் யூனிக்கோடு சேர்த்தியத்தின் குறிக்கோள் இங்கு உடைந்து போகிறதே!

மெய்யும் உயிரும் சேர்ந்தால் உயிர்மெய் என்கிற அடிப்படையில் அமைந்திருந்தாலும் கூட அதில் ஒரு இலக்கண நியதி இருக்கிறது. அப்படியும் இல்லை. ஒரு சிலர், தொல்காப்பியத்தில் உயிரும் மெய்யுமே அடிப்படை எழுத்துக்கள்; பிற உயிர்மெய் எழுத்துக்கள் எல்லாம் சார்பெழுத்துக்கள் என்று புரிந்துகொள்வதாகக் கூறுகின்றனர். அப்படியே எடுத்துக் கொண்டாலும், சார்பெழுத்துக்களும் முழுமையாக எழுத்துக்களே என்று அவற்றிற்கும் தனிக்குறிப்புள்ளிகளை யூனிக்கோடு தந்திருக்க வேண்டும். இல்லையெனில் அடிப்படையான உயிருக்கும் மெய்க்கும் குறிப்புள்ளிகள் தந்திருக்க வேண்டும். அவற்றை விடுத்து ‘விராமா’ என்று வடமொழிப் பெயரிட்டுத் தமிழ்ப்புள்ளிக்கும், காலுக்கும், ‘சார்பு உயிர்’ (dependent vowels) என்று சுழி, கொம்பு முதலியனவற்றிற்கும் குறிப்புள்ளிகள் கொடுத்திருப்பது அவர்களுடைய குறிக்கோளைப் பொருத்தளவிலேயே ஏற்புடையதன்று. மிகவும் பிழையான ஒன்று.

வலையிலும் பதிவுகளிலும் கூகுளிலும் தமிழ் தெரிகிறது என்பது மகிழ்வான ஒன்று தான். ஆரம்ப காலங்களில் கணினியில் தமிழ் கொண்டு வர இருந்த சிக்கல்கள் தீர்ந்து இன்று பரவலாக பயன்படுத்த முடிகிறது என்பது நன்று தான். ஆனால் தற்போதைய குறியேற்றத்தில் பிரச்சினைகள் சில உண்டு என்பதும் அதனைத் தவிர்க்கச் சுற்றிவளைத்து மூக்கைத் தொடும் சில முறைகளையும் நாம் கையாள வேண்டியிருக்கிறது என்பதையும் நினைவில் வைத்துக் கொள்ளவேண்டும்.

இந்தச் சுற்றி வளைக்கும் தேவை என்ன என்று சற்று விரிவாகப் பார்க்க, இன்னும் சற்று ஆழமாகக் கணினியின் ‘பைட்’ (byte) அளவிற்குச் செல்ல வேண்டும். எழுத்துருக் கோப்புக்களின் வேலை பற்றி மேற்சுட்டிய காசியின் கட்டுரை விரிவாகச் சொல்லுகிறது. சாரையாய் வரும் பைட்டுகள் ஒவ்வொன்றிற்கும் சமனான எழுத்து வடிவத்தைத் தரும் வேலையை எழுத்துருக் கோப்புகள் செய்கின்றன. (இது சற்று எளிய விளக்கம் தான் – யூனிக்கோடு விஷயத்தில் பைட்டுகளுக்குப் பதிலாகக் குறிப்புள்ளிகள் என்று எடுத்துக் கொள்ள வேண்டும். UTF-8 போன்ற முறைகள் ஒன்றிற்கும் மேற்பட்ட பைட்டுத் தொடர்களைக் குறிப்புள்ளிகளாக மாற்றுகின்றன. UTF-8 பற்றி என்னுடைய இந்தப் பதிவும் சில விவரங்களை விளக்கமாகச் சொல்லும்).

கணினிகளில் இன்று யூனிக்கோடு தமிழ் தெரிய இரண்டு விஷயங்கள் வேண்டும்.
ஒன்று – ஒரு ஒருங்குறி எழுத்துரு (font):இது ஒவ்வொரு குறிப்புள்ளி அல்லது குறிப்புள்ளி வரிசைக்கு என்ன வடிவத்தை நல்க (render) வேண்டும் என்று அமைக்கப்பட்டிருக்கும் ஒரு அட்டவணை. அதில் சிறப்பு வடிவங்கள், கூட்டெழுத்து வடிவங்கள் இவை இருக்கலாம்.

(அகரமேறிய அட்சர-மெய் அல்லாது, புள்ளிகொண்ட தூய மெய்யெழுத்துக்களின் காரணமாகத் தமிழ் எழுத்தில் கூட்டெழுத்துக்கள் இல்லை என்பதும் தமிழின் ஒரு சிறப்பு. அதையும் யூனிக்கோடு குழுமத்தினர் சரியாகப் புரிந்து கொண்டிருக்கின்றனரா என்று தெரியவில்லை. அதனால் தான் உயிர்மெய் எழுத்துக்களைக் கூட்டெழுத்துக்கள் வரிசையில் சேர்த்துப் பார்க்கிறார்கள் போலும்).

இரண்டு – குறிப்புள்ளி வரிசையைப் புரிந்து கொண்டு முன்னும் பின்னுமாக வடிவங்களை மாற்றிப் போட்டுச் சரியான வடிவத்தைத் தரும் ‘பலக்கிய எழுத்துவடிவ நல்கு எந்திரம்’ (complex script rendering engine). உதாரணத்துக்கு, ‘0BE7’ ‘0BCA’ என்னும் குறிப்புள்ளிகளுக்கான வடிவம்: ‘க’ மற்றும் ‘ொ’. இவற்றில் இரண்டாவதாக உள்ள வடிவத்தை (இதை என்னவென்று அழைப்பது?!) இரண்டாக உடைத்து ஒன்றைக் ககரத்தின் முன்னும் ஒன்றைப் பின்னும் போட்டுக் ‘கொ’ என்னும் வடிவத்தைக் கொண்டு வர வேண்டும். இந்த வேலையைத் தான் ‘பலக்கிய எழுத்து நல்கு எந்திரம்’ செய்கிறது. அதனால் தான் சரியான முறையில் யூனிக்கோட்டுத் தமிழைக் கணினிகளில் பார்க்க முடிகிறது.

இதெல்லாம் எனக்குத் தெரியாதே. நான் ஒன்றும் நிரல் எழுதவோ எழுதியவர்களிடம் பெற்றுச் சேர்த்துக் கொள்ளவே செய்யவில்லையே என்று நினைக்கிறீர்களா? உண்மை. இதனை சாதாரணப் பயனர் எழுத அவசியம் இல்லை. எழுதவும் எளிதானதல்ல. மைக்ரோசாவ்ட் கணினிகளில் யூனிசுக்ரைபு (uniscribe) என்னும் நிரல் இந்த வேலையைச் செய்கிறது. அது விண்டோஸின் அண்மைய வெளியீடுகளில் உள்ளடங்கி வருகிறது. பழைய விண்டோசு 98 கணினிகளில் இது இருக்காது (அல்லது சரியான கோப்பு இருக்காது). சில காலம் முன்பு மைக்ரோசாவ்டின் usp10.dll என்னும் கோப்பைத் தரவிறக்கிக் கொண்டால் விண்டோசு98 கணினிகளிலும் சரியாகத் தெரியும் என்று பலர் தரவிறக்கிக் கொள்ள வேண்டியிருந்ததை எண்ணிப் பாருங்கள். அதுவே இந்தப் பலக்கிய வேலையைச் செய்யும் நிரல். இது இல்லாவிட்டால் எழுத்துக்கள் உடைந்து உடைந்து தெரியும். உதாரணத்துக்கு ‘இது கொடுமை’ என்பது உடைந்து இப்படி இருக்கும் – இத‌ு ௧‍ொ‍ட‍ு‍ம‍ை

ஒரு எழுத்திற்கு ஒரு குறிப்புள்ளி என்று அமைந்திருப்பின் இந்த பலக்கிய (complex) வேலையின்றி நேரடி (linear) வேலையாக, அகரத்தின் குறிப்புள்ளி வந்தால் ‘அ’ என்னும் எழுத்தைக் கொடு; மகர மெய்யின் குறிப்புள்ளி வந்தால் ‘ம்’ என்னும் எழுத்தைக் கொடு; மாகாரக் குறிப்புள்ளி வந்தால் ‘மா’ என்னும் உயிர்மெய் எழுத்தைக் கொடு; வரிசையாகச் சேர்த்தால் ‘அம்மா’ என்னும் சொல் வந்தாயிற்று என்று இருந்திருக்கலாம். அவ்வளவு தான்.

மைக்ரோசாவ்ட் அல்லாத பிற திறமூலக் கணியியங்குதளங்களில் இது எப்படி வேலை செய்கிறது? அங்கும் இந்த நிரலை யாரேனும் எழுதியாக வேண்டும். லினக்சு போன்ற இயங்குதளங்களில் Pango என்னும் ஒரு திறமூல நிரல் (அல்லது அது போன்ற வேறு ஒன்று) இந்த வேலையைச் செய்யப் பயன்படுகிறது.

Pango, Open Source Uniscribe Equivalent

இங்கும் சிக்கல் இருக்கிறது. இது போன்ற நிரல்கள் ஒவ்வொரு புது இயங்குதளங்களிலும் யாரேனும் எழுதியாக வேண்டும். புதிதாக இன்று கைக்கணினிகளில் தமிழைக் கொண்டுவர வேண்டும் எனில் அந்தக் கைக்கணி இயங்குதளங்களிலும் இந்த நிரல் இருக்க வேண்டும் (யுனிக்கோடு எழுத்துருவும் வேண்டும்). செல்பேசிகளில் தமிழ் தெரிய அங்கும் இந்த நிரல் எழுதப் பட வேண்டும். அப்படியாக எழுதப்படும் நிரல் பயனர் பயன்படுத்தும் கணிமொழியில் இருந்து பயன்படுத்த முடிவதாய் இருக்க வேண்டும். உதாரணத்துக்கு, வெவ்வேறு கணிமொழிகளில் (PHP, Ruby, Python) தமிழ்த் தளங்கள் அமைக்க நேர்ந்தால் அவற்றிலிருந்தும் இவற்றைப் (uniscribe or equivalent) பயன்படுத்த முடியவேண்டும். இல்லையெனில் ௧‍ொ‍ட‍ு‍ம‍ை (கொடுமை)யாகத் தான் இருக்கும். அதோடு இப்படிப் பல இடங்களில் எழுதப்படும் நிரல்கள் எல்லாம் ஒன்றற்கொன்று பெரிதும் வேறுபடாமல் இயங்க வேண்டும். இல்லையெனில் ஒவ்வொரு இடத்திலும் ஒவ்வொரு மாதிரியாக வேறுபட்டுக் கிடக்கும். பல காலமாக, FireFox என்னும் திறமூல உலாவி மென்பொருளில் justify செய்யப்பட்ட தமிழ் வரிகள் உடைந்தே தெரியும். அதற்கும் இந்த யூனிக்கோடு நல்கும் எந்திரத்தில் இருந்த ஒரு குறையே காரணம். இப்போது சரி செய்துவிட்டார்களா என்று எனக்குத் தெரியவில்லை. கீழ்க்காணும் ‘காசி’யின் பதிவைப் பார்த்தால் இல்லை என்றே தோன்றுகிறது.

IE and Firefox Tamil font rendering

செல்பேசிகளில் தமிழ் தெரிவதற்கும் குறிப்பிட்ட செல்பேசி நிறுவனத்தார் அந்த நிரல்களைச் சேர்க்கும் வரை காத்திருக்க வேண்டும். நோக்கியா செல்பேசி ஒன்றில் தமிழ்ப்பதிவு சரியாகத் தெரிவதைக் காசி குறிப்பிட்டிருக்கிறார். ஆனால் இது இன்னும் பரவலாகப் பிற செல்பேசிகளில் பரவவில்லை என்பதையும் குறிப்பிட வேண்டும். ஒவ்வொரு செல்பேசி இயங்குதளத்திலும் சரியான நிரல் நிறுவப்படும் வரை தமிழ் உடைந்தோ தெரியாமலோ தான் இருக்கும். சரியான முறையில் எல்லா எழுத்துக்களுக்கும் குறியேற்றம் அமைக்கப்பட்டிருந்தால் இந்தப் பலக்கிய நிரல் அவசியமற்று இருந்திருக்கும். எந்தப் புதுக் கணித்தளமாய் இருந்தாலும் ஒன்றிற்கொன்று (codepoint to letter) முறையில் தமிழ் இயல்பாய்ப் பிரச்சினையின்றிப் பரவியிருக்கும்.

ntmani on mobile

மேலும், ஒரு எழுத்திற்கு ஒரு குறிப்புள்ளி என்றிருந்தால் ஒரு ஆவணத்தில் எத்தனை எழுத்துக்கள் உள்ளன என்பதைக் கணக்கிடவும் மிகவும் எளிதாக இருந்திருக்கும். இப்போது உயிருக்கும் அகரமெய் எழுத்துக்களுக்கு ஒரு குறிப்புள்ளியும் ஏனையவற்றிற்கு இரண்டு குறிப்புள்ளிகளும் என்று அமைந்து எழுத்துக் கணக்கிற்குச் சிக்கலை உண்டு பண்ணும். காட்டுக்கு, ஒரு தளத்தில் தமிழில் பயனர் பெயர் பதிவு செய்ய அதிகபட்சம் இத்தனை எழுத்துக்கள் தான் இருக்க வேண்டும் என்றிருந்தால், அங்கே எழுத்துக்களைக் கூட்டத் தனியாகச் சிறப்பு நிரல் எழுத வேண்டியிருக்கலாம்.

நிரல்களை வைத்துச் சமாளித்துக் கொள்ளலாம் என்றாலும், அத்தகைய தேவையின்றி நேரடியாக எளிமையாக இருந்திருக்க வேண்டிய தமிழ்க் குறியேற்றம் இன்று ஒரு பலக்கிய தன்மையதாக ஆக்கப் பட்டிருப்பது ஒரு பின்னடைவே. இந்தக் குறைகளை நீக்க All Character Encoding என்று எல்லா எழுத்துக்களுக்கும் குறிப்புள்ளிகள் தரும் முறையை TANE/TUNE என்ற பெயரில் தமிழக அரசு சார் அமைப்பு யூனிக்கோட்டு சேர்த்தியத்திற்குப் பரிந்துரை செய்திருக்கிறது. அதனை ஆதரித்தும் எதிர்த்தும் தமிழ்க்குமுகத்திலும் பன்னாட்டரங்கிலும் வாதங்கள் எழுந்துள்ளன. இதன் எதிர்காலச் சாத்தியங்கள் எப்படி அமைந்தாலும் இந்தக் கட்டுரைப் பின்னணியும், தற்போதைய ஒருங்குறி முறைக் குறைகளும், மேற்கொண்டு இப்புலனத்தில் ஏற்படும் மாற்றங்களும் குறித்த விழிப்புணர்ச்சியும் புரிந்துணர்வும் தமிழ்க்குமுகத்தில் அதிகரிக்க வேண்டும். இதுபோன்ற பிறிதொரு சூழலில் நமக்கான தேவையைச் சரியான முறையில் எடுத்தியம்பிப் பெற்றுக் கொள்ளும் வல்லமையைத் தமிழுலகம் பெறவேண்டும்.

பகிர்க:

  • Click to share on Facebook (Opens in new window)
  • Click to share on Twitter (Opens in new window)
  • Click to share on WhatsApp (Opens in new window)
  • Click to email a link to a friend (Opens in new window)

Tags: தமிழ், யூனிகோடு

Posted in கணிநுட்பம், தமிழ், யூனிகோடு

10 Responses to “ஒருங்குறியும் தமிழ் எழுத்தும்”

  1. on 11 Nov 2007 at 4:46 pm1மு.மயூரன்

    1.firefox இன் 3.0 கிளையில் pango வினை இயல்பிருப்பாக்குவதாக உறுதியளித்துள்ளார்கள். அது வந்தபிறகு இந்தப்பிரச்சினை இருக்காது என்று எதிர்பார்க்கலாம்.

    2. ஒருங்குறிக்கான தமிழ் எழுத்து அட்டவணையினை அனுப்பியவர்களின் கவனக்குறைவே எம்மீது இந்த அரைகுறை முறைமை திணிக்கப்படக் காரணம் என்று சொல்லப்படுகிறது. இனி செய்ய எதுவும் இல்லை. ஆனால் இந்த வரலாற்றிலிருந்து நாம் பாடம் கற்றுக்கொண்டு இனிவருங்காலங்களிலாவது திறந்த நிலையில் அனைவரும் அறிய முக்கிய முடிவுகளை எடுக்கப் பழகிக்கொள்ள வேண்டும். செய்யும் பணியின் பெறுமதியை உணர்ந்து கவனக்குறைவின்றிச் செயற்பட வேண்டும்.

    3. நோக்கியா செல்பேசியில் தமிழை கொண்டு வந்ததில் மகிழ்ந்திருப்பதை விட java 2 அல்லது அதற்கு சமானமான தொழிநுட்பத்தில் இயங்கும் ஏனைய செல்பேசிகளில் தமிழை நாமாக எப்படி தெரியப்பண்ணுவது என்பதுகுறித்து தேடி பகிரவேண்டும். அதுவே பயனுள்ளது.

    ஆழமான பதிவு.
    நன்றி.

  2. on 11 Nov 2007 at 10:34 pm2DJ

    நல்லதொரு பதிவு. நன்றி.

  3. on 12 Nov 2007 at 11:48 am3சிவா

    செல்வா

    நல்ல மிக விவரமாக எழதப் பட்ட பதிவு.

    நன்றி

    மயிலாடுதுறை சிவா…

  4. on 12 Nov 2007 at 11:40 pm4பரி

    இதையெல்லாம் தமிழக அரசு முன்னெடுத்துச் செய்து வெற்றி பெறும் என்று நம்பிக்கை இல்லை.
    உத்தமம் (INFITT) போன்ற பேருக்கு இருக்கும் அமைப்புகள் எப்போது பேருக்காகவே இருக்கும்.

    “ம” என்று ஒரு எழுத்தை சேமிக்க எடுக்கும் இடமும் “கோ” என்ற ஒரு எழுத்தை சேமிக்க எடுக்கும் இடமும் ஒன்றாகத்தான் இருக்க வேண்டும் என்ற அடிப்படை அறிவு கூட இல்லாமல் வடிவமைக்கப்பட்ட கொடுமையை எங்கே போய் சொல்ல?

    வடிவமைத்த புண்ணியவான்கள், அகரவரிசைப்படுத்த(sort alphabetically) வாய்பாடு எழுத கொஞ்சமாவது யோசித்திருந்தால் இப்படிப் பிளந்து போட்டிருக்க மாட்டார்கள்.

  5. on 13 Nov 2007 at 1:34 am5செல்வராஜ்

    சிவா, டிஜே, மயூரன், உங்கள் கருத்துக்களுக்கு நன்றி.

    மயூரன், நோக்கியாவின் பிற செல்பேசிகளிலும் தமிழ் தெரிய வைப்பது சிரமமாய் இருக்காது என்று எண்ணுகிறேன். சந்தை இருப்பின் நிறுவனங்கள் தாமாகவே முக்கியத்துவம் தந்து வசதிகளை வழங்கும்.

    ஆனாலும் அடிப்படைக் குறைபாடுகள் நீங்கினால் நிறைவு உண்டாகும். TANE குறித்து நம்பிக்கை இழந்தும், பின் மீண்டும் நம்பிக்கை கொண்டும் இருக்கிறேன். வரும் மாதங்கள் சாத்தியங்களைச் சொல்லலாம். இருப்பினும், இக்குறைபாடுகளின் ஊடாகவும் நிரல்கள் கொண்டு மேற்செல்வது பற்றியும் அதே நேரத்தில் யோசிக்கலாம்.

  6. on 14 Nov 2007 at 12:03 am6செல்வராஜ்

    பரி, நீண்ட காலம் கழித்து உங்கள் பின்னூட்டம் பார்ப்பதில் மகிழ்ச்சி. TANE முறையைப் பரிசீலிக்க யூனிக்கோடு இசைந்துள்ளது என்று அறிகிறேன். இருப்பினும், அதன் (தமிழக அரசு/கணித்தமிழ் சங்கம்) செயல்பாடுகள் வெளிப்படையாய் இல்லாமல், இத்துறையில் நீண்ட கால அனுபவம் கொண்டவர்களின் உள்ளீடு இல்லாமல் இருக்கிறதோ என்னும் ஐயம் உண்டு. சரியான முறையில் முறையீடும், விண்ணப்பமும் இன்றி இருக்கும் சிறு வாய்ப்பையும் தவற விடுவோமோ என்று தோன்றுகிறது. பார்க்கலாம்.

  7. on 19 Dec 2007 at 3:01 am7யக்ஞா

    செல்வராஜ், இனிமேல் ஒருங்குறி குழுமம் ஏதும் பெரிய மாற்றம் செய்யும் என்று எனக்கு நம்பிக்கையில்லை. இந்த TANE/TUNE’ல் கூட ஒரு பிரச்சினை இருக்கு. PUA எல்லாம் பயன்படுத்தினால் கூகிள் போன்ற தேடுபொறிகளில் வேலை செய்யுமா என்பது சந்தேகமே. யோசிக்காமல் கோட்டைவிட்ட பிறகு இப்போது வருந்துகிறோம். ஆனால் என்ன இருந்தாலும் இந்த பிரச்சினைகள் எல்லாம் ஒரு மென்பொருளாளரின் தலைவலியே தவிர கடைநிலை பயனர் ஏதும் செய்யவேண்டியதில்லை. நீங்கள் கூறுவதுபோல் இது ஒன்றும் அவ்வளவு கஷ்டமில்லை. இன்னும் விரிவாக பதிய முயற்சி செய்கிறேன். இது பற்றி விவாதிக்க விருப்பமிருந்தால் அஞ்சலவும்!

  8. on 19 Dec 2007 at 4:08 am8சீனு

    நல்ல பதிவு. நன்றி.

  9. on 19 Dec 2007 at 9:21 am9செல்வராஜ்

    சீனு, யக்ஞா, மற்றும் பிற பின்னூட்டம் இட்டவர்களுக்கும் நன்றி.

    யக்ஞா, உங்கள் விரிவான பதிவையும் எதிர்நோக்குகிறேன். PUA பற்றி நீங்கள் கூறுவது மிகச்சரி. TANE-ஐ அங்கு வைப்பது சோதனைகளுக்கு உதவலாமே தவிர வேறு எள்ளளவும் பயனில்லை. பலரும் அவற்றைப் பயன்படுத்தலாம் என்பதால் தேடுபொறிகளில் சிக்கா. உங்களைப் போன்றே வேறு குறியேற்ற மாற்றங்களில் எந்த எதிர்பார்ப்பும் இல்லையென்றே எண்ணினேன். ஆனாலும், ஒருவேளை இப்போதைய த.நா. அரசு முனைப்புகளால், ஒருங்குறிச்சேர்த்தியத்தோடான கூட்டங்களால் பயன்விளையுமோ என்று ஒரு துளி எதிர்பார்ப்பு இருக்கிறது. புதுவைப்பட்டறையில் பொன்னவைக்கோவின் பேச்சைக் கேட்டீர்களா?

    இவை கிடக்க, இந்தச் சிக்கலுக்கு நுட்பத் தீர்வுகள் பற்றி நன்கு தெரிந்து கொள்ள எனக்கு ஆர்வம் உண்டு. அது குறித்தும் உங்களோடு தொடர்பு கொள்கிறேன்.

  10. on 05 May 2017 at 8:04 am10முனைவர் தி.நெடுஞ்செழியன்

    மோசில்லா பயர்பாக்ஸ்-இல் தாங்கள் குறிப்பிட்டிருந்த பிழை இன்னும் சரிசெய்யப்படவில்லை. நன்றி.

  • About

    Profile
    இரா. செல்வராசு
    விரிவெளித் தடங்கள்
    There are 292 Posts and 2,400 Comments so far.

  • Listed in tamizmaNam.com, where bloggers and readers meet :: தமிழ்மணம்.காம்-ல் பட்டியலிடப்பட்டு, திரட்டப்படுகிறது
  • அண்மைய இடுகைகள்

    • பூமணியின் வெக்கை
    • வீட்டுக்கடன்–அசல், வட்டி, தவணை
    • அனைவர்க்குமாம் கல்வியும் வளர்ச்சியும்
    • வணிகப்பெயர்த் தமிழாக்கம் – ஒரு கட்டாய்வு (Case analysis)
    • பொரிம்புப்பெயரும் புறப்பெயரும்
    • குந்தவை
    • நூற்றாண்டுத் தலைவன்
    • அலுக்கம்
  • பின்னூட்டங்கள்

    • அ.பசுபதி on வணிகப்பெயர்த் தமிழாக்கம் – ஒரு கட்டாய்வு (Case analysis)
    • இலக்குமணன் on குந்தவை
    • ராஜகோபால் அ on குந்தவை
    • இரா. செல்வராசு on வீட்டுக்கடன்–அசல், வட்டி, தவணை
    • RAVIKUMAR NEVELI on வீட்டுக்கடன்–அசல், வட்டி, தவணை
    • Ramasamy Selvaraj on வீட்டுக்கடன்–அசல், வட்டி, தவணை
    • இரா. செல்வராசு on அனைவர்க்குமாம் கல்வியும் வளர்ச்சியும்
    • THIRUGNANAM MURUGESAN on அனைவர்க்குமாம் கல்வியும் வளர்ச்சியும்
  • கட்டுக்கூறுகள்

    • இணையம் (22)
    • இலக்கியம் (16)
    • கடிதங்கள் (11)
    • கணிநுட்பம் (18)
    • கண்மணிகள் (28)
    • கவிதைகள் (6)
    • கொங்கு (11)
    • சமூகம் (30)
    • சிறுகதை (8)
    • தமிழ் (26)
    • திரைப்படம் (8)
    • பயணங்கள் (54)
    • பொது (61)
    • பொருட்பால் (3)
    • யூனிகோடு (6)
    • வாழ்க்கை (107)
    • வேதிப்பொறியியல் (7)
  • அட்டாலி (பரண்)

  • Site Meter

  • Meta

    • Log in
    • Entries feed
    • Comments feed
    • WordPress.org

இரா. செல்வராசு © 2023 All Rights Reserved.

WordPress Themes | Web Hosting Bluebook