இரா. செல்வராசு

விரிவெளித் தடங்கள்

இரா. செல்வராசு header image 2

ஒருங்குறியும் ஓகாரக் கொம்பும்

October 27th, 2007 · 13 Comments

“It’s a consonant, vowel, vowel, consonant… நந்து”, என்று தங்கைக்கு துப்புக் கொடுக்க முயன்றாள் நிவேதிதா.

நெடுந்தொலைவு பயணம் சென்றால் பெண்களின் அயர்வு தெரியாதவண்ணம் இருக்க ஏதேனும் கேட்டு அவர்களின் மனதைச் சுவாரசியமாக வைத்திருக்க முயல்வதுண்டு. சில சமயம் கணக்கு. சில சமயம் ஆங்கிலம். சில சமயம் கதை, இப்படி. அப்படியொரு பயணமொன்றில் ஒரு வருடத்திற்கும் முன்பு நடந்த கதை தான் இது. ஆங்கிலச் சொற்களுக்கு எழுத்துவரிசை சொல்லச் சொல்லி அன்று சின்னவளைக் கேட்டுக் கொண்டிருந்தேன். Cat, Dog, Pen, Top என்று மூன்றெழுத்துச் சொற்களைச் சரியாக அவள் சொல்லிவிடவே அடுத்து நான்கெழுத்துச் சொற்களுக்கு நகர்ந்தேன்.

இடையிலே, “டேய், அமைதியா இருடா! நான் உன்னையா கேட்டேன்?’ அவள் சொல்லட்டும்” என்று பெரியவளைச் சற்றே மிரட்ட வேண்டியிருந்தது உபகதை.

“அவளும் சரியாக் கத்துக்கணும்ல?” என்று நான் சொன்னது தனக்கும் ஒரு பொறுப்பைத் தந்துவிட்டாற்போல், “சரியப்பா… நான் அவளுக்கு கொஞ்சமா உதவுறேன்” என்று நல்லவிதமாய் எடுத்துக் கொண்டு சில துப்புக்களும், உதட்டசைவுகளும், ஆரம்பங்களும் தந்து கொண்டிருந்தாள்.

நான்கெழுத்து எழுத்துக்களும் சிலவற்றைச் சரியாகச் சொல்லிக் கடந்தாள் நந்திதா. ஒவ்வொரு வெற்றிக்கும் காருக்குள்ளே கைதட்டல்கள் வேறு!

“POUR” என்று அடுத்த வார்த்தையைச் சொன்னேன். மெல்ல யோசித்துப் “P… O… R… E…?” என்றாள். அதுவும் சரிதான் என்றாலும் நான் கேட்டது வேறு சொல் என்றேன். “இன்னொரு போர் (POUR) இருக்கு… தண்ணி ஊத்து அப்படீங்கற மாதிரி அர்த்தம்” என்றேன்.

“ஓ, ஐ நோ, ஐ நோ” என்று உற்சாகப்பட்ட நிவேதிதா மேற்சொன்ன வகையில் ஒரு துப்புத் தந்தாள். “It’s a consonant, vowel, vowel, and a consonant… நந்து”.

a, e. i, o, u என்பவை vowels என்று ஆரம்ப வகுப்பில் படித்திருந்த சின்னவள் P-O-A-R, P-O-E-R, … என்று தவறி முயன்று (trial and error!) கொண்டிருந்தாள்.

சாலைச் சந்திப்பொன்றின் சிகப்பு விளக்கு மாற, கடந்து சென்ற என்னுள் சிந்தனைகள் படர்ந்தன. ஒரே ஒலிக்குறிப்புக்கு ஆங்கிலத்தில் பல்வேறு எழுத்துக்கூட்டுகள் இருக்க முடியும். ஆனால், தமிழ் வேறு மாதிரியான ஒரு மொழி. ஒலியடிப்படையில் அமைந்த எழுத்துக்கள் (phonetic language).

உடனே தமிழின் சிறப்புப் பற்றிப் பெண்களுக்குச் சொல்லவொரு வாய்ப்பென்று எண்ணி, “பாருங்கடா… தமிழில் இது ரொம்ப சுலபம். ‘போர்’ என்பதற்குத் தமிழில் ‘போ’ – ‘ர்’ என்ற இரண்டே எழுத்துக்கள் தான்”, என்றேன். “இல்லை. இந்தப் போருக்கு வேற அர்த்தம். ஆனா எழுத்து நம்ம உச்சரிப்ப ஒட்டி அப்படியே போட்டுக்கலாம். குழப்பமே இல்லை”.

“…”

“எந்தச் சொல்லாக இருந்தாலும், அதை அப்படியே ஒலிப்பது போல ஒவ்வொரு ஒலியாகச் சொன்னால் அதுவே போதும்”

என் பெண்களிடம் மட்டுமல்ல, கல்லூரி நாட்களில் மொழியியலில் ஆர்வம் கொண்டிருந்த சில அமெரிக்க நண்பர்களிடம் கூடத் தமிழின் ஒலிப்பு முறையில் அமைந்த எழுத்துக்கள் பற்றி, உயிர், மெய், உயிரும் மெய்யும் சேர்ந்து எழும் உயிர்மெய் என ஆர்வத்துடன் விவரித்திருக்கிறேன்.

சிந்தனைகள் தொடந்து தற்போதைய ஒருங்குறி என்னும் யூனிகோடு குறியீட்டு முறைக்குத் தாவியது. ‘போ’ ‘ர்’ என்று எளிதாக எழுத்துப் பிரிக்க முடிந்த ஒன்றை யூனிகோட்டுக் குறிகளும் ‘போ’வுக்கு ஒரு குறி, ‘ர்’க்கு ஒன்று என்று ஒன்றிற்கொன்று (one-to-one) என்னும் அடிப்படையில் அமைத்திருந்தால் வெகு சிறப்பாக இருந்திருக்கும். ஆனால் இசுக்கி (ISCII) என்னும் கயிற்றில் கட்டி இறுக்கி வைத்துவிட்டார்கள் யூனிகோட்டுத் தமிழை.

Image borrowed from iraa.padmakumar

சரி, ‘போ’வென்னும் உயிர்மெய்யைப் பகர மெய்யும் ஓகார உயிரும் சேர்ந்து (ப் + ஓ) தருவது போன்று இன்னும் அடிப்படைக்குச் சென்று அமைத்திருப்பார்களாக இருக்கும் என்று ஆறுதலடையவும் வழியில்லாதவாறு தமிழை ‘இந்திக்’ குடும்பத்தோடு சேர்த்து அடைத்துவிட்டார்கள். அடிப்படை எழுத்தாய் அகரமேறிய மெய்யை அமைத்திருக்கும் யூனிக்கோட்டில் ‘போ’ வென்று சொல்லப் பகர உயிர்மெய்யும் ஓகாரக் கொம்பும் அமைக்கப்பட்டிருக்கிறது! [ போ = ப + ோ ]. இது பெரும் பிழை. தமிழின் இலக்கணத்துக்கு ஒவ்வாதது என்று பலர் எடுத்துச் சொல்லியும் யூனிக்கோடு சேர்த்தியம் நிலைப்புப் பொள்ளிகை (stability policy) என்று சொல்லி இந்தக் கருத்தை ஏற்க மறுத்து வருகிறது.

“கண்ணா, தமிழில் போர் என்று சொல்ல இரண்டு எழுத்துக்கள் போதும்: போ, ர் ” என்று இன்று சொல்ல முடிகிற என்னால், யூனிகோட்டு முறையைச் சொல்ல, “முதலில் ஒரு பகர உயிர்மெய் போட்டுக்கோ, அப்புறம் ஒரு ஓகாரக் கொம்பு, இல்லையில்லை பகர மெய்யும் ஓகார உயிரும் சேர்ந்தால் தான் உயிர்மெய் வரும், ஆனா யூனிக்கோட்டிலக்கணம் வேற மாதிரி. ஆச்சா, அப்புறம், ரகர உயிர்மெய் போட்டுக்கோ கடைசியில ஒரு புள்ளிக்குறியும் சேர்த்துக்கோ.”

“இல்லை புள்ளி உயிரும் இல்லை, மெய்யும் இல்லை. இல்லப்பா அது ஆய்தமும் இல்லை. அது ஒரு எழுத்தே இல்லை”

“இந்திக்காரங்கல்லாம் இப்படித்தான் எழுதுவாங்களாம்”

“இல்லடா… நான் உனக்குத் தமிழ் தான் சொல்லித் தர்றேன்”.

தர முயல்கிறேன். ஹ்ம்ம்…

‘போ’வுக்கு ஒரு குறி. ‘ர்’க்கு ஒரு குறி. போ கூட்டல் ர். எவ்வளவு எளிமையான ஒன்று!

மூக்கைத் தொட ஏன் தலையைச் சுற்ற வேண்டும்?

Image borrowed from Sinnathurai Srivas

Tags: கணிநுட்பம் · கண்மணிகள் · யூனிகோடு

13 responses so far ↓

  • 1 பாலராஜன்கீதா // Oct 27, 2007 at 3:10 am

    பதிவிற்குத் தொடர்பில்லாத ஒரு சிறு துணுக்கு (பலருக்குத் தெரிந்திருக்கலாம்)
    ஆங்கிலத்தில் pour என்றால் தமிழில் வார்
    ஆங்கிலத்தில் war என்றால் தமிழில் போர்
    🙂

  • 2 ravishankar // Oct 27, 2007 at 5:22 am

    ஹ்ம்ம்..ஒருங்குறி வந்த காலத்தில் இருந்த நம் “தமிழ்க் கணிமை முன்னோர்கள்” (!?) அசட்டையா இருந்துட்டாங்க 🙁 ஓகாரம் மட்டும் இல்லாம எல்லா உயிர்மெய் எழுத்தும் இந்தக் குழப்பத்தில் தான் இருக்கு..இந்தியா என்ற அடையாளத்துக்குள் எல்லாவற்றையும் போட்டு அடைக்க முயன்றதால் வந்த வினை..


    அடிக்கடி நீங்கள் பதிவில் எழுதினா நல்லா இருக்கும்.. 🙂

  • 3 iraamaki // Oct 27, 2007 at 8:27 am

    அன்பிற்குரிய செல்வராஜ்,

    ஒருங்குறியின் அடிப்படைக் குறை பற்றி மடற்குழுக்களிலும், வலைப்பதிவிலும் பேசி எழுதி வாயும், கையும் வலித்தது தான் மிச்சம். “ஒருங்குறிச் சேர்த்தியம் (unicode consortium) தன் நிலைபாட்டை மாற்றிக் கொள்ளும், All Character Encoding முறைக்கு வந்து சேரும்” என்றோ, அப்படி மாற்றத் தமிழக அரசாங்கமும், இந்திய நடுவண் அரசாங்கமும், வலுவான குழுக்களிலும், கும்பணிகளிலும் இருக்கும் தமிழ் ஆர்வலர்களும் இப்பொழுது பாடுபடுவார்கள் என்று எண்ணுவதில் பொருள் இல்லை என்றே தோன்றுகிறது, “உத்தமம் (INFITT) இதை மாற்ற முயலும்” என்ற நம்பிக்கையும் போய்விட்டது. இப்பொழுது எல்லோரும் ஒருங்குறியின் வெளித் தோற்றக் குறைகளை ஒட்டுப் போடுவது பற்றிப் பேச முற்படுகிறார்கள். (அடியோடு மாற்றுவது பற்றி மூச்சப் பேச்சைக் காணோம். ஏனென்றால் ஒட்டுப் போடும் பணியில் ஏராளமான சொவ்வறைக்காரர்களுக்கு – software personnel – வேலை கிடைக்குமல்லவா?:-))

    நண்பர் அன்பரசன் நேற்றுத்தான் தமிழ் மடற்குழுக்களுக்கும் (தமிழ் உலகம், அகத்தியர்), G-infit குழுவுக்கும் ஒட்டுப் போடுவதில் உள்ள கேள்விகளை அறியத் தரச் சொல்லி மடல் அனுப்பியிருக்கிறார்.

    ஆனாலும், ஒரு நாள் இந்திய நடுவண் அரசு இந்திய மொழிகளுக்கு தம் முட்டாள் தனத்தால் இழைத்த தீங்கை உணர்ந்தால் நன்றாக இருக்கும்.

    அன்புடன்,
    இராம.கி.

  • 4 செல்வராஜ் // Oct 27, 2007 at 10:34 am

    பாலராஜன்கீதா, நான் முன்பு கேள்விப்பட்டதில்லை. சுவையாகத் தான் இருக்கிறது!

    ரவி, நம் முன்னோர்களின் அசட்டை என்று சொல்லிவிட முடியாது. கணிமை பற்றிய பரவலான அறிவு தமிழ்ச்சூழலில் பரவும் முன்னரேயே இசுக்கிப் போல்மத்தை எடுத்துக் கொண்ட யூனிகோடு சேர்த்தியம் அதன் பிறகு நிலைப்புக் கொள்கை என்று மறுத்து வருகிறது. புதிய TACE/TANE குறியேற்றம் எங்கு இட்டுச் செல்கிறது என்று பார்க்க வேண்டும். இவை பற்றி இன்னும் சில எழுத இருக்கிறேன். அது உங்களின் கடைசி வரிக்குமான பதில்:-)

    ஓகாரம் ஒரு எடுத்துக்காட்டுத் தான். எல்லா உயிர்மெய் எழுத்துருவாக்கமும் பற்றிய குறிப்புத் தான் அது.

  • 5 Natkeeran // Oct 27, 2007 at 12:41 pm

    வேதியியல் பற்றி பேரா. செல்வா பல நல்ல தகவல்களை த.வி வில் சேர்த்துள்ளார். நீங்களும் வேதிப் பொறியியல் பற்றி நீங்கள் கடந்த வருடம் உங்கள் வலைப்பதிவில் தொகுத்த தகவல்கள் தொடக்கம் சற்று சேர்த்தால் நன்றாக இருக்கும்.

    உங்களுக்கு நேரமின்மை, மற்றும் வேறு நல்ல பணிகள் இருக்கின்றது என்பது கண்கூடு. இருப்பினும் அவ்வவ்பொழுது வந்து உங்கள் அறிவு சேர்க்கையை த.வி பகிர்ந்தால் ஏணைய பயனர்களுக்கும் உற்சாகம் தரும்.

    நன்றி.

  • 6 யக்ஞா // Oct 29, 2007 at 7:06 pm

    செல்வராஜ், இந்த ஒருங்குறி பிரச்சினை பற்றி முன்னொரு முறை எழுதியது நினைவுக்கு வருகிறது. ஒவ்வோர் எழுத்துக்கும் ஓரிடம் என்பது தேவையில்லாதது. ஆனால் க், ங், ச்… அடிப்படையில் குறிப்புள்ளிகள் இருந்திருந்தால் பிரமாதமாக இருந்திருக்கும். ஆனால் இதெல்லாம் நிரல்கள் மூலமாக கடைப் பயனர்களிடமிருந்து மறைத்துவிடலாம். இது ஒரு கணிப்பிரச்சினையாக அணுகினால் போதும். அப்படித்தான் இனி இதை அணுகவும் முடியும்! ஒருங்குறியில் இது போன்ற சில ஒவ்வாமைகள் தமிழுக்கு மட்டுமில்லை, பல மொழிகளுக்கு உள்ளது. நீங்கள் மற்றதையும் எழுதுங்கள், விரிவாக பார்க்கலாம்.
    அப்படியே அந்த mindmap’ன் மூலத்தையும் மேற்கொளிட்டால் நன்றாகயிருக்கும்.

  • 7 வசந்தன் // Oct 30, 2007 at 12:20 am

    நீண்டகாலத்தின் பின் உங்கள் பதிவைப் பார்க்கிறேன்.
    சிறிது காலத்தின்முன்பும் ஒருங்குறி பற்றிய விவாதம் நடந்தது. இராம.கி ஐயா நிறைய எழுதினார். ‘கவிதா கயிதா ஆன கதை’ என VOW எழுதினார்.
    அந்தச் சுட்டிகளையும் தேடியெடுத்து இவ்விடுகையில் இணைத்தால் நன்று.
    இது தொடர்பாக இடுகைகள் நிறைய எழுதப்பட வேண்டும். முன்பு எழுதப்பட்டவைகளும் மீளிடுகை செய்யப்பட வேண்டும். ஏனென்றால் இப்போதெல்லாம் நிறையப்பேர் புதியவர்கள்தாம்.

  • 8 செல்வராஜ் // Oct 30, 2007 at 8:18 am

    யக்ஞா, ஆவாரங்கால் ஸ்ரீவாஸின் mind-map அது. அப்படத்தைச் சொடுக்கினால் அவரது பக்கத்திற்கே போகுமாறு இணைப்புக் கொடுத்திருக்கிறேன். நீங்கள் கவனிக்கவில்லை போலும். ஒருவகையில் எல்லா எழுத்துக்களுக்குமான குறிப்புள்ளிகள் தேவை என்று எனக்குத் தோன்றுகிறது. இன்னும் கொஞ்சம் அதுபற்றி எழுதுகிறேன். பொறுத்திருக்கவும்.

    இங்கே எழுதுவதால் பெரிய மாற்றம் வந்துவிடப்போவதில்லை. ஆனாலும் சிறு விதை சில சமயங்களில் ஆச்சரியத்தக்க மாற்றங்களை உண்டுபண்ணலாம். என்னுடைய புரிந்துகொள்ளலுக்காகவும், இதுபற்றிய எண்ணம் ஏதுமில்லாமல் இருப்பவர் மத்தியில் இவற்றைப் பரப்பவும், எழுதுகிறேன். அதோடு வசந்தன் சொன்னது போல் புதிதாக நிறையப் பேர் இருக்கிறார்கள். அவர்களும் இவற்றைப் பற்றி அறிந்துகொள்ள ஒரு வாய்ப்பாகவும் இருக்கும்.

    வசந்தன், நன்றி. அடுத்த இடுகையில் காசி, இராம.கி அவர்களின் இடுகைகளுக்குச் சுட்டி எடுத்து வைத்து இருக்கிறேன். இரண்டொரு நாட்களின் எழுதுகிறேன். மற்ற இடுகைச்சுட்டிகளையும் எடுக்க வேண்டும்.

  • 9 செல்வராஜ் // Oct 30, 2007 at 8:21 am

    நட்கீரன், உங்கள் அழைப்பிற்கு நன்றி. பலமுறை நீங்களும் சொல்லிவிட்டீர்கள். எனக்கும் அந்த எண்ணம் உள்ளது. விரைவில் வந்து விக்கிபீடியாவிலும் கலந்து கொள்ள முயல்கிறேன். எனக்கும் சில எண்ணங்கள் திட்டங்கள் உள்ளன. வேதிப்பொறியியல், தெறுமத்தினவியல் போன்றவற்றைத் தொட்டுச் செல்ல. குறைந்தபட்சம் ஆங்கிலக் கட்டுரைகளை மொழியாக்கம் செய்தாவது இடலாம். பார்க்கிறேன்.

  • 10 Kasi // Oct 30, 2007 at 8:45 am

    செல்வா,

    உண்மையாகச் சொல்கிறேன். இந்த இடுகை தொட்டுச்செல்லும் பல நுண்ணிய விசயங்களில் எனக்கு இன்னும் ஆழமான புரிதல் இல்லை. ஏனோ அவற்றுள் இறங்கி அறிந்துகொள்ள ஆவலும் வற்றிவிட்டது. அதனால்தான் இரண்டு நாட்களுக்கு முன்னமே இதைப் பார்த்தும் ஒன்றும் பேசாமல் சென்று விட்டேன். இப்போது இதை எழுதக்காரணம், என் பெயரைக் குறிப்பிட்டு நீங்கள் மேலே எழுதிய மறுமொழி! யுனிகோடு பற்றிய என் கட்டுரை மூன்று ஆண்டுகளுக்கு முன் எழுதப்பட்டது. அது ஒரு பயனர் பார்வையில் எழுதப்பட்டது. (பாமரன் பாமரனுக்குச் சொன்னது) அதில் சில பிழைகளுமே உண்டு.

    இந்த சூழலுக்கு காட்டாக ஒரு உருவகம்: pal, ntsc, secam, மூன்றில் எது சிறந்தது என்று ஆய்வது உங்களைப்போன்ற விஞ்ஞானியின் வேலை, ஒரு கருவியில் எந்த செட்டிங் செய்தால் படம் தெரியவைக்கலாம் என்று தெரிந்துகொள்வது ஒரு பொறியாளனின் வேலை. என் மட்டம் பொறியாளனுடையதே. ஒரு முன்னெச்சரிக்கையாக இருக்கட்டுமே என்றுதான் இதை இங்கே சொல்லிவைக்கிறேன்.

    இந்தப் பொருளில் உங்கள் கட்டுரையும், இராம.கி, நாக.கணேசன் போன்றோர் இதுபற்றி எழுதியவையும் ஆர்வமுள்ள பலருக்கும் பயனாகும்.

  • 11 செல்வராஜ் // Nov 10, 2007 at 9:57 am

    அன்பின் இராம.கி ஐயா, உங்களது முன்னிகை ஏதோ காரணத்தால் எரிதப்பட்டியலில் சேர்ந்துவிட்டதை இன்றுதான் பார்த்து மீட்டேன். தமிழக அரசின் TANE/TUNE முறை பற்றிய இற்றைப்படுத்தப்பட்ட தகவல்கள் முழுதாய்த் தெரியவில்லை. வரும் சில மாதங்களில் யூனிக்கோடு சேர்த்தியத்தோடு ஒரு கூட்டம் இருப்பதாகச் சில நண்பர்கள் வாயிலாக அறிகிறேன். ஏதேனும் முன்னேற்றம் இருப்பின் நன்றாக இருக்கும். யூனிக்கோடும் தமிழும் குறித்து நான் இன்னும் ஒரு இடுகை எழுத இருக்கிறேன். நன்றி.

  • 12 நவநீதகிருஷ்ணன் // Dec 1, 2007 at 8:31 am

    Dear Selva,

    WQhen QWERTY Key Board was made and improved over a period of time I have heard that the letters were arranged in such a way that the most used letters and common combinations were placed for easy finger operation and speed of typing. Unfortunately this aspect is not taken into account because of unification(!) of “indic languages” . For example you have to press the shift key and type U for ங,(u is given for ஹ), Shift+C for ண,Shift+V for ன etc., as per the preferences for Hindi. The only way we can get out of this mess is to think afresh and stop the influence of other languages and develop an unique system acceptable to every one. The aim should be to make it easy to type fast . It is high time that all the experts come together and work.
    I am soory this is not written in Tamil mainly because I have to spend more time o pen my thoughts. Thanks

  • 13 அதி. அழகு // Dec 7, 2009 at 3:20 am

    போர் எனும் சொல்லில் உள்ள “போ”வின் ஒருங்குறிக் குறையை எழுதி இருக்கின்றீர்கள், நன்று.

    “ர்”ஐ ஏன் விட்டீர்கள்?
    http://azahumozi.blogspot.com/2009/07/03.html