October 19, 2004

யுனிகோடா, தனிக்கோடா?

(இத்தலைப்பின் "தனிக்கோடு" என்ற சொல் உபயம் காசி. யுனிகோட் என்ற சொல் உபயம் யுனிகோட் கொன்ஷோசியம்)
கோபிக்காதீர்கள் காசி, இந்த அடைப்புக்குறி விளையாட்டு சும்மா சீண்டலுக்குத்தான்.

அண்மையில் சின்ன சர்ச்சை எழுந்துபோனது.
திண்ணையில் வெளியாகிய ஓர் நேர்காணலைத்தொடர்ந்து இது ஏற்பட்டைது.
யுனிகோடின் போதாமைகள் பற்றி பேசிய அந்நேர்காணலில் காசியின் கட்டுரை ஒன்றின் பகுதிகள் அப்படியே கையாளப்பட்டுள்ளன என்பதுதான் அது.
அதற்கு காசி கருத்தும் வெளியிட்டிருந்தார்.
அது நிற்க.
அந்நேர்காணல் சொல்லிய விடயங்கள் பற்றி விவாதம் ஏதும் எழாமலே அமிழ்ந்துவிட்டதா?
ஜெயதீபன் அண்ணா அந்த நேர்காணல் வெளிவந்த உடனேயே அதனை எனக்கு அனுப்பிவைத்திருந்தார்.
நான் ஏதாவது சொல்ல முயல்வேன் என்று அவருக்கு தெரியும்.
யுனிகோடில் தமிழ் இட ஒதுக்கீடுபற்றிய உடன்பாடின்மை ஆரம்பத்தில் எனக்கு நிறையவே இருந்தது.
அதுவும் மைக்ரோசொப்த் வேர்ட் இல் தமிழ் எழுத்துக்கள் "formatting" பிரச்சனையால் கைகால் பிய்ந்துபோய் தோன்றியபோது, நான் வெறுப்பின் உச்சத்திலிருந்தேன்.
இதுபற்றி திரு முத்து நெடுமாறனின் நேர்காணல் ஒன்று அதனை படித்த வேளையில் என் அரசியல் நிலைப்பாடுகாரணமாகவும், இந்த வெறுப்பின் காரணமாகவும் மிகவும் எரிச்ச்சலூட்டியது.
(அந்த "எழில் நிலா" நேர்காணல் ஞாபகமிருக்கா?)
"பெரிய பெரிய நிறுவனங்கள் எல்லாம் ஏற்றுக்கொண்டபிறகு அதைப்போய் இப்பொழுது மாற்ற முயல்வது வீணான வேலை" என்பதுபோல அர்த்தம் தொனித்த பேட்டி அது.
பின்பு இந்தவருட ஆரம்பத்தில் திரு முத்து நெடுமாறனோடு நேரில் உரையாட வாய்ப்புக்கிடைத்தபோது இந்த விஷயத்தைப்பற்றியே துருவித்துருவிக்கேட்டேன்.
அவரும் சளைக்காமல் சிரித்த முகத்துடன் பதிலளித்தவண்ணமே இருந்தார்.
அவரது பதில்கள் எனக்கு திருப்தியைத் தந்தது உண்மைதான்.
அவரது பதில்களின் சாராம்சம் இதுதான்,
1. தொழிநுட்பம் வளரும் போக்கையும் வேகத்தையும், தொழிநுட்பத்தின் சாத்தியப்பாடுகளையும் கருதும்போது, இப்போதிருக்கிற நிலையை மட்டும் வைத்துக்கொண்டு, அந்த சட்டகத்தின் வழியாக பார்த்து , இந்தைந்த பிரச்சனைகள் எல்லாம் இருக்கின்றன என்று சொல்வது தேவையற்றது.
தொழிநுட்பம் சார்ந்த போதாமைகள இன்னொரு தொழிநுட்பம் கொண்டு நாம் நிவர்த்தித்துவிடலாம் அதுபற்றி, இந்த ஆரம்பகட்டத்தில் அவ்வளவு அலட்டிக்கொள்ளத்தேவையில்லை.
2. சீனமொழி அனுபவத்தை வைத்துக்கொண்டு செய்யப்படும் வாதங்கள் அர்த்தமற்றை. ஏனெனில் , தமிழ் இவ்வாறு குறந்த இடத்தை பயன்படுத்தத்தக்கதாய் இருக்கும்போது, ஏன் அதனை சீனமொழி அளவுக்கு தரம் தாழ்த்துகிறீர்கள்?

இந்தக்கருத்துக்களால் மனம் ஓரளவுக்கு அமைதியடைந்தபோதும் இப்பிரச்சனை பற்றி அடிக்கடி நான் யோசிப்பதுண்டு.
தற்போது திண்ணையில் வெளியாகியிருக்கும் இக்கட்டுரை, மறுபடி இதுபாற்றிய வாதப்பிரதிவாதங்களை செய்யத்தூண்டியிருக்கிறது.

இதுபற்றிய எனது கருத்துக்களை பகிர்ந்துகொள்ளலாம் என நினைக்கிறேன்.
தற்போதைய குறிமுறையில் அகரவரிசைப்படுத்துதல் பிரச்சனையாக இல்லை. (நான் சோதித்துப்பார்த்த அளவில்)
எழுத்துக்களுக்கு தனித்தனி இடம் ஒதுக்காமல் கால்வேறு கைவேறாக பிய்த்திருப்பதால், தமிழ் பிரயோகம் சிக்கலுக்குள்ளாவதை அனுபவித்திருக்கிறேன்.
ஆங்கிலத்தைப்போல எந்தவித சிக்கலுமின்றி தமிழை பயன்படுத்த முடியாமற்செய்வது இதுதான்.
கோப்பினளவு கூடுவதுபற்றி பெரிதாக அலட்டிக்கொள்ளத்தேவையில்லை.
ஏனெனில், எவ்வாறாயினும் யுனிகோட் ஆவணமொன்றின் கோப்பளவு இருமடங்காகத்தான் இருக்கும் (அது பதினாறு பிட் அளவூல் இருப்பதால்).
எதிர்காலத்தில் தகவற்பரிமாற்ற வேகமே முன்னேற்றத்தை தீர்மானுக்குமெனில், ஆங்கிலேயர்கள் பேசாமல் ஆஸ்கி யினையே பயன்படுத்திக்கொள்வார்கள். யுனிகோட் குறிமுறையின் அடிப்படைகளை பயன்படுத்தும்வரை அவர்களது எட்டு பிட் வேகத்துக்கு எம்மால் ஈடுகொடுக்க முடியாது.
யுனிகோட்மட்டுமே பயன்படுத்தத்தக்க செயலிகளிலும் ஆங்கிலேயர்கள் ஆஸ்கியினை பயன்படுத்துவதில் எந்தவிதமான பிரச்சனையும் ஏற்படப்போவதில்லை.

திண்ணை கட்டுரையாளர் சொல்வதுபோல் திஸ்கியின் எழுத்து வரைபடத்தையே அவர்கள் சோம்பல்காரணமாக யுனிகோடுக்கும் பரிந்துரை செய்திருப்பார்களானால் என்னால் அவர்களை மன்னிக்கவே முடியாது.

இந்த இடத்தில் திண்ணை நேர்காணலில் சொல்லப்பட்ட மற்றொரு விஷயத்தோடு எனக்கு நிறைய முரண்பாடு உண்டு.
அதுதான் தேடுபொறிகள் சம்பந்தப்பட்ட விஷயம்.
கூகிளில் நீங்கள் " தமிழ்" என்று தேடுவீர்களாயின், கிடைக்கும் பெறுபேற்றில்,
தமிழா, தமிழம், தமிழுக்கு, தமிழே
எல்லாம் இடம்பெற்றிருக்கக்காண்பீர்கள்.
இது இப்போதிருக்கும் கைகால் பிய்த்த குறிமுறையிலேயே சாத்தியம்.
மாறாக தனித்தனி எழுத்துக்களுக்கு இட ஒதுக்கீடு செய்திருந்தால் இந்த வசதி கிட்டியிருக்காது. அவ்வாறு இந்த வசதி பெறப்படவேண்டுமாயின் தேடுபொறிகள் இயங்குவதற்கான செய்நிரலிலேயே மாற்றங்களை கொண்டுவரவேண்டியிருக்கும்.
இது தற்போதைய குறிமுறையால் ஏற்பட்ட ஓர் மேலதிக நன்மை.
நேர்காணலில் இருந்த பின்வரும் வரிகள் மனதைத்தொட்டன
//தாங்கள் கேட்ட இடத்தை யுனிகோட் தர மறுத்ததால் சீனா அதிரடியாக தங்களுக்கென்று தனியே ஒரு குறியீட்டு முறையை வகுப்பதாகவும் அந்தக் குறியீட்டு முறையிலான மென்பொருள்களையே இனி சீனாவுக்குள் பன்னாட்டு நிறுவனங்கள் விற்க முடியும் என்றும் அறிவித்தது. அவ்வளவுதான் எல்லா வணிகர்களும் அதற்கு பணிய வேண்டிவந்தது நம்முன் உள்ள வரலாறு. //
மொத்தத்தில், யுனிகோட் ஒதுக்கீட்டில் நாம் அதிக இடத்தை வாங்கிக்கொள்ளவேண்டும். (ஏறத்தாழ 500).
இதில் எனக்கு எந்த மாற்றூக்கருத்தும் கிடையாது.
ஆனால் இந்த கைவேறு கால்வேறு ஒழுங்குமுறையில் மாற்றம் கொண்டுவரவேண்டுமா என்பதுபற்றி என்னால் எந்தவிதமான தீர்க்கமான முடிவுக்கும் வரமுடியவில்லை.
வாங்கிக்கொள்ளும் இடஒதுக்கீட்டினை நாம் வேறு வினைத்திறன் மிக்க பயன்பாட்டுக்கு பயன்படுத்திக்கொள்ளலாம் என்பதால், அதிக இடம் முக்கியத்துவம் பெறுகிறது அவ்வளவுதான்.
மற்றது எவ்வளவு காலத்துக்குத்தான் நாம் யுனிகோடில் தங்கியிருக்கப்போகிறோம்?
தொழிநுட்ப மாற்றங்கள் பெரும் பாய்ச்சலாகத்தான் நடைபெறும். காலப்போக்கில் எந்தவித பிரச்சனையுமில்லாமல் எமக்கென்றொரு தனிக்குறியீட்டுத்திட்டம் வந்தாலும் ஆச்சரியமில்லை.
இதுபற்றி மேலும் மேலும் பேசுவோமா?
தயவுசெய்து இக்குறிப்பினை வாசிக்கும் அனைவரும் இதுபற்றிய கருத்தொன்றை இடுகை செய்யுங்கள்.
விவாதம் சூடுபிடிக்கும் பட்சத்தில் பல "பெரிய தலைகள்" இதில் இணைந்துகொள்ளும்.
ஆக்கபூர்வமான ஏதாவதொரு முடிவுக்கு வரலாம்.








4 பிற்சேர்க்கைகள்:

said...

திண்ணையில் கூறப்பட்டுருந்த கருத்துக்கள் சரியானதே.
தமிழில் வன்பொருள், மென்பொருள் தாயரிக்கும் பொழுது, தற்போதைய ஏற்பாடு பல தேவையில்லா சிக்கல்களை கொடுக்கும். அவசரத்தில் தரமற்றவற்றை தரமாக்கிவிடக்கூடாது.
தொலைநோக்குடன் செயப்பட வேண்டும்.

Moreover, the INFITT's current neural stand on this issue is unacceptable. Also, the attitudes of the Microsoft's Representative? on INFITT as
well as some prominant Tamil computing personalities must be strongly condemn.

நற்கீரன்

said...

நீங்கள் சொன்னதுபோல் "தமிழ்" என்று தேடினால் தமிழா, தமிழம், தமிழுக்கு, தமிழே என்பன தேடல் முடிவில் இடம்பெறுவது நன்மையே. இந்த வசதி இப்பொதுள்ளதுபோல் தமிழ் வடிவமைக்கப் பெற்றதன் நன்மை. ஒவ்வொரு எளுத்துக்கும் என இட ஒதுக்கீடு செய்தால், இவ்வாறு அமையாது. இப்போது தான் உணர்கிறேன். அது உம்மையில் ஒரு நல்ல விடயம்தான்.

உங்களது "எமக்கென்றொரு தனிக்குறியீட்டுத்திட்டம்" த்தை நான் வன்மையாகக் கண்டிக்கின்றேன். இப்போது உலகம் உலகமயமாக்கும் பணியில் ஈடுபடும்போது நாம் பிரிந்து போவது நன்றன்று. ஈரோ பண மாற்றம் போல் எல்லொரும் ஒன்றுகூட வேண்டும். தமிழுக்கு என்றொன்று உருவாக்காமல், தமிழ் போல் உள்ள அனைத்து மொழிகளுக்கும் என்றொன்று உருவாக்கினால் நன்றாக இருக்கும். அவ்வாறு செய்தால் தேடல் (search), களஞ்சியப்படுத்துதல் (store), நிறைவேற்றுதல் (execute) போன்ற செயல்முறைகளை வினைத்திறன் மிக்கதாக வடிவமைக்கலாம். முக்கியமாக களஞ்சியப்படுத்தும் துறைகளில்[DataBase] ஈடுபடும் அனைத்து மென்பொருள் தயாரிப்பாளர்களூம் இதை வரவேற்பார்கள்.

நமது தேவைகளுக்காக கணினி உருவாக்கப்பட்டதேயன்றி, கணினிக்காக நாமில்லை.

கனடாவிலிருந்து ஓர் ஈழத் தமிழன்
_______
CAPital

said...

மயூரன்,

தாமதமான பின்னூட்டத்துக்கு மன்னிக்கவும்.

நான் பலமுறை சொன்னதுபோல எனக்கு பெரிய மென்பொருள் அனுபவம் கிடையாது, அதிலும், தமிழ்க்கணிமை, குறியேற்றம் எல்லாதிலும் நான் குழந்தை. சில வாரங்களுக்கு முன் தமிழ்மணம்.காம் தளத்தில் வலைப்பதிவில் எழுதப்படுபவைக்குள் ஒரு சிறு தேடும் வசதியை ஏற்படுத்தினேன். அப்போது அனுபவித்து உணர்ந்தது, இந்த உடைந்த வடிவத்தின் ஆற்றல். தமிழைப்போல புனர்ச்சி-இயல்பு உள்ள எழுத்து முறைகளுக்கு இந்த முறை கட்டாயம் ந்ல்லதுதான் செய்கிறது என்பது என் எண்ணம். இதை வைத்து அந்தத் தேடும் வசதியில் நான் சில சுட்டித்தனங்களைக் கொடுக்கமுடிந்தது. உதாரணமாக 'இந்தியா' என்று தேடும்போது, 'இந்திய' என்று வரும் விடைகளளயும் அளிப்பது. இறுதியில் வரும் யா வில் உள்ள ய+ஆ இரண்டும் இரு எழுத்துக்களாக இருப்பதால், இது மிகவும் சுலபமானது. ஒரு சொல்லில் கடைசி எழுத்து '+ஆ' வாக (உயிர் எழுத்து 'ஆ' வேறு, இது வேறு, தெரியுமல்லவா, இது வெறும் கால் போடுவோமே அது) இருந்தால் அதைமட்டும் விட்டுவிடு என்று கட்டளை கொடுப்பது எளிதாக இருந்தது. இதையே ஒவ்வொரு எழுத்துக்கும் ஒரு குறியீடாக உள்ள குறியேற்றமாக இருந்தால் செய்ய சிரமப்பட்டிருக்கவேண்டும் (செய்ய முடியாததல்ல).

இதுபோல பல சாத்தியங்கள் இருக்கும், இதுபற்றி ஆராய்ந்தால் புலப்படும்.

அதுசரி, இந்த முறை வசதியாக இருக்கிறது, ஆனாலும் நிறைய இடம் வேண்டும் என்பதன் நோக்கம் பிடிபடவில்லையே.

இன்னொன்று, இப்பொது இருக்கும் அகர வரிசை மெய்யெழுத்துக்களில் சரியாக இல்லை. இதில் பிரச்னை இல்லை என்று சொல்ல முடியாது. இது கவனிக்கவேண்டியதே.

அன்புடன்,
-காசி

said...

பேச்சுச் செயலிகளை நடைமுறைப்படுத்தும்போது இப்போதுள்ள முறை சிக்கலைத் தருமென்று நினைக்கிறேன்.
தம்பி என்ற சொல் "தஅம்பஇ" என்று இருப்பதால் இதை கணிணியைக் கொண்டு உச்சரிக்கச் சொன்னால் வேறு உச்சரிப்புத்தான் வரும். அடிப்படையில் "எழுத்திலிருந்து பேச்சு" முறைக்கு தமிழ் மிகமிக ஒப்பான மொழி. (ஆங்கிலத்திலிருக்கும் சிக்கல்கள் இலக்கண - ஒலியடிப்படையில் தமிழில் இல்லை)
ஆனால் இப்போதுள்ள யுனிக்கோடு முறை இதற்கு ஏற்றதன்று.

இந்தியா என்பது இ+ந்+த+இ+ய+ஆ என்றிருக்கிறது. இந்த எழுத்துக்களைக் கொண்டு எப்படி இந்தியா என்ற உச்சரிப்பைப் பெறுவது?
ய+ஆ = யா என்று எடுத்துக்கொள்வோம். (மாத்திரைதான் சற்றுக்கூடும். பரவாயில்லை)
த+இ எப்படி 'தி' ஆகும்? எனவே கட்டாயம் த்+இ என்றுதான் அவை இருக்க வேண்டும்.