தமிழ் இலக்கணத்தைக் கலைத்துப்போட்டுக் கணிதமாக்கிக் கணிநிரலாக்கும் பணி - Coding the Grammar
Firefox தமிழ்ச் சொல் திருத்தி நீட்சி ஒன்றைப் பாலச்சந்தர் உருவாக்கி இருக்கிறார்.
அவரது உழைப்புக்கும், முயற்சிக்கும் மனங்கனிந்த பாராட்டுக்கள். இந்நீட்சியினை நிறுவி சோதித்துப், பயன்படுத்திக் கருத்துக்கள் சொல்வதன் மூலம் நீங்களும் அவரை உற்சாகப்படுத்தி அடுத்தடுத்த கட்டங்களுக்கு உந்திவிடலாம்.
ஏற்கனவே க்னூ/லினக்சுக்கான அஸ்பெல், ஓப்பன் ஆஃபீஸ் போன்றவை தமிழ் திறந்த மூலச் சொல் திருத்தும் வசதிகளைக் கொண்டிருந்தது.
குறள் தமிழ் செயலி போன்ற மூடிய, வணிக மென்பொருட்களும் இவ்வசதிகளைத் தந்தன.
இவை எல்லாம் அடிப்படையிற் சொற்பட்டியல் ஒன்றோடு ஒப்பிட்டுப்பார்த்துப் பட்டியலில் இல்லாத சொற்களின் கீழ் "சிவப்புக்கோடிடும்" முறையைப் பின்பற்றிச் சொல்திருத்தின.
இப்போது பாலு உருவாக்கியிருக்கும் நீட்சியும் இவ்வாறானதே.
இத்தகைய சொல்திருத்திகள் பற்றியும், சொல் திருத்தியின் தமிழுக்கான பொருத்தப்பாடுகள் குறித்தும் நான் முன்னர் எழுதிய இவ்விடுகையினைப் படித்துப்பாருங்கள்.
தமிழ்க்கணிமையின் அடுத்தடுத்த கட்டங்களுக்கு நாம் பயணப்படும்போது எமது தேவைகளும் எமக்கான கருவிகளும் பரிணாமமடைந்து செல்ல வேண்டும்.
தமிழைப் பிழையின்றி எழுதப், பயன்படுத்த உதவும் கருவிகள் இவ்வழிப்பயணத்தில் மிகவும் இன்றியமையாதன.
எமது பிரபஞ்சத்தில் அனைத்துமே ஒரு "கோலம்" தான் என்றொரு கருத்து இருக்கிறது. Patterns.
சிறு அணுத்துகள் தொடக்கம், பால்வீதியின் வடிவம், ஒழுங்குவரை; கோபம் வருவதற்கான நரம்பின் மின்தூண்டல் தொடக்கம் பரிநிர்வாண நிலையின் மூளையின் நினைவு அலைகள் வரை; வாழ்வின் ஓட்டம், பேரரசுகளின் எழுச்சி வீழ்ச்சி எல்லாமே ஒரு கோலத்தின் அடிப்படையில் மறுபடி மறுபடி, கணிப்பிடக்கூடியபடி, எதிர்வு சொல்லத்தக்கபடி நிகழ்வன என்றொரு கருத்து.
"எல்லாமே" கோலமோ என்னவோ, ஒரு சில விசயங்கள் இவ்வாறு ஓர் ஒழுங்கமைந்த கோலமாக இருப்பதைக்கண்டு வியந்திருக்கிறேன்.
கணிதமே நாமறிய இக்கோலங்களின் வரிவடிவம்.
செயற்கை அறிவு என்பது மனித மூளையின் புதிரான, மனிதனுக்கு அப்பாற்பட்ட இயக்கங்களாக நம்பப்பட்டவற்றை எல்லாம் கலைத்துப்போட்டுக், கணிதமாக்கிக், கணிநிரலாக்குவதுதான்.
இயற்கை மொழிகள் கணிதக்கோலங்களுக்குள் அளவாகப்பொருந்தாது நழுவி நழுவி அழகுகாட்டுவன. இந்த உலகும் நடப்பும் கோட்பாடுகளுக்குள் எப்போதும் அளவாகப்பொருந்துவதில்லையல்லவா?
அந்த நழுவலும் சமன்பாடுகளுக்குள் சிக்காத விலகலும் கூட ஒரு கோலம்தான்.
ஆங்கிலத்தில் ஒரு சிறு வார்த்தையை இலக்கணப்பிழையாய் எழுதி விட்டால் "மைக்ரோசொஃப்ட் வேர்ட்" தொடக்கம், அலுவலக முகாமையாளர்வரைக்கும் கத்தத்தொடங்குவார்கள். (தகவல்: க்னூ லினக்சில் இதுவரை ஆங்கில இலக்கணம் திருத்தும் செயலிகள் என் அறிவுக்கெட்டியவரை இல்லை)
இலக்கணப்பிழையாய்ப் பேசினாலோ நக்கலுக்கும் நையாண்டிக்கும் கீழ்ப்படுத்தலுக்கும் ஆளாக வேண்டி வரும்.
ஆனால் தமிழிலோ இலக்கணப்பிழையாய் எழுதுதல் ஒரு பொருட்டே கிடையாது. இலக்கணப்பிழையாய்ப் பேசினால்தான் அது நாகரிகம்.
எனக்கு தமிழ் இலக்கணம் தெரியாது என்று சொல்வது ஒரு பெருமை.
இலக்கணம் மொழியொன்றுக்குச்செய்யும் நுண்ணிய சேவகங்களும், மொழியினை தாங்கி நிற்கும் வழிமுறைகளும் எண்ணிலடங்காதன.
இலக்கணத்தின் இத்தகைய பெருமைகளை என்னை விடவும் இங்கே மிகத்தெளிவாக வரையறுத்து விளக்க நிறையப்பேர் இருக்கிறார்கள்.
தமிழ் மொழியின் இலக்கணத்தைக் கற்கும்போதெல்லாம் அதனை மொழியொன்றின் இயக்கங்களைத் தீர்மானிக்கும் கணிதச்சமன்பாடுகளின் தொகுப்பாக, தேர்ந்த நிரலாளரின் கணிநிரலாகவே நான் உணர்கிறேன். அதுவும் ஒரு திறந்த மூல நிரல், மக்கள் உருவாக்கிய நிரல்.
இந்தச்சமன்பாடுகளையே நன்னூல், தொல்காப்பியம் போன்றன தொகுத்துத்தருகின்றன.
இப்பொழுது கணிதமும் கணிநிரலாக்கமும் வளர்ந்து நிற்கும் காலமொன்றில் வந்து நிற்கிறோம்.
எமது மொழியின் இலக்கணத்தை முடிந்தவரை முழுமையாகக் கணிதக் கணிநிரற் சமன்பாடுகளுக்குள் கொண்டுவரவேண்டிய பெரும் காலப்பணி எமக்கு முன்னால் காத்திருப்பதை நான் உணர்கிறேன்.
இது மிகவும் சாத்தியமான பணி.
மொழியியலாளர்களும் கணிநிரலாளர்களும் ஒன்றாகக்கூடிச் செய்யவேண்டிய அவசியப்பணி.
தமிழ் மொழி வல்லுநர்களால், மொழியைப் பயன்படுத்தும் வெகு மக்களால் அங்கீகரிக்கப்பட்ட தமிழ் இலக்கணத்துக்கான கணிநிரல் இயக்கத் தொகுப்பொன்றை (Function sets and libraries) உருவாக்கித் தரப்படுத்தவேண்டும்.
இலக்கணமும் சாதாரண மக்களின் மொழிப்பயன்பாடும் விலகும் இடங்களையும், இலக்கணம் வளர்ந்து செல்வதற்கான இடைவெளிகளையும் கையாளத்தக்கவாறு இது அமையவேண்டும்.
மிக அடிப்படையான புணர்ச்சி விதிகள், எழுத்தியல், கவிதை யாப்புக்கள் போன்றவற்றில் இதனை ஆரம்பிக்கலாம்.
எடுத்துக்காட்டாக வெண்பா ஒன்றின் யாப்பிலக்கணத்தை சரிபார்ப்பதற்கான நிரல்வகுப்பொன்று (Class). வெண்பா எழுதிவிட்டு ஒருவர் இந்நிரல்வகுப்பைப்பயன்படுத்தும் செயலி ஒன்றின் மூலம இலக்கணச்சுத்தத்தைச் சரிபார்த்துக்கொள்ளலாம்.
வெவ்வேறு கணிமொழிகள், வெவ்வேறு செயலிகள் இந்நிரல்வகுப்பைப் பயன்படுத்தத்தக்கவாறு இருக்கும் (இப்போது நிரலாக்கத்தில் இத்தகைய classes, libraries ஏராளமாகப் பயன்படுத்தப்படுகின்றன)
இத்தொடக்கத்திலிருந்து மிகச்சிக்கலான இலக்கண வரைமுறைகளை நிரலாக்கம் செய்யப்போகலாம்.
ஓரளவு முழுமையாக எமது இலக்கணத்தைக் கணிநிரலாக்கம் செய்து விட்டபிறகு, காலத்துக்குக்காலம், பயன்பாட்டுத்தேவை, மொழி வளர்ச்சி போன்றவற்றைக்கருத்திற்கொண்டு இற்றைப்படுத்தியவண்ணமிருக்கலாம்.
ஒரே மொழியில் வெவ்வேறு இலக்கணப்பயன்பாடுகள் தோன்றி சாதாரண மக்களால் ஏற்றுக்கொள்ளப்படும்போது இம்மென்பொருட்தொகுப்பும் பிரிந்து பெருகும்.
குழந்தைகள் தொடக்கம் அனைவருமே இதன்மூலம் மொழியைச்சரியாகப் பயன்படுத்த ஆரம்பிப்பர்.
இலக்கணம் என்பது எப்போதும் தேவையற்ற வரட்டு வரைமுறை அல்ல.
நுணுக்கமாகப் பரிணாமமடைந்த மொழியொன்றின் உயிர்த்துடிப்பே அதுதான்.
இத்தகைய நிரற்றொகுப்பின் விளக்க ஆவணம் (Documentation) மிகச்சிறந்த, காலத்துக்குகந்த தமிழ் இலக்கண நூலாகம் விளங்கும்.
இந்நிரலாக்கத்தினை தனி நபர்களோ பல்கலைக்கழகங்களோ தனித்துச்செய்ய முடியாது, திறந்த நிலையில் கணிமையாளர்கள் எல்லோரும் கட்டற்று பங்களிக்கும் வகையில் மட்டுமே செய்து முடிக்க முடியும்.
இவ்வழிப்பயணம் நாளடைவில் தமிழைச் சிந்தித்துச் சரியாகப்பேசும், எழுதும் மனிதர்களையும் கருவிகளையும் உருவாக்கும்.
இன்று எனது மின்னஞ்சலுக்கு மிகவும் மகிழ்ச்சியளிக்கும் மடல் ஒன்று வந்தது. அம்மடலே நீண்டகாலமாக எழுத நினைத்து ஊறப்போட்ட இக்குறிப்பினை உடனடியாக எழுதவும் உந்தியது.
சுந்தருக்கும் ஈசுவருக்கும் மனங்கனிந்த வாழ்த்துக்கள்.
நானும் என் நண்பன் ஈசுவரும் (படி அனுப்புகிறேன்) இலக்கணப் பகுப்பாய்வு செய்யும் செயலி ஒன்றை உருவாக்க முயன்று வருகிறோம். அடிப்படைக் கட்டமைப்பு முடிந்து விட்டால் மற்ற ஆர்வலர்களையும் அழைக்கவுள்ளோம். இதை எதிர்பார்த்து இருக்குமளவிற்கு நாங்கள் இன்னும் முன்னேறவில்லை. :-) தொல்காப்பியத்தையும் நன்னூலையும் புரட்டிக் கொண்டு வருகிறோம். இந்த நெறிகளை இடம்சாரா இலக்கணமாக எழுத வேண்டியதுள்ளது.
அன்புடன்,
சுந்தர்
முத்தாய்ப்பாய் ஒரு குறிப்பு:
இலக்கணங்கள் சிதைந்து, வளர்ந்து மாற்றம் கண்டு தான் மொழிகள் வளர்கின்றன. இவ்வாறு மாற்றம் காணும் மொழியும்கூட தனது புது வளர்சிக்கட்டத்துக்கான புது இலக்கணத்தை உற்பத்தி செய்துவிட்டிருக்கும். அதாவது தனக்கான புதுச் சமன்பாட்டினை உருவாக்கிவிட்டிருக்கும் :-)
இந்தப்பிரபஞ்சம் கோலங்களாலானது!


7 பிற்சேர்க்கைகள்:
\\கணிதமே நாமறிய இக்கோலங்களின் வரிவடிவம்.\\ஆமோதிக்கிறேன். இதைப்போன்றே நானும் சிந்ததுண்டு.
\\எடுத்துக்காட்டாக வெண்பா ஒன்றின் யாப்பிலக்கணத்தை சரிபார்ப்பதற்கான நிரல்வகுப்பொன்று (Class). வெண்பா எழுதிவிட்டு ஒருவர் இந்நிரல்வகுப்பைப்பயன்படுத்தும் செயலி ஒன்றின் மூலம இலக்கணச்சுத்தத்தைச் சரிபார்த்துக்கொள்ளலாம்.\\
அட இதுபோன்று இருந்தால் என்னைப்போன்று வெண்பா முயல்வோருக்கு மிகவும் பயன்படும்.
இது வரை FF தமிழ்சார் நீட்சிகளை பரிசோதித்ததில்லை. ஆர்வத்தை தூண்டுகிறது. கட்டாயம் பரிசோதித்து கருத்தை சொல்லகிறேன்.
Mayuran,
Are you the one that asked how to develop a Tamil based computer language? If so, I hope you remember that anony posing questions to you. The crux of the article is in line with the design thoughts I have for developing a Tamil language parser.
Reply back.
மயூரன், எல்லா மொழிகளிலும் உள்ள அடிப்படையான இலக்கண ஒழுங்கைப் பற்றிய உங்கள் குறிப்புகள் நன்று. அதிலும் தமிழில் இந்த இலக்கண நெறிகளைக் கூர்ந்தாய்வு செய்து சுருக்கமாக தொல்காப்பியத்தில் தந்துள்ளது கூடுதல் சிறப்பு.
சத்தியா, வெண்பா இலக்கணம் தொடர்பில் நானும் சஞ்சீத்தும் ஈசுவரும் எழுதிய கட்டுரை இங்கே. தமிழில் விளக்கம் இங்கே. செயலியைப்பெற http://sourceforge.net/projects/visaineri/ http://visaineri.cvs.sourceforge.net/visaineri/ என்ற இணைப்புகளை அணுகவும்.
நன்றி சத்தியா.
Anonymous,
//Are you the one that asked how to develop a Tamil based computer language? //
இல்லை. அது மாயா மயூரன். வேறொரு பதிவர்.
சுந்தர்,
//http://visaineri.cvs.sourceforge.net/visaineri/ //
தளத்தைப் பார்த்தேன். ஆணைத்தொடர்களை இயக்கிப்பார்க்கவில்லை இன்னமும்.
சில காலங்களுக்கு முதலே இப்படி ஒரு செயலியை செய்ய முயற்சி செதிருப்பது வியப்பளித்தது.
//தமிழிலோ இலக்கணப்பிழையாய் எழுதுதல் ஒரு பொருட்டே கிடையாது. இலக்கணப்பிழையாய்ப் பேசினால்தான் அது நாகரிகம்.
எனக்கு தமிழ் இலக்கணம் தெரியாது என்று சொல்வது ஒரு பெருமை.
//
உண்மைதான் மயூரன்.
நல்லதொரு ஆக்கத்தை தந்திருக்கிறீர்கள். பல விடயங்களை படிக்கத் தூண்டுகிறது இந்தக் கட்டுரை.
( என்ன இப்போதெல்லாம் மாதத்துக்கு ஒரு பதிவை மாத்திரமே காண முடிகிறது???)
//
( என்ன இப்போதெல்லாம் மாதத்துக்கு ஒரு பதிவை மாத்திரமே காண முடிகிறது???)//
பதிவுலகம் அலுத்துப்போச்சு..
தமிழ்மணம் சலிச்சுப்போச்சு..
ஏறத்தாழ ஒரு மாதகாலத்துக்கும் மேல் தமிழ் மணம் பக்கம் வரவில்லை. போன முறை பதிவு போட்டபோது ரெண்டு தரம் வந்து பார்த்தேன்.
அன்றாட வாசிப்புக்கு வேறேதாவது நல்ல திரட்டி கிடைக்கிறதா பார்க்கலாம்.
இச்சிடயத்தில் நான் மேற்கொண்ட முயற்சிகளின் பலனாய் ஓர் அரிய பொக்கிஷம் பற்றி அறிந்து அதனைப் பெற்றுக்கொள்ளவும் செய்தேன். புதுச்சேரி பண்டித வித்துவான் தி வே கோபாலையரின் பல ஆண்டுகால உழைப்பாக வெளிவந்துள்ள தமிழிலக்கணப்பேரகராதி, தமிழ் மண் பதிப்பகம்,
http://tamilmann.in/gopalaiyer.html
Post a Comment