About thauzhavan

Interested in Lexicography & Open source Tamil projects like Wikimedia-Tamil, Linux/Gnu-Tamil, Translating article in Tamil with screenshots and screeencasts, photography,GIF animations, Language Technology for Tamil,.. Self-employed.

ஒலிக்கோப்புகளை உருவாக்க ஒரு அலைப்பேசி செயலி தேவை

கற்றலின் முதற்படி, ஒரு சொல்லை முதலில் கேட்க வேண்டும். அது எம்மொழியாக இருந்தாலும், இதுவே அடிப்படை. தேமதுர தமிழோசை உலகில் பரவ, முதலில் நாம் ஒரு சொல்லின் ஒலிப்பை , ஒலிக்கோப்புகளாக உருவாக்க வேண்டும். இதுபற்றி பல தமிழ் பேராசிரியர்களிடம் கலந்துரையாடிய போது, அலைப்பேசி செயலி ஒன்று மிக மிக அவசியம் என்பது உறுதியானது. இதனால் விக்கிமீடியாப்பற்றிய விழிப்புணர்வினையும் , விரைந்து வளர்க்கலாம். இது பல இந்திய மொழிகளுக்கும் பயனாகும் திட்டமாகும்.

  • சொல்லொன்றின் ஒலிப்பை (pronunciation), ஒலிக்கோப்புகளாக பதிவேற்ற, ஒரு அலைப்பேசி (mobile phone) செயலி இருப்பின் நன்றாக இருக்கும். கணினி வழி செயலியை சீனிவாசன் ஏற்கனவே உருவாக்கியுள்ளார். அதுபோல அலைப்பேசி செயலி ஒன்றை உருவாக்கினால், இந்திய மொழிகள் அனைத்துக்கும் பயனாகும்.
  • பட்டியலை நாம் உரைக்கோப்பில் உருவாக்கி, அதனை பிறருக்கு அனுப்ப அவர் அப்பட்டியலை அவர்கள் அலைப்பேசிக்குள் அமைத்துக் கொள்ள வேண்டும்.
    அப்பொழுதுதான் ஒரே சொல்லை பலர் உருவாக்குதலைத் தடுக்கலாம்.
  • ஒரு சொல்லைப் பதிவு செய்வதற்கு முன், அதனை உருவாக்குனரே சரிபார்க்க வேண்டும்.
  • சரிபார்த்தபின், அவரே பதிவேற்று என்ற வசதியை அழுத்த வேண்டும்.
    ஏனெனில், இணைய இணைப்பு இல்லாநிலையிலும் அது அவரது அலைப்பேசியில் செயற்பட வேண்டும்.
  • இடாய்ச்சு மொழிக்காரர்கள் இரு இலட்சத்திற்கும் அதிகமான கோப்புகளை பதிவேற்றியுள்ளனர்.
  • தமிழ் மொழியில் சோடாபாட்டிலின் தாயார் ஏறத்தாழ 7000 சொற்களைப்  பதிவேற்றியுள்ளார்.
  •  அமலன் என்பவர் ஏறத்தாழ 1000 சொற்களைப் பதிவேற்றியுள்ளார்.
  • இராமகி ஐயாவின் குரலிலேயே, அவரின் சொற்களைப் பதிவேற்ற எனக்கு எண்ணம் மேலோங்குகிறது
  • இலண்டனில் வசிக்கும் பழனிசாமி (Deva Palanisamy,IOS developer)இதற்குரிய முயற்சியில் உள்ளார். இன்னும் சில மாதங்களில் இச்செயலி, 100க்கும் மேற்பட்ட விக்சனரி திட்டங்களுக்குப் பயன்பட உள்ளது.
Advertisements

Integaration of Indian Wiktionaries (IIW) – Help needed

Indian dictionary DATA with creative commons licence is available on web. A programme needed to extract the data. If it is available, more contributors will clean the data and upload the modified data in the respective wiktionary project. Let me explain in Tamil language.

பின்வரும் இணைப்பில் பல இந்திய அகரமுதலிகள் பொதுப் பயன்பாட்டு உரிமத்தோடு(CC) உள்ளன.
http://dsal.uchicago.edu/dictionaries/
அவற்றில் ஒன்று வங்கமொழிக்கான அகரமுதலி (beta version)
dsalsrv02.uchicago.edu/cgi-bin/philologic/contextualize.pl?p.0.dasa.11293
இந்திய மொழிகளின் விக்சனரித்திட்டத்தை வளர்ச்சியுறச் செய்ய, இதனை ஒரு முன்னோடித்திட்டமாக எடுத்துள்ளேன். நான் நேரில் சந்தித்த 10 மொழியினர் ஆதீத ஆர்வம் காட்டினர். இணைய இணைப்பு ஒழுங்காக இல்லாததாலும், நேரமின்மையாலும் அனைவரிடமும் திட்டத்தை விளக்க இயலவில்லை.
எனினும், வங்கமொழியினர் என் அறையில் இருந்ததால், இரவு செயற்பட்டு பல அடித்தளங்களை அமைத்துள்ளோம். இப்பொழுது தரவு இருந்தால், ஒரு மாதத்தில் இத்திட்டம் வளரும். அதனைக் காட்டி இந்திய விக்சனரியினரை ஒன்றுணைக்க பல்வேறு உதவுகளைக் கோரலாம்.மேற்கண்ட வங்கமொழி தரவினை எடுக்க பின்வரும் நிரலாக்கப்பக்கம் உதவலாம்.
http://runnable.com/UryhiPR1U0BKAAMO/how-do-web-scrapping-with-python-baby-steps-for-tutorial-beginner-scraping-scrapy-beautifulsoup-requests-html-and-wikipedia

மேலும், சில கருவிகளை பின்வரும் தொடுப்பில்  காணலாம்.

http://www.notprovided.eu/7-tools-web-scraping-use-data-journalism-creating-insightful-content/

அப்பொழுது கீழ்கண்ட குறிப்புகளை கவனத்தில் கொள்ளவும். மேற்கூறிய வங்கமொழி அகரமுதலியின் ஒரு சொல்லைப் படமாக கீழே கொடுத்துள்ளேன்.


இதில் தடிமனாக இருப்பது தலைப்புச்சொல். மற்றவை அதன் விளக்கம்.
இந்த தலைப்புச்சொல் ஒரு கட்டத்திலும்(COLUMN-A), மற்றவை அடுத்த கட்டத்திலும் வேண்டும்.

மேற்கூறிய வங்கமொழியின் இணையபக்க நிரலாக்கத்தைப் பார்த்தபோது பின்வரும் தேவையைப் புரிந்து கொண்டேன். இதில் வண்ணமிட்டவை html நிரலாக்கம். இவ்வண்ணம் எதைக் குறிக்கிறது என்றால், நாம் பிரித்தெடுக்க வேண்டிய தரவின் முன்னும், பின்னும் இருக்கும்  html நிரலாக்கம் ஆகும்.Column-1 = <span class=”hi”>অওঘ̆র্ষণ</span></span>
Column-2 = </span></span> [প্রাদে◦] বি, সঙ্গীতের স্বরের ঐক্য <eng>
Column-3 = <eng>harmony</eng>.</p>

இதுபற்றி வேறு எண்ண விவரங்கள் குறிப்பிட்டு வலைப்பூ எழுத வேண்டும்?

வங்கமொழியினருக்கு கூகுள் ஆவண தானியக்க பதிவேற்றப் பயிற்சி அளி்த்துள்ளேன். அதன் தொடக்கக் குறிப்பை இங்கு காணலாம்.
https://ta.wiktionary.org/s/4ojr
ஆவலுடன்..
வணக்கம்.

 

விக்சனரிப் பங்களிப்புகள்

கி.பி. 2013 வருடம்

செப்டம்பர் மாத பதிவுகள்;-

  • 11.09.13 :தாவரவியலில் 5சொற்களுக்கு, படங்கள் மூலம் விளக்கம் தரப்பட்டது.
  • 10.09.13 : மேற்கோளிடலில் உள்ள நிரல்களை, எளிமையாக்கிடல் குறித்த தேடல்.
  • 9.09.13 : ஐக்கியநாடுகளின் (UN)அமைப்பில்  அதிகமாகப் பயன்படும்1052 அஃகுப்பெயர்களை (Acronyms) விரிவாக்கம் செய்து, அவற்றைத்  தமிழ்விக்சனரியின், ஒரு புதிய பகுப்பின் கீழ் பதிவேற்றினேன். விரிவாக்கியச் சொற்களின் முதலெழுத்து ஆங்கிலமேலெழுத்தாகவும் (upper case) , தடிமனாகவும் (bold) அமையவேண்டும். அதற்கு AWB நுட்பம் தான் எளிமையான தீர்வை தந்தது. ஒரு சொல்லுக்கு ஒன்றுக்கும் மேற்பட்ட விரிவாக்கம் வரும் போது, # போடுவதில் சிக்கல் வந்தது. அதனை அமைக்கவல்ல நிரல்நுட்பம் இல்லாததால், நேரிடியாக ஒவ்வொன்றாக கவனித்து, #சீராக்கத்தை செய்து முடித்தேன்.                                                                                 தமிழ்விக்சனரியின் மொத்த சொற்களின் எண்ணிக்கை =2,83,334
  • 8.09.13 : தமிழகத்தில் அதிகமாகப் பயன்படும்175 தமிழ் சொற்சுருக்கங்களை, விரிவாக்கம் செய்து, அவற்றைத்  தமிழ்விக்சனரியில் பதிவேற்றினேன்.                           தமிழ்விக்சனரியின் மொத்த சொற்களின் எண்ணிக்கை = 2,82,282
  • 7.09.13 : சென்னைப்பேரகரமுதலியின் 100 தமிழ் சொற்சுருக்கங்களுக்கு, விரிவாக்கம் செய்து, அவற்றைத்  தமிழ்விக்சனரியில் பதிவேற்றினேன்.                           தமிழ் விக்சனரியிலிருந்த, மொத்த சொற்களின் எண்ணிக்கை =  2,82,105
  • 6.09.13 : சென்னைப்பேரகரமுதலியின் 315 தமிழ் சொற்சுருக்கங்களுக்கு, விரிவாக்கம் செய்து தமிழ்விக்சனரியில் பதிவேற்றினேன்.(இன்று தமிழ் விக்சனரியிலுள்ள மொத்த சொற்களின் எண்ணிக்கை = 2,82,005
  • 5.09.13 : சென்னைப்பேரகரமுதலியில்  (Tamil Lexicon 1924-1936. காப்புரிமை அற்றது. இந்திய பதிப்புரிமை 60 வருடங்களேஆகும்.) பயன்படுத்தப்பட்டுள்ள, ஏறத்தாழ1000 சொற்குறிப்புகள் பட்டியலிடப்பட்டு, இங்கு பகுப்பிடப்பட்டன.
  • 4.09.13 : இன்று ஆங்கில விக்சனரியின் பகுப்புகளோடு (1.English_initialisms, 2.English_abbreviations,  3. English_acronyms) தமிழ் விக்சனரியின் பகுப்புகள் இணைக்கப்பட்டு சரிபார்க்கப்பட்டன. விக்கியிடைத் தானியங்கிகள் செயல்பட இவ்விணைப்பு முக்கியம். விக்கித்தரவுத் தளத்துடன் (Wikidata) இவைகள் இணைக்கப்பட்டு மேம்படுத்தப்பட வேண்டும். அப்பொழுதே விக்சனரியின் ஏறத்தாழ180மொழிகளோடு, இவைகள் என்றும் இணைக்கப்பட்டிருக்கும்.
  • 3.09.13 : நேற்றிரவு சரியாக உறங்காததால், காலை பணப்பணி செய்யவில்லை. ஆனால், நீண்டநாட்களாக சென்னை அகரமுதலியில் எடுத்தாளப்பட்டுள்ள மேற்கோள் நூல்களையும், அதன் ஆசிரியர் பெயர்களையும் பட்டியலிட்டேன். இப்பட்டியலில் சென்னைப்பேரகரமுதலியில் மேற்கோளிடப் பயன்பட்ட நூல்கள் (36 ஆங்கிலநூல்களும், 326 தமிழ் நூல்களும்) அடங்குகின்றன.
  • 2.09.13 : இன்று இரவு அடைமழை காற்றுடன் 21/2மணிநேரத்திற்கும் மேல் பெய்தது. இரவு முழுவதும் மின்தடை. வரும் வார  நீர் தட்டுபாட்டை சமாளிக்க சுறுசுறுப்புடன், வீட்டினுள் இருந்து  நீர் பிடிக்க ! , இயங்கினோம்.
  • 1.09.13 : தமிழ் விக்சனரியில்  7 தமிழ்ச் சொற்களையே பதிவேற்றம்  செய்தேன்.                    (இன்று தமிழ் விக்சனரியிலுள்ள மொத்த சொற்களின் எண்ணிக்கை = 2,81,686 )

தொழில்நுட்பத் தேவை: மூன்று மணி நேரங்கள் செலவு செய்து உருவாக்கிய ~190 சொற்களில், 7தவிர  மற்ற சொற்கள்,  ஏற்கனவே பலரால் பதிவேற்றப்பட்டிருந்தன. எனவே, சிவப்புச்சொற்களை மட்டும் பிரித்தெடுக்க கற்க வேண்டும். அதற்கு Vlookup முறை, spreadsheet இல் இருக்கிறது.ஆனால், அது விரும்பிய பலனைத் தரவில்லை. அந்நுட்பம் குறையுடையதாகவே இருக்கிறது.

அதனால் தான், கோவையில் நடைபெற்றசெம்மொழி மாநாட்டில் (2009) தமிழக அரசு  கொடுத்த 1,28,000 சொற்ளில், 52,000 மட்டுமே விக்சனரியில் பதிவேற்றினேன். மீதமுள்ள 76,000 சொற்கள் ஏற்கனவே விக்சனரியில் பதிவேற்றம் செய்து இருந்தனர். இதனை சரிபார்க்க ஏறத்தாழ 55மணிநேரங்கள் தேவைப்பட்டன.

இவ்வாறு பலமணிநேரங்கள்,  இனி வீணாகாமல் இருக்க எளிமையான, வன்மையான தொழில்நுட்பம் தேவை. அத்தொழில்நுட்பம் சிவப்புச்சொற்களை மட்டும், அதன் விவரங்களோடு, (விக்சனரியில் சொல் உருவாக்கம்) பிரித்தெடுத்துத் தரவேண்டும். அதுஎன்ன?

ஆகத்து மாதத்தில் பதிவேற்றியச் சொற்கள்;-

  • 31.08.13 : தமிழ் விக்சனரியில்  160 தமிழ்ச் சொற்களை பதிவேற்றம் செய்தேன். (இன்று தமிழ் விக்சனரியிலுள்ள மொத்த சொற்களின் எண்ணிக்கை = 2,81,679)
  • 30.08.13 : தமிழ் விக்சனரியில்  100 தமிழ்ச் சொற்களை பதிவேற்றம் செய்தேன். (இன்று தமிழ் விக்சனரியிலுள்ள மொத்த சொற்களின் எண்ணிக்கை = 2,81,513)
  • 29.08.13 : தமிழ் விக்சனரியில்  100 தமிழ்ச் சொற்களை பதிவேற்றம் செய்தேன். (இன்று தமிழ் விக்சனரியிலுள்ள மொத்த சொற்களின் எண்ணிக்கை = 2,81,415)
  • 28.08.13 : தமிழ் விக்சனரியில்  100 தமிழ்ச் சொற்களை பதிவேற்றம் செய்தேன். (இன்று தமிழ் விக்சனரியிலுள்ள மொத்த சொற்களின் எண்ணிக்கை = 2,81,301)

விக்சனரியில் சொல் உருவாக்கம்

விக்சனரியில்சொல் ஒன்று இருக்கிறதா? இல்லையா? என அறிய, பலவழிகள் இருக்கின்றன. அவற்றில் எளிமையானது, ஒவ்வொரு தலைப்புச்சொல்லுக்கும், சதுர அடைப்புக்குறிகளை[[தலைப்புச்சொல்]]இட்டு, அவ்விக்சனரி தளத்தின் தொகுத்தல் சாளரத்தில், அத்தலைப்புச்சொற்களை முன்தோற்றம் காண வேண்டும். அவ்வாறு அவ்விக்சனரியில் கண்டால், அத்தலைப்புச்சொற்கள் பின்வருமாறு புலப்படும்.

ubuntu-wiktionary-Tamil-blue-red-words-create

இதில் சிவப்பாக இருப்பவற்றை உருவாக்க வேண்டும். நீலநிறமாக இருப்பவைகள் ஏற்கனவே அவ்விக்சனரியில் உருவாக்கப்பட்டவை ஆகும். இவ்வாறு மிகச்சரியாக அடையாளம் காண,  பின்வரும் வழிமுறைகளை, கவனமாகப் பின்பற்ற வேண்டும். இல்லையெனில், உருவாக்கப்பட வேண்டிய சொற்கள் தவறாக அமைந்து, அனைத்து முயற்சிகளும் தவறாகிவிடும். சுருக்கமாகச் சொன்னால், ஒரு தலைப்புச்சொல்லானது ஒருமொழியின் எழுத்துக்களை மட்டுமே பெற்றிருக்க வேண்டும். எண்களோ, பிற குறியீடுகளோ பெற்றிருக்கக் கூடாது.

அ) தலைப்புச்சொற்களில் களைகளை நீக்கும் கலை.

  • அகப்படு – தல்  என்பதை,  அகப்படுதல் என களைய வேண்டும்.
  • அகம் 1 என்பதில்,  அகம் என எண்களை நீக்க வேண்டும்.
  • அந்தரத்தில்நில்[ற்] – த[ற]ல்  –> அந்தரத்தில்நில்தல்அல்லதுஅந்தரத்தில்நிற்றல்

இதனை நிகழ்படமாக, அடுத்துக் காணலாம்.(நிகழ்படங்களை அதிக செரிவில் வைத்துக் காணவும்.)

பின்பு, கீழ்கண்ட நிகழ்படம் போல, அடைப்புக்குறிகளை இட்டு, அவ்விக்சனரியின் தொகுத்தல் சாளரத்தில் தேட வேண்டும்.

அப்பொழுதே மிகச்சரியான உருவாக்கப்பட வேண்டிய தலைப்புச்சொற்கள் (சிவப்புச்சொற்கள்)  கிடைக்கும்.

           

விக்சனரியின் பதிவேடு

 wiki dictionary என்ற சொல்லிருந்து wiktionary (விக்சனரி) என்ற சொல் உருவாகிறது. இதில் தொடர்ந்து பங்களிப்பவர்களின் எண்ணிக்கை நான்கு அல்லது ஐந்து நபர்களே ஆவர். கடந்த மூன்று ஆண்டுகளாக ஒவ்வொரு நாளும் பங்களிப்பவர் என்று எடுத்துக் கொண்டால் இருவரே.

  • ஒருவர் பழ.கந்தசாமி என்ற கொங்குமண்டல, அமெரிக்கவாழ்,  கணினியியலாளர்.
  • மற்றவர் சேலத்தைச் சார்ந்த தகவலுழவன். இவரது தொழில் குடிசைத்தொழில் ஆகும். இருப்பினும், விக்கி நண்பர்களின் (இரவி, சுந்தர், பழ.கந்தசாமி, நற்கீரன், சோடாபாட்டில்,நூலகம் கோபி, மாகிர், பிச்சைமுத்து, நீச்சல்காரன், தினேசுகுமார்பொன்னுசாமி, இல.சுந்தரம், செல்வா, சிறீனிவாசன், இன்னும் சிலர்)
  • தொடர் ஊக்குவிப்பாலும், உதவியாலும் கணினியியல் நுட்பங்களையும், விக்கி நுட்பங்களையும் படிப்படியாகக் கற்று பங்களிக்கிறார். தகவலுழவனான எனது இணையப்பதிவுகளை இனி தேதியிட்டு பதிவிடவிரும்புகிறேன். இதற்கு முன் செய்யதவற்றை, என்னைப்பற்றி… என்பதில் காணலாம்.
  • 13:10, 18 அக்டோபர் 2007 தேதியில் நான், தகவலுழவன், என்ற பெயரில் விக்சனரியில் பதிவு செய்து, எனது பங்களிப்புகளைச் செய்யத் தொடங்கினேன்.
  • நான் செய்த விக்கித்திட்டப்பங்களிப்புகளை கீழ்கண்ட தொடுப்பில் அறியலாம்.

http://en.wikipedia.org/w/index.php?title=Special%3ACentralAuth&target=%E0%AE%A4%E0%AE%95%E0%AE%B5%E0%AE%B2%E0%AF%81%E0%AE%B4%E0%AE%B5%E0%AE%A9%E0%AF%8D

2011 ஆம் ஆண்டு, இந்திய விக்கிமீடியாவினரால் குறிப்பிடப்பட்டவருள் நானும் ஒருவன்.

http://wiki.wikimedia.in/File:NWR_2011_and_Jury_mention_V1.0.pdf (18பக்கம் பார்க்கவும்)

மேலும், என்னைப்பற்றி அறிய http://ta.wiktionary.org/s/49q விக்சனரிப் பக்கத்தை காணவும்.

  • 25 ஆகத்து 2013 தேதியில், விக்சனரியில் மட்டும் 97,966பதிவுகளைச் செய்துள்ளேன். ஏறத்தாழ ஒரு தொகுப்புக்கு,  ஒருநிமிடம் செலவிட்டுள்ளேன்.

தமிழ்விக்சனரியில் கிடைத்த எனது அனுபவங்களையும், எண்ணங்களையும் பகிர்ந்து கொள்ளவும், மேம்படுத்தவும் இதனைத் தொடங்குகிறேன்.

 

 

 

என்னைப் பற்றி..

இணையத்தமிழில் இதுவரை என் முயற்சிகள்

ஈடுபாட்டிற்கான காரணிகள்: தமிழர் உலகின் பல நாடுகளில் வசிக்கின்றனர். அவர்கள் நமது முன்னோர்களின் வளங்களைப் பெறுவதற்கும், அவர்கள் வாழும் நாடுகளின் கலைச்செல்வங்களை, இங்கு கொணர்ந்து வருவதற்கும், எளிமையான சிறப்பான வழி, இணையத் தமிழே ஆகும். உலகில் முன்னேற்றம் கண்டுள்ள பல மொழிகள் கையாளும் வழிமுறை, இணையவழி மொழியாக்கமே ஆகும். அதனைத் தமிழராகப் பிறந்த ஒவ்வொருவரும் அறிதல் வேண்டும். ஆர்வமுடன் இயற்றி, ஈடுபட வேண்டும். உலகெங்கும் வாழும் தமிழர்கள் இதில் ஊக்கத்தோடு ஈடுபடுகின்றனர். தமிழன் என்பதாலும், இணையத்தமிழ்ப் பற்றாலும் தகவலுழவன் என்ற புனைப்பெயரில், இதுவரை நான் செய்த பங்களிப்புகளைக் கீழே சுருக்கிக் கொடுத்துள்ளேன்.

இணையத்தமிழும், பிற மொழிகளும்: இணையத்தில் தமிழ் பல்வேறு வடிவங்களில் இருப்பினும், என்னைக் கவர்ந்தது தமிழ் விக்கித்திட்டங்கள் ஆகும். ஏனெனில், உடனுக்குடன் நாம் மேற்கொண்ட உருவாக்கத்தில், பிறமொழியினர் என்ன செய்துள்ளார்கள் என ஒப்பிட்டுப் பார்த்து, நம் அன்னைத் தமிழை வளர்ச்சியுறச் செய்யவல்ல இணைய நிரல் மொழிக் கட்டகங்களை உடையது ஆகும். ஒப்பீடுகள் மட்டுமே இணையத் தமிழை உயர்த்தும். ஒப்பீடுகள் இல்லையெனில், நம் இனத்தவரின் புகழ்மாலையாகவே இருக்கும்.

தமிழ்விக்சனரி(இணையத்தமிழ்பன்மொழிஅகரமுதலிதிட்டம்): 18 அக்டோபர்2007முதல்இன்றுவரைஒவ்வொருநாளும், தமிழ்விக்சனரியில்பங்களிக்கிறேன். இதுவரைஏறத்தாழ70,000தொகுத்தல்களைச்செய்துள்ளேன். ஏறத்தாழஒருதொகுத்தலுக்கு, ஒருநிமிடம்ஆகும். இன்றளவில்புதுச்சொற்களைஉருவாக்குவதிலும், பிறமேலாண்மைசெயற்பாடுகளிலும்நான்முன்னணியில்இருக்கிறேன். இவையல்லாமல்தானியங்கிகள்மூலம், 4இலட்சம்பராமரிப்புத்தொகுத்தல்களைச்செய்துள்ளேன்.

http://toolserver.org/~quentinv57/sulinfo/%E0%AE%A4%E0%AE%95%E0%AE%B5%E0%AE%B2%E0%AF%81%E0%AE%B4%E0%AE%B5%E0%AE%A9%E0%AF%8D

இத்தொகுத்தல்களால் ஏற்பட்ட நிகழ்வுகள் வருமாறு;-

  1. ஏறத்தாழ2,70,000சொற்கள்தமிழ்விக்சனரியில்உள்ளன. அதனால்180மொழிகளில்12ஆவதுஇடத்தில்தமிழ்விக்சனரிஉள்ளது. ஒவ்வொருநாளும்ஏறத்தாழ3000நபர்கள்இணையத்தில்இதனைப்பார்வையிடுகின்றனர். கூகுள்மொழிபெயர்ப்புக்கருவியும்அதிகஅளவுஇதன்தரவுகளைப்பயன்படுத்துகின்றன. இன்னும்பிறதிறவூற்றுத்தளத்திலும்பயன்படுத்துகின்றனர். ஒருசொல்லுக்கானவிளக்கம்எழுத்துவடிவில்மட்டும்அல்லாது, தகுந்தஊடகங்களோடுஉருவாக்கப்பட்டுவருகின்றன. அவற்றில்பெரும்பாலானஊடகஇணைப்புகள்என்னால்அமைக்கப்பட்டவைஆகும்.

  2. தமிழ் விக்சனரி முதற்பக்கத்தில் தினம் ஒரு சொல் என்ற திட்டத்தின்படி, ஒவ்வொரு நாளும் ஒவ்வொரு சொல் தானியக்கமாகத் தெரியும் வகை செய்தவருள், முக்கியப் பங்களிப்பாளனாக அறிவிக்கப்பட்டேன்.

  3. உலத்தமிழ்ச்சொம்மொழிமாநாடுகோவையில்நடந்தபோது, நம்தமிழகஅரசுநன்கொடையாக1,40,000சொற்கள்தமிழ்விக்சனரிக்குஅளித்தது. அங்ஙனம்அளிக்கப்பட்டசொற்களைச்சரிபார்த்துஇல்லாதசொற்களைமட்டும்பதிவேற்றும்பொறுப்புஎனக்குஅளிக்கப்பட்டது. அதனைச்செம்மையாகத்தானியங்கிகொண்டுநிறைவுசெய்தேன்.http://ta.wiktionary.org/s/14rl

  1. கனடநண்பர்களின்சொற்தரவுக்கொடை: கனடநாட்டில்வாழும்தமிழர்கள்அவர்கள்தொகுத்தசொற்களைக்கொடையாகஅளித்தனர். அவற்றினையும்சரிபார்த்து, பதிவேற்றும்பொறுப்புஎனக்குகொடுக்கப்பட்டது. http://ta.wiktionary.org/s/a9w

  2. ஜெர்மன் நண்பர்களின் கொடை: ஜெர்மன் நாட்டில் வாழும் தமிழர், தமிழ்செருமானி அகரமுதலியை உருவாக்கி, வளர்த்து வருகின்றனர். அவற்றின் தரவுகளும் விரைவில் பதிவேற உள்ளன.

  3. இந்தியமொழிகளும்தமிழும்: இந்தோவோர்டுநெட்(Indoword net) தரவுகள்பதிவேற்றம்நடைபெறத்திட்டம்வகுக்கப்பட்டுள்ளது. அதில்5மொழிகளின்ஒலிப்புக்கோப்புகளைஉருவாக்கும்பொறுப்பைநான்ஏற்றுள்ளேன்.

  4. அடிப்படைச்சீனம்தமிழ் அகரமுதலிஒலிப்புக்கோப்புகளும், எழுதும் முறையைப் புலப்படுத்தும் அசைப்படங்களும், தமிழ் விளக்கமும் உள்ளடக்கியது.

தமிழ்விக்கிப்பீடியா:இதுபிறமொழிக்கட்டுரைகளைத்தமிழுக்குமாற்றும்திட்டமாகும். இதில்12அக்டோபர்2007முதல்இன்றுவரைமாதம்4-5முறைகட்டுரைகளுக்காகப்பங்களிக்கிறேன். இதுவரைஏறத்தாழ4,745தொகுத்தல்களைச்செய்துள்ளேன். ஏறத்தாழஒவ்வொருதொகுத்தலுக்கும்10நிமிடங்கள்ஆகும்.

முதல் இந்திய விக்கி மாநாடு: மும்பையில் மூன்று நாட்கள் நடைபெற்ற, முதல் இந்திய விக்கியர் மாநாட்டில், சிறப்பு நிலைப்பெற்ற விக்கிப் பங்களிப்பாளனாகக் கலந்துகொண்டுள்ளேன். அங்கு இந்தியாவின் குறிப்பிடத் தகுந்த விக்கிப் பங்களிப்பான்(NWR) என்ற பெயரைப் பெற்றுள்ளேன். http://wiki.wikimedia.in/File:NWR_2011_and_Jury_mention_V1.0.pdf (காண்க: பக்கம்-18)

பொதுவகமும், தமிழ் ஊடகப் போட்டியும்:

விக்கி ஊடகப்(Commons) பொதுவகம்: இதில் கட்டுரைகளுக்கும், அகரமுதலிகளுக்கும் தேவையான ஊடகங்களைப் பதிவேற்ற வேண்டும். இதனால் உலகின் பிறமொழியினரும் தமிழர் பற்றிய ஊடகங்களை எளிதாகக் காண வகைசெய்யப்படுகிறது. அங்கு காமனிசிட்(commonist) என்ற தானியங்கி பதிவேற்றியையும், விக்கித் தானூலாவி(AWB) என்ற பராமரிப்புக் கருவியையும், கோப்பின் பெயரை மாற்றவும் அணுக்கம்(privilege) பெற்றுள்ளேன்.

இதில்16 செப்டம்பர்2008முதல், இன்றுவரைமாதம்10முறைஊடகங்ளுக்காகப்பங்களிக்கிறேன். இதுவரைஏறத்தாழ9,596தொகுத்தல்களைச்செய்துள்ளேன். ஒவ்வொருதொகுத்தலுக்கும்ஏறத்தாழ15நிமிடங்கள்ஆகும்.

http://commons.wikimedia.org/wiki/User:%E0%AE%A4%E0%AE%95%E0%AE%B5%E0%AE%B2%E0%AF%81%E0%AE%B4%E0%AE%B5%E0%AE%A9%E0%AF%8D

இங்குத்தமிழ்ஊடகங்கள்குறைவாகஇருந்ததால், இன்னும்சிலபங்களிப்பாளர்களைக்கொண்டுதமிழ்ஊடகப்போட்டிநடத்தப்பட்டு, ரூ. 50,000வரைபரிசில்கள்வெற்றிபெற்றபோட்டியாளர்களுக்குஅளிக்கப்பட்டன. இதனால்15,091ஊடகங்கள்கிடைத்தன. அவற்றைவிதிப்படிமேலாண்மைசெய்யவும், பராமரிப்புசெய்யவும்பொறுப்பளிக்கப்பட்டஅறுவரில்நானும்ஒருவன். அவற்றில்இருந்துபின்னர், திட்டவிதிகளின்படிபோட்டிமுடிவுகள்அறிவிக்கப்பட்டன. கீழ்கண்டஇணைப்பின்மூலம்அவற்றைஅறியலாம்.

http://ta.wikipedia.org/s/2hs

http://commons.wikimedia.org/wiki/Category:TamilWiki_Media_Contest

கீழ்காணும் இணைப்பில் பல்வேறு நாட்டினரும், மொழியினரும் தமிழ் எழுத்துகளைக் கற்றுக் கொள்ள, நான் உருவாக்கிய 37 அசைப்படங்களைக் காணலாம். இணையத்தில் தமிழ் எழுத்துகளைக் கொண்டு, பிற இந்தியமொழிகளைக் கற்கவும் முடியும். இத்திட்டம் வளர்ந்துவருகிறது.

http://commons.wikimedia.org/wiki/Tamil_alphabet_gallery

http://commons.wikimedia.org/wiki/Category:Animated_GIF_of_Tamil_to_Hindi_alphabet

கீழ்காணும் இணைப்பின் வழியே நான் பல்வேறு சூழல்களுக்கு ஏற்ப பதிவேற்றிய நிழற்படங்களையும், நிகழ்படங்களையும், ஒலிப்புக் கோப்புகளையும் காணலாம்.

http://commons.wikimedia.org/wiki/Special:ListFiles/%E0%AE%A4%E0%AE%95%E0%AE%B5%E0%AE%B2%E0%AF%81%E0%AE%B4%E0%AE%B5%E0%AE%A9%E0%AF%8D

விக்கிமூலம்: இதில்காப்புரிமைஇல்லாதநாட்டுடைமையாக்கப்பட்டபடைப்புகள்பதிவேற்றம்செய்யப்படுகிறது. முதல்இன்றுவரைபங்களித்துவருகிறேன். ஒருபங்களிப்பைச்செய்ய20-25 நிமிடங்கள்ஆகும். 21 அக்டோபர்2008முதல்இதில்பங்களிக்கிறேன். இசைத்தமிழ்பற்றியமூலங்களைஇங்குப்பதிவுசெய்கிறேன். இதுவரை130பங்களிப்புகளைச்செய்துள்ளேன்.

இணையநூலகம்: இத்தளத்தில்22 பிப்ரவரி2010 முதல்இன்றுவரைபங்களிக்கிறேன். 3-4மாதங்களுக்குசிலமுறைபங்களிக்கிறேன். இதுவரை1,051பதிவுகளைச்செய்துள்ளேன்.

இணையத்தில்இருக்கும்தமிழ்மின்னூல்களைபெருமளவில்சேகரித்துவைத்துள்ளநூலகம்இணையத்திலும்பங்களிக்கிறேன். இதுவரை500க்கும்மேற்பட்டநூல்களைஇணையத்தில்இலவசமாகவும், எளிமையாகவும்படிக்கத்தேவையானகட்டமைப்புகளை, அத்தளத்தில்செய்துள்ளேன். இதில்50க்கும்மேற்பட்டநூல்கள்என்னால்மின்வருடல்செய்யப்பட்டு, துப்புரவுசெய்யப்பட்டு, மின்னூலாகமாற்றப்பட்டது. மேலும், அங்குள்ளஅயலகம்பகுதியில்80% நூல்களுக்கானஇணையத்தொடுப்புஉருவாக்கம்என்னால்செய்யப்பட்டவையாகும்.

http://www.noolaham.org/wiki/index.php?title=%E0%AE%9A%E0%AE%BF%E0%AE%B1%E0%AE%AA%E0%AF%8D%E0%AE%AA%E0%AF%81:Contributions/%E0%AE%A4%E0%AE%95%E0%AE%B5%E0%AE%B2%E0%AF%81%E0%AE%B4%E0%AE%B5%E0%AE%A9%E0%AF%8D&offset=&limit=500&target=%E0%AE%A4%E0%AE%95%E0%AE%B5%E0%AE%B2%E0%AF%81%E0%AE%B4%E0%AE%B5%E0%AE%A9%E0%AF%8D

வளர்ந்து வரும் இணையப் பணிகள்:-

  • கூகுள் அரட்டை அரங்கிலிருந்தபடியே, ஓரிரு சொற்கள் மூலம், அகரமுதலியைக் காணும் நிரல்கட்டகம் அமைக்கப்பட்டுள்ளது.

  • தமிழ் இலக்கியங்களுள் ஒரு சொல்லை எளிமையாகத் தேடவும், அவை உள்ள வரிகள் அனைத்தையும் எடுத்துத்தரவும் வல்ல, மென்மம் உருவாக்கப்பட்டுள்ளது. இவையனைத்தும் திறவூற்று மென்மத்தில் அமைக்கப்படவும், எத்தகைய இயக்குதளத்தில் இயங்கவும் ஆலோசனை நடைபெறுகிறது.

  • திறவூற்று மென்மங்களின் இடைமுகப்பைத் தமிழாக்கம் செய்வதிலும் ஈடுபாடு கொண்டிருக்கிறேன். இரண்டு ஆண்டுகளுக்கு முன், லிப்ரே ஆபிசின் மொழிமாற்றத்தில் பங்கு கொண்டவருள் நானும் ஒருவன்.

  • 11-ஆவது உலகத்தமிழ் இணையமாநாட்டின், மக்கள் அரங்கு பொறுப்பாளர்களுள் ஒருவன்.

http://ti2012.infitt.org/ (காண்க:கீழிருந்து ஆறாவது வரி)