| भारतीय भाषाओं के लिए प्रौद्योगिकी विकास |
| |
| मानव के बीच आपस में कई तरीकों से संपर्क होता है,
जिनमें दृश्य तथा श्रवण पद्धति प्राथमिक पद्धति हैं। इस समय, मानव-मशीन संपर्क का
प्रधान माध्यम मानव की सुविधा की बजाय मशीन की सुविधा पर अधिक निर्भर है। माउस तथा
कुंजीपटल प्रमुख इनपुट युक्तियाँ हैं तथा विजुअल प्रदर्श यूनिट मुख्य आउटपुट युक्ति
है। ऐसे इंटरफेस का प्रयोग करने के लिए विशेष कौशल तथा मानसिक अभिवृत्ति की
आवश्यकता होती है, जिससे कई लोग संपन्न नहीं होते हैं। आपसी संपर्क के इस
मशीन-केन्द्रित मोड को मानव-केन्द्रित इंटरफेस में बदलना जरूरी है जिससे कंप्यूटरों
की शक्ति के लाभ सभी को मिल सकें। हालाँकि सूचना अपने सामने देखने से जो सूचना
प्राप्त होती है वह अधिक प्रभावी होती है, तथापि सूचना प्रेषित करने के लिए वाणी
सबसे आसान साधन है। कंप्यूटर तथा दूरसंचार प्रणालियों के समाहार के कारण शाब्दिक
संव्यवहार आज ज्यादा शक्तिशाली हो गया है, जिनकी सहायता से लोग किसी दूर स्थान पर
स्थित कंप्यूटरों से सूचना प्राप्त कर सकते हैं ।
शाब्दिक संव्यवहार में प्रकृत भाषा शामिल है, और इसके कारण सूचना प्रौद्योगिकी के
क्षेत्र में भाषा- विज्ञान का महत्व बढ़ गया है। इसलिए, कंप्यूटर पर मानव-केन्द्रित
इंटरफेस आज की आवश्यकता है। मनुष्य को एक अनूठी विशेषता से संपन्न किया गया है -
भाषा - जिसकी सहायता से वह सूचना, चिंतन तथा विचारों का आपस में आदान-प्रदान बिना
किसी परिश्रम के कर लेता है। प्रकृत भाषा के प्रयोग से मानव मशीन संपर्क में मानव
भाषा प्रौद्योगिकी के कई पहलू शामिल हैं : वाणी समन्पीडन, पहचान एवं वाणी तथा लिपि
की समझ, मशीनी अनुवाद, पाठ सृजन, वाणी तथा घसीट कर लिखी जाने वाली लिपि का
संश्लेषण। मशीन के साथ सम्पर्क स्थापित करने के लिए भाषा के दोनों रूप, बोली जाने
वाली तथा लिखी जाने वाली, उपयोगी हैं।
|
 |
कंप्यूटर पर भारतीय भाषाओं पर कार्य करने की सुविधा
पिछले दो दशकों के उपलब्ध कराई जा रही है, जिनमें विभिन्न प्लेटफार्मों तथा प्रचालन
प्रणालियों पर डेटा संसाधन, शब्द संसाधन, डेस्क टॉप प्रकाशन आदि सहित विभिन्न
प्रकार के कार्य शामिल हैं।
सूचना प्रौद्योगिकी विभाग ने किसी प्रकार के भाषायी अवरोध के बिना मानव-मशीन संपर्क
की सुविधा प्रदान करने के प्रयोजन से सूचना संसाधन साधनों का विकास करने; बहुभाषी
ज्ञान स्रोतों का निर्माण एवं अभिगम करने; तथा अभिनव प्रयोक्ता उत्पादों एवं सेवाओं
के विकास के लिए उनका एकीकरण करने के उद्देश्य से टीडीआईएल (भारतीय भाषाओं के लिए
प्रौद्योगिकी विकास) कार्यक्रम आरंभ किया। कार्पोरा तथा शब्दकोश जैसे भाषा-विज्ञान
संसाधनों के विकास; तथा फोंट, पाठ संपादक, वर्तनी परीक्षक, ओसीआर और पाठ-से-वाणी
जैसे मूलभूत सूचना संसाधन साधनों के विकास के लिए परियोजनाओं को धनराशि उपलब्ध कराई
गई। मानक भी तैयार किए गए हैं।
भारतीय भाषा प्रौद्योगिकी के उत्पादों तथा सेवाओं का विकास करने के लिए देश के
विभिन्न स्थानों पर निजी, सार्वजनिक एवं सरकारी स्तर पर विविध प्रयास किए गए हैं।
स्रोत केन्द्रों तथा कॉयलनेट केन्द्रों द्वारा विकसित भाषा प्रौद्योगिकियों तथा
साधनों को तेज़ी से प्रयोग में लाना आवश्यक है जिससे उनकी उपयोगिता के बारे मे
प्रतिक्रिया मिल सके और उन्हें उत्पादन के लिए उपलब्ध कराया जा सके। अनुसंधान एवं
विकास का प्रभाव पूरे समाज पर पडना चाहिए। इसका तात्पर्य यह है कि अनुसंधान के
प्रयासों को प्रयोगशालाओं तक सीमित न रखकर इनका नियोजन तेज़ी से किया जाना चाहिए,
जिनपर अंतत: प्रयोक्ताओं की प्रतिपुष्टि तथा उनके अनुभव की जानकारी प्राप्त हो
सकेगी तथा उनमें अधिक परिशोधन किया जा सकेगा ।
सरकार ने अगले एक वर्ष में निम्नलिखित उत्पाद तथा समाधान सार्वजनिक डोमेन में
उपलब्ध कराने की पूरी तैयारी कर ली है : |
 |
| |
सभी भारतीय भाषाओं में नि:शुल्क फोंट (टीटीएफ तथा ओटीएफ) एवं शब्द संसाधक। पहले कदम
के रूप में, सार्वजनिक डोमेन में नि:शुल्क रूप से उपलब्ध कराने के उद्देश्य से
शास्त्रीय भाषा तमिल के लिए लोकप्रिय ट्रू टाइप फोंटों (टीटीएफ) का चयन प्रकाशन
उद्योग के साथ विचार-विमर्श करके किया गया है। विण्डोज़ 95/विण्डोज़ 98/विण्डोज़
एनटी प्लेटफार्म वाली प्रणालियों पर टीटीएफ फोंटों का प्रयोग व्यापक रूप से हो रहा
है। विण्डोज़ 2000/एक्सपी/2003 तथा लिनक्स प्लेटफार्मों के ओटीएफ (ओपन टाइ फोंट)
जारी किए जा रहे हैं। यह अपनी तरह का पहला प्रयास है और शब्द संसाधक (वर्तमान एवं
नए) इन फोंटों का प्रयोग कर सकेंगे। इसके परिणामस्वरूप, प्रयोक्ताओं को डेटा
प्रविष्टि के लिए इंसक्रिप्ट, फोनेटिक तथा टाइपराइटर कुंजीपटल वाले और अधिक फोंट
उपलब्ध होंगे। |
| |
|
| |
सूचना निष्कर्षण, पुन:प्राप्ति एवं अंकीयकरण के लिए सभी भारतीय भाषाओं में प्रकाशिक
अक्षर पहचान (ओ सी आर)। ओ सी आर स्कैन किए गए प्रतिरूपों (मुद्रित पृष्ठों को
स्कैनर के माध्यम से स्कैन किया जा सकता है) को संपादन योग्य पाठ में परिवर्तित
करता है ताकि उसका प्रयोग अन्य अनुप्रयोगों के लिए किया जा सके और तदनुसार संशोधित
किया जा सके। प्रकाशन उद्योग इसका एक प्रमुख लाभग्राही है, जो पुन: मुद्रण तथा नए
प्रकाशन तैयार करने के लिए इसका प्रयोग कर सकता है। |
| |
|
| |
रेलवे सूचना, स्वास्थ्य की देखभाल, कृषि, आपदा प्रबंध तथा सार्वजनिक उपयोगिता की
अन्य सेवा जैसी प्रणालियों के लिए वाणी इंटरफेस। इससे सर्वसाधारण को उन्नत
प्रौद्योगिकियों का लाभ प्राप्त करने में सहायता मिलेगी। प्रणाली के साथ संपर्क
करने के प्रयोजन से मनुष्य की वाणी की पहचान करने तथा सूचना के निष्कर्षण के लिए
उसे पाठ में परिवर्तित करने के लिए वाक् इंजन का प्रयोग किया जा सकता है। पाठ से
वाणी का प्रयोग इंटरनेट से सूचना प्राप्त करने जैसे अनुप्रयोगों के लिए दृष्टिहीन
व्यक्तियों को पाठ पढ़कर सुनाने के लिए किया जा सकता है। |
| |
|
| |
भारतीय भाषाओं के लिये इंटरनेट अभिगम साधन जैसे कि ब्राउज़र, खोज इंजन तथा ई-मेल।
इनसे, भारतीय भाषाओं में ईमेल भेजना संभव होगा और खोज इंजन अन्य भारतीय भाषाओं में
सूचना खोजने की सहायता उपलब्ध कराएगा और साथ ही किसी भी एक भारतीय भाषा में पूछताछ
भी उपलब्ध कराएगा। |
| |
|
| |
भारतीय भाषाओं तथा अंग्रेजी के बीच ऑन-लाइन अनुवाद सेवा साधन। इससे लोगों को
अंग्रेजी तथा किसी भी भारतीय भाषा में उपलब्ध किसी सूचना-सामग्री का अनुवाद अपनी
पसंद की लक्षित भारतीय भाषा में करने की सहायता प्राप्त होगी। |
| |
|
| उत्पाद/सेवाएँ टीडीआईएल डेटा केन्द्रों के माध्यम से ऑन-लाइन हेल्प
डेस्क के साथ उपलब्ध करवाए जा रहे हैं।
निम्नलिखित के माध्यम से अनुसंधान, उत्पादन, नियोजन तथा सहायता को प्रेरित करने के
उद्देश्य से, टीडीआईएल-डीसी (भाषा प्रौद्योगिकी उपयोगिता वितरण चैनल) के लिए सरकार
की एक मिशन-उन्मुख एवं समयबद्ध कार्यकलाप योजना है |
| |
|
| |
विकसित प्रौद्योगिकियों को बाजार में उपलब्ध कराना |
| |
|
| |
उत्पाद तैयार करने के लिए प्रौद्योगिकियों का दर्जा बढ़ाना अथवा उनमें परिशोधन करना |
| |
|
| |
आवश्यकता पर आधारित नई प्रौद्योगिकियों का विकास करना |
| |
|
| उपर्युक्त को हासिल करने लिए, निम्नलिखित कदम उठाए जा रहे हैं |
| |
क. टीडीआईएल डेटा केन्द्रों के माध्यम से भाषा
प्रौद्योगिकियों/साधनों का चरणबद्ध वितरण |
| |
|
| |
ख. विकसित साधनों, प्रौद्योगिकियों, उत्पादों तथा सेवाओं का
अधिग्रहण |
| |
|
| |
ग. भाषा प्रौद्योगिकी के क्षेत्रों में सरकार के प्रयासों के बारे
में जागरूकता पैदा करना और उपलब्ध साधनों एवं प्रौद्योगिकियों के माध्यम से
प्रचार-प्रसार |
| |
|
| |
घ. प्रयोक्ताओं को साधनों, उपयोगिताओं, उत्पादों आदि को नि:शुल्क
रूप से डाउनलोड करने की सुविधा प्रदान करना |
| |
|
| |
ङ. भाषा प्रौद्योगिकी में निजी-सार्वजनिक भागीदारी को बढ़ावा देना |
| |
|
| |
च. विशिष्ट अनुप्रयोग क्षेत्रों के मिशन आरंभ करना |
| |
|
|
 |