मुख्य पृष्ठ  |  भाषा विकल्प  |  डाउनलोड  | सामान्य प्रश्न  |  
 
 
Hindi CD Cover
 
भारतीय भाषाओं के लिए प्रौद्योगिकी विकास
 
मानव के बीच आपस में कई तरीकों से संपर्क होता है, जिनमें दृश्य तथा श्रवण पद्धति प्राथमिक पद्धति हैं। इस समय, मानव-मशीन संपर्क का प्रधान माध्यम मानव की सुविधा की बजाय मशीन की सुविधा पर अधिक निर्भर है। माउस तथा कुंजीपटल प्रमुख इनपुट युक्तियाँ हैं तथा विजुअल प्रदर्श यूनिट मुख्य आउटपुट युक्ति है। ऐसे इंटरफेस का प्रयोग करने के लिए विशेष कौशल तथा मानसिक अभिवृत्ति की आवश्यकता होती है, जिससे कई लोग संपन्न नहीं होते हैं। आपसी संपर्क के इस मशीन-केन्द्रित मोड को मानव-केन्द्रित इंटरफेस में बदलना जरूरी है जिससे कंप्यूटरों की शक्ति के लाभ सभी को मिल सकें। हालाँकि सूचना अपने सामने देखने से जो सूचना प्राप्त होती है वह अधिक प्रभावी होती है, तथापि सूचना प्रेषित करने के लिए वाणी सबसे आसान साधन है। कंप्यूटर तथा दूरसंचार प्रणालियों के समाहार के कारण शाब्दिक संव्यवहार आज ज्यादा शक्तिशाली हो गया है, जिनकी सहायता से लोग किसी दूर स्थान पर स्थित कंप्यूटरों से सूचना प्राप्त कर सकते हैं । शाब्दिक संव्यवहार में प्रकृत भाषा शामिल है, और इसके कारण सूचना प्रौद्योगिकी के क्षेत्र में भाषा- विज्ञान का महत्व बढ़ गया है। इसलिए, कंप्यूटर पर मानव-केन्द्रित इंटरफेस आज की आवश्यकता है। मनुष्य को एक अनूठी विशेषता से संपन्न किया गया है - भाषा - जिसकी सहायता से वह सूचना, चिंतन तथा विचारों का आपस में आदान-प्रदान बिना किसी परिश्रम के कर लेता है। प्रकृत भाषा के प्रयोग से मानव मशीन संपर्क में मानव भाषा प्रौद्योगिकी के कई पहलू शामिल हैं : वाणी समन्पीडन, पहचान एवं वाणी तथा लिपि की समझ, मशीनी अनुवाद, पाठ सृजन, वाणी तथा घसीट कर लिखी जाने वाली लिपि का संश्लेषण। मशीन के साथ सम्पर्क स्थापित करने के लिए भाषा के दोनों रूप, बोली जाने वाली तथा लिखी जाने वाली, उपयोगी हैं।
कंप्यूटर पर भारतीय भाषाओं पर कार्य करने की सुविधा पिछले दो दशकों के उपलब्ध कराई जा रही है, जिनमें विभिन्न प्लेटफार्मों तथा प्रचालन प्रणालियों पर डेटा संसाधन, शब्द संसाधन, डेस्क टॉप प्रकाशन आदि सहित विभिन्न प्रकार के कार्य शामिल हैं।

सूचना प्रौद्योगिकी विभाग ने किसी प्रकार के भाषायी अवरोध के बिना मानव-मशीन संपर्क की सुविधा प्रदान करने के प्रयोजन से सूचना संसाधन साधनों का विकास करने; बहुभाषी ज्ञान स्रोतों का निर्माण एवं अभिगम करने; तथा अभिनव प्रयोक्ता उत्पादों एवं सेवाओं के विकास के लिए उनका एकीकरण करने के उद्देश्य से टीडीआईएल (भारतीय भाषाओं के लिए प्रौद्योगिकी विकास) कार्यक्रम आरंभ किया। कार्पोरा तथा शब्दकोश जैसे भाषा-विज्ञान संसाधनों के विकास; तथा फोंट, पाठ संपादक, वर्तनी परीक्षक, ओसीआर और पाठ-से-वाणी जैसे मूलभूत सूचना संसाधन साधनों के विकास के लिए परियोजनाओं को धनराशि उपलब्ध कराई गई। मानक भी तैयार किए गए हैं।

भारतीय भाषा प्रौद्योगिकी के उत्पादों तथा सेवाओं का विकास करने के लिए देश के विभिन्न स्थानों पर निजी, सार्वजनिक एवं सरकारी स्तर पर विविध प्रयास किए गए हैं। स्रोत केन्द्रों तथा कॉयलनेट केन्द्रों द्वारा विकसित भाषा प्रौद्योगिकियों तथा साधनों को तेज़ी से प्रयोग में लाना आवश्यक है जिससे उनकी उपयोगिता के बारे मे प्रतिक्रिया मिल सके और उन्हें उत्पादन के लिए उपलब्ध कराया जा सके। अनुसंधान एवं विकास का प्रभाव पूरे समाज पर पडना चाहिए। इसका तात्पर्य यह है कि अनुसंधान के प्रयासों को प्रयोगशालाओं तक सीमित न रखकर इनका नियोजन तेज़ी से किया जाना चाहिए, जिनपर अंतत: प्रयोक्ताओं की प्रतिपुष्टि तथा उनके अनुभव की जानकारी प्राप्त हो सकेगी तथा उनमें अधिक परिशोधन किया जा सकेगा ।

सरकार ने अगले एक वर्ष में निम्नलिखित उत्पाद तथा समाधान सार्वजनिक डोमेन में उपलब्ध कराने की पूरी तैयारी कर ली है :
  सभी भारतीय भाषाओं में नि:शुल्क फोंट (टीटीएफ तथा ओटीएफ) एवं शब्द संसाधक। पहले कदम के रूप में, सार्वजनिक डोमेन में नि:शुल्क रूप से उपलब्ध कराने के उद्देश्य से शास्त्रीय भाषा तमिल के लिए लोकप्रिय ट्रू टाइप फोंटों (टीटीएफ) का चयन प्रकाशन उद्योग के साथ विचार-विमर्श करके किया गया है। विण्डोज़ 95/विण्डोज़ 98/विण्डोज़ एनटी प्लेटफार्म वाली प्रणालियों पर टीटीएफ फोंटों का प्रयोग व्यापक रूप से हो रहा है। विण्डोज़ 2000/एक्सपी/2003 तथा लिनक्स प्लेटफार्मों के ओटीएफ (ओपन टाइ फोंट) जारी किए जा रहे हैं। यह अपनी तरह का पहला प्रयास है और शब्द संसाधक (वर्तमान एवं नए) इन फोंटों का प्रयोग कर सकेंगे। इसके परिणामस्वरूप, प्रयोक्ताओं को डेटा प्रविष्टि के लिए इंसक्रिप्ट, फोनेटिक तथा टाइपराइटर कुंजीपटल वाले और अधिक फोंट उपलब्ध होंगे।
   
  सूचना निष्कर्षण, पुन:प्राप्ति एवं अंकीयकरण के लिए सभी भारतीय भाषाओं में प्रकाशिक अक्षर पहचान (ओ सी आर)। ओ सी आर स्कैन किए गए प्रतिरूपों (मुद्रित पृष्ठों को स्कैनर के माध्यम से स्कैन किया जा सकता है) को संपादन योग्य पाठ में परिवर्तित करता है ताकि उसका प्रयोग अन्य अनुप्रयोगों के लिए किया जा सके और तदनुसार संशोधित किया जा सके। प्रकाशन उद्योग इसका एक प्रमुख लाभग्राही है, जो पुन: मुद्रण तथा नए प्रकाशन तैयार करने के लिए इसका प्रयोग कर सकता है।
   
  रेलवे सूचना, स्वास्थ्य की देखभाल, कृषि, आपदा प्रबंध तथा सार्वजनिक उपयोगिता की अन्य सेवा जैसी प्रणालियों के लिए वाणी इंटरफेस। इससे सर्वसाधारण को उन्नत प्रौद्योगिकियों का लाभ प्राप्त करने में सहायता मिलेगी। प्रणाली के साथ संपर्क करने के प्रयोजन से मनुष्य की वाणी की पहचान करने तथा सूचना के निष्कर्षण के लिए उसे पाठ में परिवर्तित करने के लिए वाक् इंजन का प्रयोग किया जा सकता है। पाठ से वाणी का प्रयोग इंटरनेट से सूचना प्राप्त करने जैसे अनुप्रयोगों के लिए दृष्टिहीन व्यक्तियों को पाठ पढ़कर सुनाने के लिए किया जा सकता है।
   
  भारतीय भाषाओं के लिये इंटरनेट अभिगम साधन जैसे कि ब्राउज़र, खोज इंजन तथा ई-मेल। इनसे, भारतीय भाषाओं में ईमेल भेजना संभव होगा और खोज इंजन अन्य भारतीय भाषाओं में सूचना खोजने की सहायता उपलब्ध कराएगा और साथ ही किसी भी एक भारतीय भाषा में पूछताछ भी उपलब्ध कराएगा।
   
  भारतीय भाषाओं तथा अंग्रेजी के बीच ऑन-लाइन अनुवाद सेवा साधन। इससे लोगों को अंग्रेजी तथा किसी भी भारतीय भाषा में उपलब्ध किसी सूचना-सामग्री का अनुवाद अपनी पसंद की लक्षित भारतीय भाषा में करने की सहायता प्राप्त होगी।
   
उत्पाद/सेवाएँ टीडीआईएल डेटा केन्द्रों के माध्यम से ऑन-लाइन हेल्प डेस्क के साथ उपलब्ध करवाए जा रहे हैं। निम्नलिखित के माध्यम से अनुसंधान, उत्पादन, नियोजन तथा सहायता को प्रेरित करने के उद्देश्य से, टीडीआईएल-डीसी (भाषा प्रौद्योगिकी उपयोगिता वितरण चैनल) के लिए सरकार की एक मिशन-उन्मुख एवं समयबद्ध कार्यकलाप योजना है
   
  विकसित प्रौद्योगिकियों को बाजार में उपलब्ध कराना
   
  उत्पाद तैयार करने के लिए प्रौद्योगिकियों का दर्जा बढ़ाना अथवा उनमें परिशोधन करना
   
  आवश्यकता पर आधारित नई प्रौद्योगिकियों का विकास करना
   
उपर्युक्त को हासिल करने लिए, निम्नलिखित कदम उठाए जा रहे हैं
  क. टीडीआईएल डेटा केन्द्रों के माध्यम से भाषा प्रौद्योगिकियों/साधनों का चरणबद्ध वितरण
   
  ख. विकसित साधनों, प्रौद्योगिकियों, उत्पादों तथा सेवाओं का अधिग्रहण
   
  ग. भाषा प्रौद्योगिकी के क्षेत्रों में सरकार के प्रयासों के बारे में जागरूकता पैदा करना और उपलब्ध साधनों एवं प्रौद्योगिकियों के माध्यम से प्रचार-प्रसार
   
  घ. प्रयोक्ताओं को साधनों, उपयोगिताओं, उत्पादों आदि को नि:शुल्क रूप से डाउनलोड करने की सुविधा प्रदान करना
   
  ङ. भाषा प्रौद्योगिकी में निजी-सार्वजनिक भागीदारी को बढ़ावा देना
   
  च. विशिष्ट अनुप्रयोग क्षेत्रों के मिशन आरंभ करना
   
 
 

Valid XHTML 1.0 Transitional