"प्राकृतिक भाषा संसाधन": अवतरणों में अंतर

छो बॉट: पुनर्प्रेषण ठीक कर रहा है
पंक्ति 2:
[[चित्र: Automated online assistant.png|right|thumb|200px|[[स्वचालित ऑनलाइन सहायक]] आजकल बहुत उपयोगी सिद्ध हो रहे हैं। ]]
 
'''प्राकृतिक भाषा संसाधन''' ('''एनएलपी''') [[कम्प्यूटर विज्ञान]], [[कृत्रिम बुद्धि]] तथा [[भाषाविज्ञान|भाषा विज्ञान]] का एक क्षेत्र है तथा मानव (प्राकृतिक) भाषाओं और [[कंप्यूटर]] के अन्तःक्रियाओं से सम्बन्धित है।<ref>Charnia, Eugene: ''Introduction to artificial intelligence'', page 2. Addison-Wesley, 1984.</ref> प्राकृतिक भाषा संसाधन, कम्प्यूटर के द्वारा, मानव द्वारा कही या लिखी भाषा से अर्थ निकालने का काम करता है। इसके अलावा प्राकृतिक भाषा का सृजन (लिखित या वाचित रूप में) करने के लिए भी एनएलपी प्रयुक्त होता है।
 
== चुनौती ==
कम्प्यूटर द्वारा प्राकृतिक भाषा संसाधन करने में प्रमुख कठिनाइयाँ हैं-
# '''संदिग्धता''' : मानव भाषाओं में विभिन्न भाषिक स्तरों पर संदिग्धता पाई जाती है, जैसे- शब्द स्तर पर एक शब्द का एक से अधिक शब्दवर्गों में प्रयोग, जैसे - 'सोना' शब्द संज्ञा भी है और क्रिया भी।
# '''शब्दों के आरम्भ और अन्त का सही पता लगाने की समस्या''' - बोली गयी भाषा में प्रायः शब्दों की सीमा का थीक-ठीक निर्धारण करना कठिन होता है। कुछ लिखित भाषाओं (जैसे [[मन्दारिन भाषा|मन्दारिन]]) में शब्दों के बीच जगह नहीं छोड़ी जाती जिससे शब्दों की सीमा का ठीक से पता करना और उन्हें अलग करना कठिन है।
# '''गलत आंकड़े''' - इसके अलावा शब्दों के टंकण की गलती, गलत वर्तनी, गलत उच्चारण, [[ओसीआर]] से प्राप्त टेक्स्ट में गलती आदि से भी सही शब्दों का पता नहीं चल पाता।
 
पंक्ति 21:
कुछ महत्वपूर्ण प्राकृतिक भाषा संसाधन ये हैं-
 
# [[यान्त्रिक अनुवाद|मशीनी अनुवाद]]
# पाठ सरलीकरण
# सूचना निष्कर्षण (इन्फार्मेशन इक्सट्रैक्सन)
पंक्ति 27:
# प्रश्नों के उत्तर देना
# [[संगणकीय भाषाविज्ञान]]
# [[डाटाआँकड़ा माइनिंगखनन|डाटा खनन]] (डेटा माइनिंग)
# प्राकृतिक भाषा को समझना
# अनचाहे मेल (स्पैम) के विरुद्ध संघर्ष