"प्राकृतिक भाषा संसाधन": अवतरणों में अंतर
Content deleted Content added
अनुनाद सिंह (वार्ता | योगदान) |
छो बॉट: पुनर्प्रेषण ठीक कर रहा है |
||
पंक्ति 2:
[[चित्र: Automated online assistant.png|right|thumb|200px|[[स्वचालित ऑनलाइन सहायक]] आजकल बहुत उपयोगी सिद्ध हो रहे हैं। ]]
'''प्राकृतिक भाषा संसाधन''' ('''एनएलपी''') [[कम्प्यूटर विज्ञान]], [[कृत्रिम बुद्धि]] तथा [[भाषाविज्ञान|भाषा विज्ञान]] का एक क्षेत्र है तथा मानव (प्राकृतिक) भाषाओं और [[कंप्यूटर]] के अन्तःक्रियाओं से सम्बन्धित है।<ref>Charnia, Eugene: ''Introduction to artificial intelligence'', page 2. Addison-Wesley, 1984.</ref> प्राकृतिक भाषा संसाधन, कम्प्यूटर के द्वारा, मानव द्वारा कही या लिखी भाषा से अर्थ निकालने का काम करता है। इसके अलावा प्राकृतिक भाषा का सृजन (लिखित या वाचित रूप में) करने के लिए भी एनएलपी प्रयुक्त होता है।
== चुनौती ==
कम्प्यूटर द्वारा प्राकृतिक भाषा संसाधन करने में प्रमुख कठिनाइयाँ हैं-
# '''संदिग्धता''' : मानव भाषाओं में विभिन्न भाषिक स्तरों पर संदिग्धता पाई जाती है, जैसे- शब्द स्तर पर एक शब्द का एक से अधिक शब्दवर्गों में प्रयोग, जैसे - 'सोना' शब्द संज्ञा भी है और क्रिया भी।
# '''शब्दों के आरम्भ और अन्त का सही पता लगाने की समस्या''' - बोली गयी भाषा में प्रायः शब्दों की सीमा का थीक-ठीक निर्धारण करना कठिन होता है। कुछ लिखित भाषाओं (जैसे [[मन्दारिन भाषा|मन्दारिन]]) में शब्दों के बीच जगह नहीं छोड़ी जाती जिससे शब्दों की सीमा का ठीक से पता करना और उन्हें अलग करना कठिन है।
# '''गलत आंकड़े''' - इसके अलावा शब्दों के टंकण की गलती, गलत वर्तनी, गलत उच्चारण, [[ओसीआर]] से प्राप्त टेक्स्ट में गलती आदि से भी सही शब्दों का पता नहीं चल पाता।
पंक्ति 21:
कुछ महत्वपूर्ण प्राकृतिक भाषा संसाधन ये हैं-
# [[यान्त्रिक अनुवाद|मशीनी अनुवाद]]
# पाठ सरलीकरण
# सूचना निष्कर्षण (इन्फार्मेशन इक्सट्रैक्सन)
पंक्ति 27:
# प्रश्नों के उत्तर देना
# [[संगणकीय भाषाविज्ञान]]
# [[
# प्राकृतिक भाषा को समझना
# अनचाहे मेल (स्पैम) के विरुद्ध संघर्ष
|