"प्राकृतिक भाषा संसाधन" के अवतरणों में अंतर

सम्पादन सारांश रहित
'''प्राकृतिक भाषा संसाधन''' ('''एनएलपी''') [[कंप्यूटर विज्ञान]] और [[भाषा विज्ञान]] और मानव (प्राकृतिक) भाषाओं के कंप्यूटर के बीच बातचीत के  संबंध का एक क्षेत्र है। <ref>Charnia, Eugene: ''Introduction to प्राकृतिक भाषा संसाधन (एनएलपी) पाठ को विश्लेषित करने के लिए कम्प्यूटरीकृत दृष्टिकोण है जो कि प्रौद्योगिकी और सिद्धांतों के दोनों वर्गों पर आधारित है और अनुसंधान और विकास के क्षेत्र में यह बहुत सक्रिय है।artificialहै। artificial intelligence'', page 2. Addison-Wesley, 1984.</ref>
 
==कठिनाइयाँ==
कम्प्यूटर द्वारा प्राकृतिक भाषा संसाधन करने में प्रमुख कठिनाइयाँ हैं-
# '''संदिग्धता'''
# '''शब्दों के आरम्भ और अन्त का सही पता लगाने की समस्या''' - बोली गयी भाषा में प्रायः शब्दों की सीमा का थीक-ठीक निर्धारण करना कठिन होता है। कुछ लिखित भाषाओं (जैसे [[मन्दारिन]]) में शब्दों के बीच जगह नहीं छोड़ी जाती जिससे शब्दों की सीमा का ठीक से पता करना और उन्हें अलग करना कठिन है।
# '''गलत आंकड़े''' - इसके अलावा शब्दों के टंकण की गलती, गलत वर्तनी, गलत उच्चारण, [[ओसीआर]] से प्राप्त टेक्स्ट में गलती आदि से भी सही शब्दों का पता नहीं चल पाता।
 
==प्रक्रिया==
* मार्फोलोजिक विश्लेषण
* सिन्टैक्टिकल विश्लेषण
* सिमैन्टिक विश्लेषण
* प्रैग्मटिक विश्लेषण - सन्दर्भ आदि का ध्यान रखना
* वाक्य की योजना बनाना
* वाक्यनिर्माण
 
==प्रमुख अनुप्रयोग==
कुछ महत्वपूर्ण प्राकृतिक भाषा संसाधन ये हैं-
 
# सारांशीकरण (summerization)
# प्रश्नों के उत्तर देना
# [[संगणकीय भाषाविज्ञान]]
# कम्प्यूटेशनल भाषा विज्ञान  
# [[डाटा माइनिंग|डाटा खनन]] (डेटा माइनिंग)
# प्राकृतिक भाषा तकनीकको समझना
# प्राकृतिक भाषा समझ
# अनचाहे मेल (स्पैम) के विरुद्ध संघर्ष
 
==इन्हें भी देखें==
*[[भाषा संगणन]]
 
==सन्दर्भ==