सूचना पुनर्प्राप्ति क्वेरी भाषा

सूचना पुनर्प्राप्ति क्वेरी भाषा

संपादित करें

सूचना पुनर्प्राप्ति (IR) क्वेरी भाषा एक क्वेरी भाषा है जिसका उपयोग खोज सूचकांक में प्रश्न बनाने के लिए किया जाता है। एक क्वेरी भाषा को औपचारिक रूप से एक Context Free Grammar (सीएफजी) में परिभाषित किया गया है और इसका उपयोग उपयोगकर्ताओं द्वारा पाठ, दृश्य / यूआई या भाषण फॉर्म में किया जा सकता है। उन्नत क्वेरी भाषाओं को अक्सर ऊर्ध्वाधर खोज इंजन में पेशेवर उपयोगकर्ताओं के लिए परिभाषित किया जाता है, इसलिए उन्हें प्रश्नों के निर्माण पर अधिक नियंत्रण प्राप्त होता है।

क्वेरी भाषाओं के प्रकार

संपादित करें
  • पूर्ण-पाठ. सबसे सरल क्वेरी भाषा सभी शब्दों को एक शब्द के बैग के रूप में मान रही है जो कि उल्टे सूचकांक में पोस्टिंग के साथ मेल खाते हैं और जहां बाद में रैंकिंग मॉडल सबसे प्रासंगिक दस्तावेजों को पुनः प्राप्त करने के लिए लागू होते हैं। केवल टोकन को सीएफजी में परिभाषित किया गया है। वेब खोज इंजन अक्सर इस दृष्टिकोण का उपयोग करते हैं।
  • बूलियन. एक क्वेरी भाषा जो बूलियन ऑपरेटरों के उपयोग का समर्थन करती है OR, AND, NOT।
  • नेचुरल लैंग्वेज. एक क्वेरी भाषा जो नेचुरल लैंग्वेज क्वेरी को एक ऐसे रूप में पार्स करके नेचुरल लैंग्वेज का समर्थन करती है, जिसका उपयोग प्रासंगिक दस्तावेजों को पुनर्प्राप्त करने के लिए किया जा सकता है, उदाहरण के लिए प्रश्न उत्तर प्रणाली या संवादी खोज
  • संरचित. वह भाषा जो किसी दस्तावेज़ के संरचित होने पर (उसके संयोजन के) क्षेत्रों के भीतर खोज का समर्थन करती है और उसे अपने दस्तावेज़ संरचना का उपयोग करके अनुक्रमित किया गया है।

ध्यान दें कि IR क्वेरी भाषाएँ विभिन्न प्रकारों का मिश्रण हो सकती हैं। विशेष वाइल्ड कार्ड ऑपरेटरों और केस-सेंसिटिव या वाक्यांश खोजों के लिए विशेष खोज फ़ंक्शंस को क्वेरी भाषा के भाग के रूप में परिभाषित किया जा सकता है।

[1]