प्रतिचयन

आंकडों में डेटा अंक का चुनाव

एक सांख्यिकीय जांच में, शोधकर्ता कि दिलचस्पी आमतौर पर, एक समूह से संबंधित व्यक्तियों का, एक या एक से अधिक विशेषताओं के संबंध में भिन्नता, के अध्ययन में निहित होता है। अध्ययन के तहत व्यक्तियों के इस समूह को आबादी कहा जाता है। जनसंख्या परिमित या अनंत हो सकता है। यह स्पष्ट है कि किसी भी सांख्यिकीय जांच के लिए पूरी जनसंख्या का गणन असंभव है। उदाहरण के लिए, अगर हम भारत के प्रति व्यक्ति औसत आय का एक आकलन करना चाहते हैं, तो हमे देश के सभी कमाने वाले व्यक्तियों कि गणना करनी होगी, जो असम्भव है।

आबादी और प्रतिदर्श

एक बड़ी आबादी या एक समूह से प्रतिनिधि प्रतिदर्श को प्राप्त करने की विधि को प्रतिचयन (सैम्पलिंग) कहा जाता है। प्रतिचयन कि पद्धति, विश्लेषण के प्रकार पर निर्भर करती है। प्रतिनिधि प्रतिदर्श के इकाइयों की कुल संख्या को प्रतिदर्श समष्टि कहा जाता है।

प्रतिदर्श पूरी आबादी का प्रतिनिधित्व होना चाहिए। जब एक बड़ी आबादी से प्रतिदर्श चुना जाता है, यह विचार करना आवशयक है कि किस प्रकार यह चुनाव किया जा रहा है। एक प्रतिनिधि प्रतिदर्श प्राप्त करने के लिए, प्रतिदर्श बेतरतीब ढंग से चुना जाना चाहिए। उदाहरण के लिए, एक विश्वविद्यालय के छात्रों की औसत उम्र का निर्धारण करने के लिए, 10% छात्रों का प्रतिचयन, लॉटरी प्रणाली का इस्तेमाल करके किया जा सकता है। इससे छात्रों कि अबादी का एक भली-भाँति प्रतिनिधित्व मिलेगा और छात्रों की औसत उम्र का अनुमानित आँकड़ा प्राप्त होगा।

प्रतिचयन पद्धतियाँ संपादित करें

सोद्देश्य प्रतिचयन

 
सोद्देश्य प्रतिचयन

सोद्देश्य प्रतिचयन में प्रतिदर्श का चुनाव एक निश्चित उद्देश्य को ध्यान में रखते हुए किया जाता है। उदाहरण के लिए, अगर हम नई दिल्ली शहर में रेहने वाले लोगों के जीवन स्तर कि एक तस्वीर देना चाहे, तो हम भव्य अवं आलीशान मोहल्लों में रेहने वाले लोगों को ही अपने प्रतिदर्श में शामिल करेंगे, और कम आय अवं मध्यम वर्गीय मोहल्लों को नज़रअंदाज़ करेंगे। इस प्रतिचयन पद्धति कि कमी यह है कि ये पक्षपाती है और इससे पूरी आबादी का प्रतिनिधी प्रतिदर्श प्राप्त नहीं होता है।

सरल यादृच्छिक प्रतिचयन

 
लॉटरी प्रणाली

सरल यादृच्छिक प्रतिचयन के कुछ महत्वपूर्ण तथ्य :

  • जनसंख्या 'क' वस्तुओं कि होती हैं।
  • प्रतिदर्श समष्टि 'ख' हैं।
  • अगर आबादी के प्रत्येक इकाई को प्रतिदर्श में शामिल होने का बराबर मोका मिलता है, तो उसे सरल यादृच्छिक प्रतिचयन कहा जाता है।

सरल यादृच्छिक प्रतिदर्श प्राप्त करने के कई तरीके हैं। एक लॉटरी प्रणाली है। दूसरे प्रक्रिया में आबादी के प्रत्येक 'क' सदस्यों को एक अद्वितीय संख्या दिया जाता है। सारी संख्याओं को एक टोकरी में रखा जाता है और अच्छी तरह से मिला दिया जाता है। फिर, एक अंधा मुड़ा शोधकर्ता 'ख' संख्याओं का चयन करता है। चयनित जनसंख्या के सदस्यों को प्रतिदर्श में शामिल किया जाता हैं।

स्तरीकृत प्रतिचयन

 
स्तरीकृत प्रतिचयन

स्तरीकृत प्रतिचयन में, कुछ लक्षणों के आधार पर जनसंख्या को समूहों में बांटा जाता है। फिर, प्रत्येक समूह के भीतर, एक संभावना प्रतिदर्श (अक्सर एक सरल यादृच्छिक प्रतिदर्श) का चयन किया जाता है। स्तरीकृत प्रतिचयन में, समूहों को तबके कहा जाता है।

एक उदाहरण के रूप में, मान लीजिए हम एक राष्ट्रीय सर्वेक्षण का आयोजन करते है। हम आबादी को, भूगोल के आधार पर समूहों में विभाजित करते है - उत्तर, पूर्व, दक्षिण और पश्चिम। फिर, प्रत्येक समूह के भीतर, हम यादृच्छिक ढंग से प्रतिदर्श का चयन कर सकते है।

व्यवस्थित यादृच्छिक प्रतिचयन

 
व्यवस्थित यादृच्छिक प्रतिचयन

व्यवस्थित यादृच्छिक प्रतिचयन में, हम आबादी के हर सदस्य की एक सूची बनाते है। सूची से, हम यादृच्छिक ढंग से आबादी सूची के पहले क इकाइयों का चयन करते हैं। इसके बाद, हम सूची से हर प्रत्येक क तत्व का चयन करते है। प्रत्येक क तत्वों वाले प्रतिदर्श का चयन बराबर नहीं होता है, इसी कारण व्यवस्थित यादृच्छिक प्रतिचयन यादृच्छिक प्रतिचयन से अलग है।

प्रतिचयन और डेटा संग्रहण संपादित करें

अच्छे डेटा संग्रह के निम्नलिखित गुण है :

  • परिभाषित प्रतिचयन प्रक्रिया का पालन करना
  • डाटा को समय क्रम के अनुसार रखना
  • टिप्पणियाँ और अन्य प्रासंगिक घटनाओं को ध्यान में रखना
  • गैर प्रतिक्रियाओं को ध्यान में रखना

प्रतिचयन के आवेदन संपादित करें

प्रतिचयन, पूरी आबादी में से सही प्रतिदर्श समष्टि का चयन करने में शोधकर्ता को सक्षम बनाता है। उदाहरण के लिए, प्रतिदिन 600 मिलियन ट्वीट का उत्पादन होता है। पर क्या ये आवश्यक है कि पूरे दिन के चर्चित विषय को निर्धारित करने के लिये उन सारे ट्वीट को पढ़ा जाये? या क्या ये आवश्यक है कि किसी एक विषय पर एक सामान्य विचार प्रकट करने के लिए सारे मंतव्य पर ध्यान दिया जाये? एक सामान्य विचार कि भविष्यवाणी करने के लिए यह सभी डेटा को देखने कि आवश्यकता नहीं है, इसके लिए केवल एक प्रतिदर्श पर्याप्त हो सकता है। ट्विटर डाटा के प्रतिचयन के लिए एक सैद्धांतिक सूत्रीकरण विकसित किया गया है।

प्रतिचयन सिद्धांत का जन्म संपादित करें

प्रतिचयन सिद्धांत का आविष्कार अचानक ही नहीं किया गया, बल्कि इसका सतत् रूप में अन्य सांख्यिकीय तरीकों के साथ विकास किया गया है। आधुनिक काल में प्रतिचयन सिद्धांत सांख्यिकीय विज्ञान का एक अलग, सयाना शाखा बन गया है किन्तु शुरूआती दौर में ऐसा नहीं था। प्रतिचयन सर्वेक्षण की जड़ें, संभाव्यता सिद्धांत और प्रयोगात्मक डिजाइन की तुलना में, सरकारी अवं सामाजिक सांख्यिकी में अधिक निहित है। प्रारंभिक दौर में राजनीतिक गणित, और बाद में सामाजिक पथरी, महत्वपूर्ण गतिविधियों रही, जिनके कारण अंत में आधुनिक प्रतिचयन सिद्धांत का जन्म हुआ। हालांकि, संभाव्यता सिद्धांत प्रतिचयन सिद्धांत का एक अंतर्निहित घटक बनने के पश्चात् ही प्रतिचयन सिद्धांत को सांख्यिकीय विज्ञान का एक वास्तविक शाखा माना गया है। प्रतिचयन सर्वेक्षण का इतिहास काफी लम्बा रहा है।

सन्दर्भ संपादित करें

[१] https://web.archive.org/web/20161104025323/http://www.investopedia.com/terms/s/sampling.asp

[२] https://web.archive.org/web/20161105030307/http://stattrek.com/survey-research/sampling-methods.aspx?tutorial=ap

[३] https://web.archive.org/web/20161113174159/http://www.simplypsychology.org/sampling.html

[४] https://web.archive.org/web/20161113172904/http://www.statpac.com/surveys/sampling.htm