"सांख्यिकी": अवतरणों में अंतर

छो बॉट: लाघव चिह्न (॰) का उचित प्रयोग।
छो बॉट: अनावश्यक अल्पविराम (,) हटाया।
पंक्ति 3:
'''सांख्यिकी''' एक [[गणित|गणितीय विज्ञान]] है जिसमें किसी वस्तु/अवयव/तंत्र/समुदाय से सम्बन्धित [[आंकड़ा|आकड़ों]] का संग्रह, विश्लेषण, व्याख्या या स्पष्टीकरण और प्रस्तुति की जाती है। यह विभिन्न क्षेत्रों में लागू है - [[अकादमिक अनुशासन]] (academic disciplines), इस से [[प्राकृतिक विज्ञान]], [[सामाजिक विज्ञान]], [[मानविकी]], सरकार और व्यापार आदि।
 
सांख्यिकीय तरीकों को डेटा के संग्रह के संग्रहण अथवा वर्णन के लिए इस्तेमाल किया जा सकता है। इसे '''[[वर्णनात्मक सांख्यिकी]]''' (descriptive statistics) कहा जाता है। इसके अतिरिक्त, डेटा में पैटर्न को इस तरह से [[गणितीय मॉडल|मॉडल]] किया जा सकता है कि वह निष्कर्षों की यादृच्छिकता और अनिश्चितता का कारण बने, और फिर इस प्रक्रिया को उस विधि, या जिस जनसंख्या का अध्ययन किया जा रहा हो, उसके बारे में [[अनुमान]] लगाने के लिए किया जाता है। इसे '''[[आनुमानिक सांख्यिकी|अनुमानित सांख्यिकी]]''' (inferential statistics) कहा जाता है। वर्णनात्मक तथा अनुमानित सांख्यिकी, दोनों में '''व्यावहारिक सांख्यिकी''' सम्मिलित है। एक और विद्या है - '''[[गणितीय सांख्यिकी]]''' (mathematical statistics), जो विषय के सैद्धान्तिक आधार से सम्बन्ध रखती है।
 
== परिचय ==
सांख्यिकी (Statistics) सभ्यता की गति में अंकों का योगदान बड़ा ही महत्वपूर्ण रहा है और अंक पद्धति के विकास का बहुत बड़ा श्रेय [[भारत]] को प्राप्त है। मनुष्य के ज्ञान की प्रत्येक शाखा अंकों की ऋणी है।
 
सांख्यिकी का विज्ञान भी बहुत कुछ काम अंकों से लेता है, जिन्हें "आँकड़े" कहते हैं, परंतु इन अंकों के कुछ विशिष्ट लक्षण होते हैं। स्टैटिस्टिक्स शब्द की व्युत्पत्ति का पता लगाते समय इसके नाम में आज तक हुए अनेक क्रांतिकारी परिवर्तनों को जानकर आश्चर्य होता है। प्राचीन काल में राज्यों के तुलनात्मक वर्णन के लिए स्टैटिस्टिक्स शब्द का प्रयोग होता था, जिसमें अंकों या आँकड़ों का कोई स्थान ही नहीं होता था। स्टैटिस्टिक्स शब्द का मूल [[लैटिन]] शब्द स्टैटस ([[इतालवी भाषा]] "स्टैटी", जर्मन "स्टैटिस्टिक्स"") है, जिसका अर्थ है 'राजनीतिक राज्य'। 18वीं शती तक इस शब्द का अर्थ किसी राज्य की विशेषताओं का विवरण था। अतएव कुछ प्राचीन लेखकों ने स्टैटिस्टिक्स को राज्य विज्ञान के नाम से निरूपित किया है। क्रमश: इस शब्द को मात्रात्मक सार्थकता प्राप्त हुई, और दो विभिन्न अर्थों में इसका प्रयोग चलता रहा। एक ओर यह अंकों से निरूपित "जन्म और मृत्यु आँकड़े" जैसे तथ्यों से और दूसरी ओर अंकात्मक आँकड़ों से उपयोगी निष्कर्ष निकालने के विधि निकाय, अर्थात् विज्ञान से संबंधित था। 19वीं शती के अंतिम काल से हमें "उज्ज्वल, सामान्य, मद" आदि शीर्षकों में बच्चों की सांख्यिकी जैसे विवरण मिलते हैं, जिनसे इस ज्ञान शाखा की परिमाणोन्मुखता (quantitative direction) स्पष्ट होती है।
 
इस प्रकार हम देखते हैं कि वैज्ञानिक पद्धति की विशिष्ट शाखा के रूप में सांख्यिकी का सिद्धांत अपेक्षाकृत अभिनव उपज है। इसका मूल रूप लाप्लास और गाउस की कृतियों में ढूँढ़ा जा सकता है, लेकिन इसका अध्ययन 19वीं शती के चौथे चरण में जाकर समृद्ध हुआ। गाल्टन और कार्ल पियर्सन के प्रभाव से इस विज्ञान में विलक्षण प्रगति हुई और आगामी तीन दशकों में इस विज्ञान की आधार शिलाएँ सदृढ़ हो गईं। यह कह देना उचित है कि दिन-दिन नए नए क्षेत्रों में प्रयुक्त होने वाले इस विषय की इमारत अभी तेजी से बनन की स्थिति में है। शोध कार्य, वह भी विशेषत: सांख्यिकी के गणितीय सिद्धांत में, ऐसी तेजी से हो रहा है और नए तथ्य ऐसी तीव्र गति से सामने आ रहे हैं कि उन सबकी जानकारी रखना भी कठिन हो रहा है। मानव ज्ञान और क्रिया के विविध क्षेत्रों में इस विषय की प्रयुक्ति दिन-दिन बढ़ रही है और बड़ी उपयोगी सिद्ध हो रही है।
पंक्ति 32:
सांख्यिकीविद् को कुछ प्राथमिक कार्यों के लिए, जैसे संचयन, वर्गीकरण, सारणीकरण, लेखाचित्रीय उपस्थापन (presentation) आदि के लिए विशिष्ट प्रशिक्षण के साथ ही प्रारंभिक गणित की भी आवश्यकता होती है और बाद में आगणन, अनुमान और पूर्वानुमान के लिए उच्च गणित और संभाविता के सिद्धांत की सहायता लेनी पड़ती है।
 
अर्थशास्त्र, समाज विज्ञान और वाणिज्य के क्षेत्रों में, बेरोजगारी बढ़ रही है या घट रही है, भवनों की कमी है, और यदि है, तो किस सीमा तक, कुपोषण हो रहा है या नहीं, शराबबंदी से अपराधों में कमी हुई है या नहीं, आदि प्रश्नों का समाधान सांख्यिकी के द्वारा होता है.
 
जनन विज्ञान, जीव विज्ञान और कृषि में सांख्यिकीय विधियों का प्रयोग अब अनिवार्य हो चला है। जीव विज्ञान में एक नई शाखा जीव सांख्यिकी निकली है, जिसके अंतर्गत जीव विज्ञानीय विचरणों का सांख्यिकी अध्ययन किया जाता है।
पंक्ति 40:
मनोविज्ञान और शिक्षा के क्षेत्र में व्यावसायिक प्रशिक्षण के लिए, मानव मस्तिष्क का अध्ययन करते समय, बुद्धि, विशेष योग्यता और अभिरुचि आदि के संदर्भ में सांख्यिकीय तकनीकी की सहायता ली जाती है।
 
चिकित्सा के क्षेत्र में सांख्यिकीय आँकड़े और विधियाँ दोनों ही परम उपयोगी हैं। महामारी विज्ञान (epidemiology), और जन स्वास्थ्य में आँकड़ों की आवश्यकता पड़ती है और किसी नई औषधि या टीके (inoculation) की दक्षता का पता लगाने के लिए आयुर्वेज्ञानिक अनुसंधान में सांख्यिकीय विधियों के ज्ञान की आवश्यकता होती है।
 
ज्योतिष, बीमा और मौसम विज्ञान, सांख्यिकी की लाभप्रद युक्तियों के अन्य क्षेत्र हैं। सांख्यिकी का प्रयोग यदाकदा साहित्य में भी हुआ है। कुछ समय पूर्व तक ऐसी धारणा थी कि भौतिकी, रसायन और इंजीनियरी में सांख्यिकी की कोई आवश्यकता नहीं है। इन यथार्थ विज्ञानों में सांख्यिकीय सिद्धांतों के प्रयोग से सचमुच बहुत बड़ी क्रांति हुई है। सांख्यिकीय गुण नियंत्रण, जो उत्पादन इंजीनियरी के अंतर्गत सांख्यिकीय विधियों का अनुकूलन है, इसी क्रांति की देन है। बाढ़ नियंत्रण, सड़क सुरक्षा, टेलीफोन, यातायात आदि की समस्याओं में सांख्यिकीय प्रणालियों का प्रयोग सफल रहा है।
 
भविष्य में सांख्यिकी का और भी व्यापक प्रसार संभव है। कुछ विषयों के लिए यह मौलिक महत्व के विचार, और कुछ के लिए अनुसंधान की शक्तिशाली विधियाँ, प्रदान करती है। बिना विषय खंडन की आशंका के कहा जा सकता है कि सांख्यिकी सर्वव्यापी विषय बनता जा रहा है।
 
== सांख्यिकीय पद्धतियां ==
=== प्रायोगिक तथा अवलोकन हेतु अध्ययन ===
एक सांख्यिकीय अनुसंधान परियोजना के लिए छानबीन करने का साझा ध्येय है [[आपद]] ([[:en:causality|causality]]), और विशेषतया भविष्यवक्ताओं के मूल्यों में परिवर्तन, अथवा [[स्वाधीन चर|स्वतंत्र चरों]] ([[:en:independent variable|independent variable]]) का अनुक्रिया अथवा [[पराधीन चर|आश्रित चरों]] ([[:en:dependent variable|dependent variable]]) पर क्या प्रभाव पड़ता है, इसके बारे में निष्कर्ष निकालना.अनियत सांख्यिकीय अध्ययन के दो प्रमुख प्रकार हैं, प्रयोगात्मक अध्ययन और अवलोकन अध्ययन.अध्ययन के दोनों प्रकार में, एक स्वतंत्र चर (या चरों) के मतभेदों का, एक आश्रित चर के व्यवहार पर असर का अवलोकन किया जाता है.दोनों प्रकार के बीच का अंतर इस बात पर निहित है कि वास्तविक अध्ययन को कैसे आयोजित किया जाता है. निहित है.कोई भी बहुत प्रभावी हो सकता है.
 
एक प्रयोगात्मक अध्ययन में सम्मिलित है, इसके अंतर्गत की प्रणाली का माप, इस प्रणाली से छेड़छाड़, और उसी प्रक्रिया का प्रयोग कर, अतिरिक्त माप लेना, यह निर्धारित करने के लिए की क्या प्रणाली से छेड़छाड़ ने माप के मूल्यों में संशोधन किया हैइसके विपरीत, एक पर्यवेक्षणीय अध्ययन में प्रयोगात्मक हेरफेर शामिल नहीं है.इसके बजाय, डेटा एकत्रित किया जाता है और भविष्यवक्ताओं और प्रतिक्रिया के बीच के सह सम्बन्ध कि जाँच की जाती है.
 
एक प्रायोगिक अध्ययन का एक उदाहरण है प्रसिद्ध [[हावथोर्न स्टडीज|हावथोर्न प्रभाव]] ([[:en:Hawthorne studies|Hawthorne studies]]), जिसने पश्चिमी इलेक्ट्रिक कंपनी के हावथोर्न संयंत्र में कार्य परिवेश को बदलने का प्रयास किया.शोधकर्ता यह जानना चाहते थे कि क्या रोशनी में वृद्धि से श्रमिकों द्वारा [[कोडांतरण लाइन|असेम्बली लाइन]] ([[:en:assembly line|assembly line]]) पर की गई उत्पादकता में वृद्धि होगी .शोधकर्ताओं ने सबसे पहले तो इस प्लांट की उत्पादकता को नापकर, वहां के एक हिस्से की रोशनी में संशोधन किया और यह जाँच की, कि क्या रोशनी में परिवर्तन का उत्पादकता पर कोई प्रभाव पड़ा.यह उल्लेखनीय है कि वास्तव में, उत्पादकता (प्रयोगात्मक शर्तों के तहत) बेहतर निकली.(देखो [[हावथोर्न प्रभाव]] ([[:en:Hawthorne effect|Hawthorne effect]]).)हालांकि, इस अध्ययन की आज, प्रयोगात्मक प्रक्रियाओं में त्रुटियों के लिए आलोचना की जाती है, विशेष रूप से, [[नियंत्रण समूह]] ([[:en:control group|control group]]) की कमी और [[दोहरा|अंधेपन]] ([[:en:double-blind|blindness]]) के कारण.
 
पर्यवेक्षणीय अध्ययन का एक उदाहरण है, जो धूम्रपान और फेफड़े के कैंसर के बीच सहसंबंध का अन्वेषण करता है.इस प्रकार के अध्ययन में आम तौर पर, एक सर्वेक्षण की मदद से, जिस क्षेत्र में दिलचस्पी हो, उसके आंकडों को इकठ्ठा कर, उनका सांख्यिकीय विश्लेषण किया जाता है.इस मामले में, शोधकर्ताओं ने धूम्रपान करने वालों और न करने वाले, दोनों के आंकडों को इकट्ठा किया होगा, शायद [[मामले-नियंत्रण सम्बन्धी अध्ययन|केस-कंट्रोल अध्ययन]] ([[:en:case-control study|case-control study]]), के माध्यम से, और फिर प्रत्येक समूह में फेफड़ों के कैंसर के मामलों की संख्या ढूंढी होगी.
 
एक प्रयोग के बुनियादी कदम हैं;
# अनुसंधान की योजना, जिसमें शामिल हैं, सूचना स्त्रोत तय करना, अनुसन्धान के विषय का चयन, तथा प्रस्तावित अनुसंधान की विधि और [[नैतिकता|नैतिक]] विचार.
# [[प्रयोगों की डिजाइन|प्रयोगों के डिजाइन]] ([[:en:Design of experiments|Design of experiments]]) केंद्रित होगा सिस्टम मॉडल पर, और स्वतंत्र और आश्रित चरों की अंतःक्रिया पर.
# विस्तृत जानकारी को छुपाते हुए, [[सारांश सांख्यिकी|टिप्पणियों के संग्रह का सार् निकालना]] ([[:en:summary statistics|Summarizing a collection of observations]]), जिसमें उनकी समानताओं को चिन्हित किया गया हो.([[वर्णनात्मक सांख्यिकी|वर्णनात्मक आँकड़े]] ([[:en:Descriptive statistics|Descriptive statistics]]))
# दुनिया के बारे में अवलोकन पर [[सांख्यिकीय निष्कर्ष|टिप्पणियों]] ([[:en:statistical inference|the observations tell]]) के बारे में आम सहमति तक पहुंचना .([[सांख्यिकी निष्कर्ष]] ([[:en:Statistical inference|Statistical inference]]))
पंक्ति 94:
* पर्यावरण सांख्यिकी
* [[महामारी विज्ञान]] ([[:en:Epidemiology|Epidemiology]])
* [[भूगोल]] और [[भौगोलिक सूचना प्रणाली]] ([[:en:Geographic Information Systems|Geographic Information Systems]]), और विशेष रूप से [[स्थानिक विश्लेषण]] ([[:en:Spatial analysis|Spatial analysis]]) में
* [[छवि संसाधन]] ([[:en:Image processing|Image processing]])
* [[बहुभिन्नरूपी सांख्यिकी|बहुभिन्नरूपी विश्लेषण]] ([[:en:Multivariate statistics|Multivariate Analysis]])
पंक्ति 111:
</div>
 
आँकड़ों के साथ व्यापार में एक महत्वपूर्ण आधार उपकरण और विनिर्माण फार्म का.इसका उपयोग माप सिस्टम परिवर्तनीयता को समझने, नियंत्रण प्रक्रियाओं में (जैसे [[सांख्यिकीय प्रक्रिया नियंत्रण]] ([[:en:statistical process control|statistical process control]]) अथवा एस पी सी), डाटा का सारांश दिखने, तथा डाटा-संचालित निर्णय लेने के लिए किया जाता है. इन भूमिकाओं में यह एक प्रमुख यंत्र है, और शायद अकेला विश्वसनीय उपकरण भी है.
 
== दुरुपयोग ==
पंक्ति 120:
एक निश्चित नमूने को चुनकर, (या, खारिज या संशोधित कर), परिणाम में फेर-बदल किया जा सकता है.जरूरी नहीं कि इस तरह का जोड़तोड़ दुर्भावनापूर्ण अथवा कुटिलतापूर्ण हो; यह शोधकर्ता के अनभिप्रेत पक्षपात से उत्पन्न हो सकता है.डेटा का सारांश देने वाले ग्राफ भी गुमराह करने वाले हो सकते हैं.
 
इस तथ्य की गहन आलोचना हुई है कि परिकल्पना परीक्षण का वह दृष्टिकोण, जिसका व्यापक रूप से प्रयोग किया जाता है, और जो कई मामलों में कानून या विनियम के द्वारा आवश्यक है, एक परिकल्पना ([[रिक्त परिकल्पना|शून्य परिकल्पना]] ([[:en:null hypothesis|null hypothesis]])) की "तरफदारी" करता है, और यह एक बड़े अध्ययन में, किसी मामूली अन्तर के महत्त्व को भी बढ़ा-चढा कर दिखा सकता है.एक ऐसा फर्क जो उच्च सांख्यिकीय महत्त्व का हो, तब भी हो सकता है कि वह बिना किसी व्यावहारिक महत्व का हो.(देखें [[हाइपोथीसिस परीक्षण#आलोचना|परिकल्पना परीक्षण की आलोचना]] ([[:en:Hypothesis test#Criticism|criticism of hypothesis testing]]) और [[रिक्त परिकल्पना#विवाद|शून्य परिकल्पना पर विवाद]] ([[:en:Null hypothesis#Controversy|controversy over the null hypothesis]]).)
 
यह आम रिपोर्ट, कि एक परिकल्पना को, महत्व के दिए गए स्तर पर नकार दिया गया, इससे अच्छी प्रतिक्रिया वह होगी, जिसमें [[पी-मूल्य|''पी''-मूल्य]] ([[:en:p-value|''p''-value]]) पर ज्यादा महत्त्व दिया गया हो.यह ''पी''-मूल्य, बहरहाल, इस प्रभाव के आकार को नहीं दर्शाता.एक दूसरा आम दृष्टिकोण है [[विश्वास का अंतराल|विश्वास के अंतराल]] ([[:en:confidence interval|confidence interval]]) का वर्णन देना.हालांकि यह भी उन्ही गणनाओं से प्राप्त होते हैं जैसे परिकल्पना-टेस्टस अथवा ''पी''-मूल्य, वे इस प्रभाव के आकार और उसके आस-पास की अनिश्चितता, दोनों का वर्णन भी करते हैं.