"खेल सिद्धांत": अवतरणों में अंतर

छो r2.7.2+) (Robot: Adding be:Тэорыя гульняў
छो Robot: Interwiki standardization; अंगराग परिवर्तन
पंक्ति 1:
'''खेल सिद्धांत''' या '''गेम थ्योरी''' (<small>game theory</small>) [[व्यवहारिक गणित]] की एक शाखा है जिसका प्रयोग [[समाज विज्ञान]], [[अर्थशास्त्र]], [[जीव विज्ञान]], [[इंजीनियरिंग]], [[राजनीति विज्ञान]], [[अंतर्राष्ट्रीय संबंध]], [[कम्प्यूटर साइंस]] और [[दर्शन]] में किया जाता है. खेल सिद्धांत कूटनीतिक परिस्थितियों में (जिसमें किसी के द्वारा विकल्प चुनने की सफलता दूसरों के चयन पर निर्भर करती है) व्यवहार को बूझने का प्रयास करता है. यूँ तो शुरू में इसे उन प्रतियोगिताओं को समझने के लिए विकसित किया गया था जिनमें एक व्यक्ति का दूसरे की गलतियों से फायदा होता है ([[ज़ीरो सम गेम्स]]), लेकिन इसका विस्तार ऐसी कई परिस्थितियों के लिए करा गया है जहाँ अलग-अलग क्रियाओं का एक-दूसरे पर असर पड़ता हो. आज, "गेम थ्योरी समाज विज्ञान के तार्किक पक्ष के लिए एक छतरी या 'यूनीफाइड फील्ड' थ्योरी की तरह है जिसमें 'सामाजिक' की व्याख्या मानव के साथ-साथ दूसरे खिलाड़ियों (कम्प्युटर, जानवर, पौधे) को सम्मिलित कर की जाती है.{{harv|Aumann|1987}}
 
गेम थ्योरी के पारंपरिक अनुप्रयोगों में इन गेमों में साम्यवास्थाएं खोजने का प्रयास किया जाता है. साम्यावस्था में गेम का प्रत्येक खिलाड़ी एक नीति अपनाता है जो वह संभवतः नहीं बदलता है. इस विचार को समझने के लिए [[साम्यावस्था की कई सारी अवधारणाएं]] विकसित की गई हैं (सबसे प्रसिद्ध [[नैश इक्विलिब्रियम]]). साम्यावस्था के इन अवधारणाओं की अभिप्रेरणा अलग-अलग होती है और इस बात पर निर्भर करती है कि वे किस क्षेत्र में प्रयोग की जा रहीं हैं, हालांकि उनके मायने कुछ हद तक एक दूसरे में मिले-जुले होते हैं और मेल खाते हैं. यह पद्धति आलोचना रहित नहीं है और साम्यावस्था की विशेष अवधारणाओं की उपयुक्तता पर, साम्यवास्थाओं की उपयुक्तता पर, और आमतौर पर गणितीय मॉडलों की उपयोगिता पर वाद-विवाद जारी रहते हैं.
 
हालांकि इसके पहले हो इस क्षेत्र में कुछ विकास चुके थे, गेम थ्योरी का क्षेत्र [[जॉन वॉन न्युमन्न]] और [[ऑस्कर मॉर्गनस्टर्न]] की 1944 की पुस्तक ''[[थ्योरी ऑफ गेम्स ऐंड इकोनोमिक बिहेविअर]]'' के साथ आस्तित्व में आया. इस सिद्धांत का विकास बड़े पैमाने पर 1950 के दशक में कई विद्वानों द्वारा किया गया. बाद में गेम थ्योरी स्पष्टतया 1970 के दशक में जीव विज्ञान में प्रयुक्त किया गया, हांलाकि ऐसा 1930 के दशक में ही शुरू हो चुका था. गेम थ्योरी की पहचान व्यापक रूप से कई क्षेत्रों में एक महत्वपूर्ण उपकरण के रूप में की गई है. आठ गेम थ्योरिस्ट्स अर्थशास्त्र में [[नोबेल पुरस्कार]] जीत चुके हैं, और [[जॉन मेनार्ड स्मिथ]] को गेम थ्योरी के जीव विज्ञान में प्रयोग के लिए [[क्रफूर्ड पुरस्कार]] से सम्मानित किया गया.
 
== गेमों का निरूपण ==
{{seealso|List of games in game theory}}
गेम थ्योरी में अवलोकित गेम स्पष्टतया परिभाषित गणितीय 'ऑब्जेक्ट्स'होते हैं. एक गेम [[खिलाड़ियों]] के एक सेट, खिलाड़ियों के पास उपलब्ध चालों (नीतियों) के एक सेट और [[नीतियों]] के प्रत्येक संयोजन के लाभ के निर्धारण से बना होता है. अधिकांश 'कोऑपरेटिव गेम'(परस्पर सहयोग वाले गेम) विशेष फंक्शन फॉर्म में निरूपित किए जाते हैं, जबकि एक्सटेंसिव और नॉर्मल फॉर्म का प्रयोग नॉनकोऑपरेटिव गेमों (गेम जिनमें परस्पर सहयोग नहीं होता)को परिभाषित करने में होता है.
 
=== एक्सटेंसिव फॉर्म ===
पंक्ति 14:
एक्सटेंसिव फॉर्म का प्रयोग कुछ महत्वपूर्ण अनुक्रम वाले गेमों को 'फॉर्मलाइज़' करने में किया जा सकता है. इसमें गेम अक्सर '[[ट्रीज़]]' के रूप में निरूपित किए जाते हैं(जैसा कि बायीं तरफ की तस्वीर में दिखाया गया है) यहां प्रत्येक [[वर्टेक्स (शिखर)]] (या नोड) एक खिलाड़ी के लिए विकल्प की एक बिंदु दर्शाता है. खिलाड़ी 'वर्टेक्स' द्वारा सूचीबद्ध एक संख्या द्वारा निर्दिष्ट किया जाता है. वर्टेक्स से बाहर निकली रेखाएं उस खिलाड़ी के एक संभाव्य क्रिया को दर्शाती हैं. लाभ (परिणाम) ट्री के निचले हिस्से में निर्दिष्ट किए जाते हैं.
 
यहां चित्रित गेम में दो खिलाड़ी दिखाए गए हैं. ''खिलाड़ी 1'' पहले चाल चलता है और या तो ''F'' या ''U'' चुनता है. ''खिलाड़ी 2'' ''खिलाड़ी 1'''की चाल को देखता है और फिर ''या (or)'' तो A या R चुनता है''' '' '''. ''मानें कि'' खिलाड़ी 1 U ''चुनता'' है ''और फिर'' खिलाड़ी 2 A ''चुनता'' है, ''तब'' खिलाड़ी 1, ''8 पाता है और'' खिलाड़ी 2, ''2 पाता है'' .'''
 
एक्सटेंसिव फॉर्म, वैसे गेम जिनमें दोनों चालें एक साथ नहीं चली जातीं, और ऐसे गेम [[जिनमे जानकारी पक्की नहीं होती]], इन दो प्रकार के गेमों की भी व्याख्या कर सकता है. इसे निरूपित करने के लिए विभिन्न वर्टेक्सों को- उन्हें एक ही [[सूचना सेट]] का हिस्सा दिखाने के लिए (यानी खिलाड़ी यह नहीं जानते कि वो किस बिंदु पर हैं)- या तो एक बिंदीदार(डॉटेड) रेखा से जोड़ा जाता है, या उनके दरम्यान एक बंद(क्लोज्ड) रेखा खींची जाती है.
पंक्ति 32:
 
{{main|Normal-form game}}
नॉर्मल (या स्ट्रेटीजिक फॉर्म) आमतौर पर एक [[मेट्रिक्स]] के द्वारा निरूपित किया जाता है जिसमें खिलाड़ी,चालें, और लाभ अंकित रहते हैं(दायीं और स्थित उदाहरण को देखें). आम तौर पर यह किसी ऐसे फंक्शन के द्वारा निरूपित किया जा सकता है जो प्रत्येक खिलाड़ी के चालों के सभी संयोजनों के लाभ से सम्बद्ध रहता है. साथ में दिए गए उदाहरण में दो खिलाड़ी हैं; एक रो का चयन करता है और दूसरा कॉलम का. प्रत्येक खिलाड़ी के पास दो रणनीतियां हैं जो रो और कॉलमों की संख्या के द्वारा निर्दिष्ट की गईं हैं. लाभ अन्दर में दिए गए हैं. पहली संख्या रो वाले खिलाड़ी (हमारे उदाहरण में खिलाड़ी 1)को प्राप्त लाभ है; दूसरी संख्या कॉलम वाले खिलाड़ी (हमारे उदाहरण में खिलाड़ी 2) को प्राप्त लाभ है. मानें कि अगर खिलाड़ी 1 '''ऊपर''' चलता है खिलाड़ी 2 '''बाएं''' चलता है. तब खिलाड़ी 1 को 4 लाभ प्राप्त होता है, और खिलाड़ी 2 को 3 प्राप्त होता है.
 
जब एक खेल नार्मल फॉर्म में प्रस्तुत किया जाता है, यह माना जाता है कि प्रत्येक खिलाड़ी एक साथ चाल चलते हैं या कम से कम दूसरे के चालों से अनभिज्ञ होते हैं. यदि खिलाड़ियों को एक दूसरे के विकल्पों की कोई जानकारी होती है तो गेम को आम तौर पर एक्सटेंसिव फॉर्म में प्रस्तुत किया जाता है.
 
=== कैरेक्टरिस्टिक फंक्शन फॉर्म ===
पंक्ति 40:
[[हस्तांतरणीय उपयोगिता]]वाले [['कोऑपरेटिव' गेमों]] में कोई भी स्वतंत्र अलग लाभ नहीं दिए रहते हैं. इसके बजाय, कैरेक्टरिस्टिक फंक्शन प्रत्येक गठबंधन के लिए लाभ निर्धारित करता है. मानक धारणा यह है कि खाली गठबंधन को 0 लाभ प्राप्त होता है.
 
इस फॉर्म का प्रारम्भिक स्रोत [[वॉन न्युमन्न]] और [[मॉर्गनस्टर्न]] की आधारभूत पुस्तक से प्राप्त होता है. उन्होंने कोअलिशनल(गठबंधनीय) [[नॉर्मल फॉर्म गेमों]] का अध्ययन करते समय यह माना(कल्पना किया)कि जब एक गठबंधन <math>C</math>C बनता है, यह संपूरक गठबंधन (<math>N\setminus C</math>N\setminus C) के विरूद्ध खेलता है जैसे कि वो 2 खिलाड़ियों वाला गेम खेल रहे हों. <math>C</math>C का साम्यावस्था लाभ ''[[कैरेक्टरिस्टिक]]'' होता है. अब नॉर्मल फॉर्म गेमों से कोअलिशनल(गठबंधनीय) मान निकालने के लिए विभिन्न मॉडल हैं, पर कैरेक्टरिस्टिक फॉर्म के सारे गेम नॉर्मल फॉर्म गेमों से व्युत्त्पन्न नहीं किए जा सकते.
 
नियमानुसार, एक कैरेक्टरिस्टिक फंक्शन फॉर्म गेम (TU-गेम नाम से भी ज्ञात) एक पेयर <math>(N,v)</math> के रूप में निरूपित किया जाता है जहां <math> N</math> खिलाड़ियों के एक सेट को व्यक्त करता है और <math>v:2^N\longrightarrow\mathbb{R}</math> एक कैरेक्टरिस्टिक फंक्शन होता है.
 
कैरेक्टरिस्टिक फंक्शन फॉर्म बिना [[हस्तांतरणीय उपयोगिता]] के अनुमार्गन वाले गेमों में सामान्यीकृत किया गया है.
 
=== पार्टीशन फंक्शन फॉर्म ===
पंक्ति 51:
== अनुप्रयोग और चुनौतियां ==
 
गेम थ्योरी का प्रयोग मानव और पशु के विविध व्यवहारों के विस्तृत अध्ययन में किया गया है. शुरू में यह [[अर्थशास्त्र]] में आर्थिक व्यवहार के एक बड़े संग्रह को समझने के लिए विकसित किया गया था, जिनमें कंपनियों, बाज़ारों, और उपभोगेम थ्योरी के व्यवहार शामिल हैं. सामाजिक विज्ञान में गेम थ्योरी का उपयोग और विस्तृत हुआ है, और गेम थ्योरी राजनीतिक, सामाजिक और मनोवैज्ञानिक व्यवहारों के अध्ययन में भी प्रयुक्त हुआ है.
 
गेम थ्योरी आधारित विश्लेषण का उपयोग शुरू में 1930 के दशक में [[रोनाल्ड फिशर]] ने पशुओं के व्यवहार का अध्ययन करने के लिए किया था(यद्यपि [[चार्ल्स डार्विन]] तक ने भी कुछ अनौपचारिक गेम थ्योरी आधारित वक्तव्य दिए हैं). यह काम "गेम थ्योरी" के नाम के आस्तित्व में आने से पहले का है, लेकिन इसकी और गेम थ्योरी की कई विशेषताएं समान हैं. अर्थशास्त्र में हुए इसके विकास का बाद में जीव विज्ञान में प्रयोग[[जॉन मेनर्ड स्मिथ]] ने अपनी पुस्तक ''[[इवोल्यूशन ऐंड द थ्योरी ऑफ़ गेम्स]]'' में किया.
 
व्यवहार के अनुमान और व्याख्या के अलावा गेम थ्योरी का प्रयोग नैतिक या मानक व्यवहार के सिद्धांतों को विकसित करने के प्रयास में भी किया गया है. अर्थशास्त्र और [[दर्शनशास्त्र]] में, विद्वानों ने गेम थ्योरी को अच्छे या उचित व्यवहार को समझने में भी प्रयुक्त किया है. अगर हम पीछे जाएं तो देख सकते है कि गेम थ्योरी आधारित इस प्रकार के भावार्थ को [[प्लेटो]] ने भी प्रस्तुत किया था.<ref>{{cite web |url=http://plato.stanford.edu/archives/spr2008/entries/game-theory/ |title=Game Theory |accessdate=2008-08-21 |last=Ross |first=Don |date= |work=The Stanford Encyclopedia of Philosophy (Spring 2008 Edition) |publisher=Edward N. Zalta (ed.)}}</ref>
 
=== राजनीति विज्ञान ===
[[राजनीति विज्ञान]] में गेम थ्योरी का प्रयोग [[निष्पक्ष विभाजन]], [[राजनीतिक अर्थव्यवस्था, सार्वजनिक चयन/विकल्प, युद्ध सौदेबाजी, सकारात्मक राजनीतिक सिद्धांत, और सामाजिक पसंद सिद्धांत|राजनीतिक अर्थव्यवस्था[[, [[सार्वजनिक चयन/विकल्प]], [[युद्ध सौदेबाजी]], [[सकारात्मक राजनीतिक सिद्धांत]], और [[सामाजिक पसंद सिद्धांत]]]]]] के अतिव्यापी क्षेत्रों पर केन्द्रित है. इन क्षेत्रों में से प्रत्येक में, शोधकर्ताओं ने गेम थ्योरी आधारित मॉडलों को विकसित किया है जिनमें खिलाड़ी अक्सर मतदाता, राज्य, स्पेशल इनटेरेस्ट ग्रुप, और राजनीतिज्ञ होते हैं.
 
राजनीति विज्ञान में प्रयुक्त गेम थ्योरी के आरंभिक उदाहरणों के लिए [[एंथनी डाउंस]] का कार्य देखें. अपनी पुस्तक [[ऐन इकोनोमिक थ्योरी ऑफ़ डेमोक्रसी]]{{harvard citations|last1=Downs|year=1957}} में उन्होंने '[[होटलिंग फर्म लोकेशन (स्थिति)मॉडल]]'को राजनीतिक प्रणाली में प्रयुक्त किया है. डाउनसियन मॉडल में, राजनीतिक उम्मीदवार सिद्धांतों के प्रति एक आयामी नीति 'स्पेस' में प्रतिबद्ध होते हैं. सिद्घांतकार दर्शाते हैं कि किस तरह से राजनीतिक उम्मीदवार औसत मतदाताओं की पसंदीदा विचारधारा की ओर अभिसरित होंगे. बिलकुल ताज़ा उदाहरणों के लिए [[स्टीवन ब्राम्स]], [[जॉर्ज ट्सेबेलिस]], [[जीन एम. ग्रॉसमैन]] और [[एल्हानन हेल्पमैन]] की या [[डेविड ऑस्टेन-स्मिथ]] और [[जेफ्री एस. बैंक्स]] की पुस्तकें देखें.
 
[[लोकतांत्रिक शांति]] की एक खेल-सैद्धांतिक व्याख्या यह है कि जनता और लोकतंत्र की मुक्त बहस अपने इरादों से संबंधित स्पष्ट और विश्वसनीय जानकारी दूसरे राज्यों को भेजते हैं. इसके विपरीत, गैर-लोकतांत्रिक नेताओं के इरादों का पता लगाना कठिन है कि कौन-कौन सी रियायतें लागू होंगी और क्या वादों को पूरा किया जाएगा. इस तरह रियायतें प्रदान करने के प्रति अविश्वास और अनिच्छा होगी यदि विवादाधीन दलों में से कम से कम एक दल गैर-लोकतंत्र {{harvard citations| last1=Levy | last2=Razin| year=2003}} है.
पंक्ति 70:
खिलाड़ियों की व्यक्तिगेम थ्योरी [[उपयोगिता]] का प्रतिनिधित्व करने के लिये सामान्यतः खेल के मुनाफ़े को लिया जाता है. आदर्श स्थितियों में मुनाफ़ा अक्सर धन का प्रतिनिधित्व करता है, जो संभवतः किसी व्यक्ति की उपयोगिता से संबंधित होता है. हालांकि यह धारणा त्रुटिपूर्ण हो सकती है.
 
अर्थशास्त्र में गेम थ्योरी पर एक प्रतिमानात्मक शोधपत्र किसी ऐसे खेल की प्रस्तुति के द्वारा प्रारंभ होता है, जो किसी विशिष्ट आर्थिक स्थिति का संक्षेपण हो. एक या एक से अधिक समाधान अवधारणायें चुनी जाती हैं और लेखक यह प्रदर्शित करता है कि प्रस्तुत खेल में रणनीति के कौन-से समुच्चय उपयुक्त प्रकार के संतुलन में है. स्वाभाविक रूप से हमें यह आश्चर्य हो सकता है कि इस जानकारी का क्या उपयोग किया जाए. अर्थशास्त्री और व्यापारिक प्रोफेसर दो प्राथमिक उपयोगों का सुझाव देते हैं: ''वर्णनात्मक'' और ''आदेशात्मक'' .
 
==== वर्णनात्मक ====
पंक्ति 78:
वैकल्पिक रूप से, कुछ लेखक दावा करते हैं कि नैश संतुलन मानव आबादियों के लिये पूर्वानुमान नहीं प्रदान करते, बल्कि वे इस बात की व्याख्या करते हैं कि नैश संतुलनों से खेलने वाली आबादियां उस अवस्था में ही क्यों बनी रहतीं हैं. हालांकि यह सवाल फ़िर भी खुला रहता है कि आबादियां उस बिंदु तक कैसे पहुंचतीं हैं.
 
अपनी चिंताओं के समाधान के लिये कुछ सिद्धांतकार [[विकासवादी गेम थ्योरी]] की ओर मुड़ गये हैं. ये प्रतिमान या तो खिलाड़ियों के लिये कोई तार्किकता नहीं मानते या [[परिबद्ध तार्किकता]] मानते हैं. अपने नाम के बावजूद विकासवादी गेम थ्योरी आवश्यक रूप से जैविक अर्थ में [[प्राकृतिक चयन]] को नहीं मानता. विकासवादी गेम थ्योरी जैविक और साथ ही सांस्कृतिक विकास तथा व्यक्तिगेम थ्योरी शिक्षा के प्रतिमान (उदाहरणार्थ [[काल्पनिक खेल]] गेम थ्योरी िविज्ञान) दोनों को शामिल करता है.
 
==== आदेशात्मक या निर्देशात्मक विश्लेषण ====
पंक्ति 86:
1D = Defect | DL = 0, -10 | DR = -5, -5 }}
 
दूसरी ओर, कुछ विद्वान गेम थ्योरी को मनुष्यों के व्यवहार के लिये एक भविष्यसूचक उपकरण के रूप में नहीं, बल्कि इस बात के एक सुझाव के रूप में देखते हैं कि लोगों को किस प्रकार का व्यवहार करना चाहिये. चूंकि किसी खेल का एक [[नैश संतुलन]] अन्य खिलाड़ियों की गेम थ्योरी िविधियों के प्रति व्यक्ति की [[सर्वश्रेष्ठ प्रतिक्रिया]] का निर्माण करता है, अतः ऐसी चाल चलना उपयुक्त प्रतीत होता है, जो नैश संतुलन का एक भाग हो. हालांकि, गेम थ्योरी के लिए यह प्रयोग भी आलोचना के अंतर्गेम थ्योरी आ गया है. सबसे पहले, कुछ मामलों में गैर-संतुलन रणनीति का प्रयोग करना तब उपयुक्त होता है, जब व्यक्ति को अन्य खिलाड़ियों द्वारा भी एक गैर-संतुलन रणनीति का प्रयोग करने की उम्मीद हो. एक उदाहरण के लिये, [[औसत का 2/3 अनुमान]] देखें.
 
दूसरा, [[क़ैदी का असमंजस (Prisoner's dilemma)]] एक अन्य संभावित प्रति-उदाहरण प्रस्तुत करता है. कैदी का असमंजस में, अपने स्वार्थ की पूर्ति का प्रयास करते हुए प्रत्येक खिलाड़ी दोनों खिलाड़ियों को उससे बुरी स्थिति में ले आता है, जिसमें वे अपने स्वार्थ की पूर्ति का प्रयास न करने पर रहे होते.
पंक्ति 96:
1D = Dove | DL = 0, 2v | DR = v, v }}
 
अर्थशास्त्र के विपरीत, [[जीवविज्ञान]] में खेलों के लिये लाभ की व्याख्या अक्सर [[योग्यता]] के संबंध में की जाती है. इसके अतिरिक्त तार्किकता के विचार से संबंधित [[संतुलनों]] पर कम और [[विकासवादी]] शक्तियों द्वारा बनाये रखे जा सकने वाले संतुलनों पर ज़्यादा ध्यान केंद्रित किया जाता रहा है. जीवविज्ञान में ज्ञात सर्वश्रेष्ठ संतुलन को ''[[विकासवादी स्थिर रणनीति (Evolutionary Stable Strategy]]'' [अथवा ESS]) के रूप में जाना जाता है और इसे सबसे पहले {{harv|Smith|Price|1973}} में प्रस्तुत किया गया था. हालांकि इसकी प्रारंभिक प्रेरणा में [[नैश संतुलन]] की कोई भी मानसिक आवश्यकता शामिल नहीं थी, लेकिन प्रत्येक ESS एक नैश संतुलन होता है.
 
जीव विज्ञान में, गेम थ्योरी का उपयोग अनेक भिन्न तथ्यों को समझने में किया गया है. सबसे पहले इसका उपयोग 1:1 [[लिंग अनुपात]] की उत्पत्ति (और स्थिरता) की व्याख्या करने के लिये किया गया था.{{harv|Fisher|1930}} ने यह सुझाव दिया कि 1:1 लिंग अनुपात उन व्यक्तियों पर कार्य कर रही विकासवादी शक्तियों का परिणाम हैं, जिन्हें अपने पौत्रों की संख्या को अधिकतम स्तर तक बढ़ाने का प्रयास करनेवालों के रूप में देखा जा सकता है.
पंक्ति 104:
क्षेत्रीयता और लड़ाई के व्यवहार का विश्लेषण करने के लिये जीव-विज्ञानियों ने [[चूज़ों के खेल]] का प्रयोग किया है. {{Citation needed|date=May 2009}}
 
''खेलों की उत्पत्ति और सिद्धांत (Evolution and the theory of Games)'' की प्रस्तावना में मेनार्ड स्मिथ लिखते हैं, “[वि]रोधाभासी रूप से, यह पाया गया है कि गेम थ्योरी अर्थशास्त्रीय व्यवहार के क्षेत्र, जिसके लिये वह मूल रूप से बनाया गया था, की बजाय जीवविज्ञान पर ज़्यादा अच्छी तरह लागू होता है”. विकासवादी गेम थ्योरी का प्रयोग प्रकृति में असंगेम थ्योरी प्रतीत होने वाले अनेक तथ्यों की व्याख्या करने के लिये किया जाता रहा है.<ref name="stan-egt">[http://plato.stanford.edu/entries/game-evolutionary/ विकासवादी गेम थ्योरी (स्टैनफोर्ड इनसाइक्लोपीडिया ऑफ़ फिलॉस्फी)]</ref>
 
ऐसे ही एक तथ्य को जैविक परोपकारिता कहते हैं. यह एक ऐसी स्थिति है, जिसमें एक जीव ऐसी पद्धति से कार्य करता हुआ दिखाई देता है, जो अन्य जीवों के लिये लाभदायक और स्वयं उसके लिये अहितकर होती है. यह परोपकारिता की पारंपरिक धारणा से भिन्न है, क्योंकि ऐसे कार्य सचेतन नहीं होते, बल्कि सकल योग्यता को बढ़ाने के लिये विकासवादी अनुकूलन के रूप में दिखाई देते हैं. इसके उदाहरण पिशाच चमगादड़ों, जो रात के शिकार से हासिल किये गये खून को उगलकर अपने समूह के उन सदस्यों को दे देते हैं, जो शिकार कर पाने में असफल रहे हों, से लेकर कर्मी मधुमक्खियों, जो आजीवन रानी मधुमक्खी की सेवा करती हैं और कभी मिलन नहीं करतीं, से लेकर वर्वेट बंदरों, जो समूह के सदस्यों को शिकारी के आगमन की चेतावनी देते हैं, भले ही इससे उनका स्वयं का जीवन ख़तरे में पड़ जाये, तक में पाये जा सकते हैं.<ref name="qudzyh">[http://www.seop.leeds.ac.uk/entries/altruism-biological/ जैव परोपकारिता (स्टैनफोर्ड इनसाइक्लोपीडिया ऑफ़ फिलॉस्फी)]</ref> इनमें से सभी कार्य एक समूह की सकल योग्यता को बढ़ाते हैं, लेकिन ऐसा करने के लिये एक जीव को अपनी जान गंवानी पड़ती है.
 
विकासवादी गेम थ्योरी इस परोपकारिता की व्याख्या [[संबंधियों के चयन]] के विचार के रूप में करता है. परोपकारी जीव उन प्राणियों के बीच भेद-भाव करते हैं, जिनकी वे सहायता करते हैं और वे अपने संबंधियों का पक्ष लेते हैं. हैमिल्टन का नियम इस चयन के पीछे विकासवादी तर्क की व्याख्या सूत्र c<b*r के द्वारा करता है, जहां परोपकारी को लगनेवाली लागेम थ्योरी (c) प्राप्तकर्ता को मिलनेवाले लाभ (b) व संबद्धता के गुणांक (r) के गुणनफल से कम होनी चाहिये. दो जीवों के बीच निकटता जितनी अधिक होगी, परोपकारिता की घटनायें भी उतनी ही बढ़ जाएंगी क्योंकि उनके अनेक जिनेटिक तत्व (alleles) समान होंगे. इसका अर्थ यह है कि परोपकारी जीव, इस बात को सुनिश्चित करते हुए कि उसके निकट संबंधियों के जेनेटिक तत्व आगे प्रसारित होते हैं, (उसकी संतान के द्वारा), स्वयं की संतान को जन्म देने के विकल्प का त्याग कर सकता है क्योंकि समान संख्या में जेनेटिक तत्व आगे प्रसारित हुए हैं. उदाहरणार्थ, किसी सहोदर की सहायता करने का गुणांक 1/2 होता है क्योंकि जीव अपने सहोदर की संतान में 1/2 जेनेटिक तत्व साझा करता है. इस बात को सुनिश्चित कर लेना कि किसी सहोदर की संतानों की पर्याप्त संख्या वयस्क होने तक जीवित रहती है, परोपकारी व्यक्ति के लिये स्वयं की संतान उत्पन्न करने की आवश्यकता को समाप्त कर देता है.<ref name="qudzyh" /> गुणांक मान खेल के मैदान के दायरे पर अत्यधिक आश्रित होते हैं: उदाहरणार्थ, जिनके प्रति पक्षपात करना है, उनके चुनाव में यदि सभी जेनेटिक जीवित वस्तुएं, केवल संबंधी नहीं, शामिल हों, तो हम मानते हैं कि सभी मनुष्यों के बीच अंतर खेल के मैदान में विविधता का लगभग 1% होता है, जो गुणांक एक छोटे क्षेत्र में 1/2 था, वह 0.995 हो जाता है. इसी प्रकार यदि इस पर विचार किया जाये कि जेनेटिक स्वरूप की किसी सूचना के अतिरिक्त कोई अन्य सूचना (उदा. एपिजेनेटिक्स, धर्म, विज्ञान आदि) समय के साथ बनी रहती है, तो खेल का मैदान और बड़ा व भेद-भाव छोटे हो जाते हैं.
 
=== कंप्यूटर विज्ञान और तर्क ===
[[तर्क]] और [[कंप्यूटर विज्ञान]] में गेम थ्योरी एक बढ़ती हुई महत्वपूर्ण भूमिका निभाने लगा है. अनेक तार्किक सिद्धांतों का आधार [[खेल अर्थविज्ञान]] में है. इसके अतिरिक्त, कंप्यूटर वैज्ञानिकों ने अनेक [[अंतःक्रियात्मक गणनाओं]] का निर्माण करने के लिये खेलों का प्रयोग किया है. साथ ही, गेम थ्योरी [[बहु-अभिकर्ता तंत्रों]] के क्षेत्र का एक सैद्धांतिक आधार प्रदान करता है.
 
पृथक रूप से, गेम थ्योरी ने [[ऑनलाइन एल्गोरिथ्म]] में भी भूमिका निभाई है. विशिष्टतः, [[k-सर्वर समस्या]], जिसका उल्लेख अतीत में ''चल-लागेम थ्योरी वाले खेल (games with moving costs)'' और ''निवेदन-उत्तर खेल (request-answer games)'' के रूप में किया जाता था.{{harvard citations| last1=Ben David | last2=Borodin | last3=Karp | last4=Tardos| last5=Wigderson | year=1994}} [[याओ का सिद्धांत]] [[यादृच्छिकृत एल्गोरिथ्म]], और विशेषतः ऑनलाइन एल्गोरिथ्म, की [[गणनात्मक जटिलता]] की निचली सीमाओं को सिद्ध करने के लिये एक खेल-सैद्धांतिक तकनीक है.
 
एल्गोरिथ्मिक गेम थ्योरी का क्षेत्र जटिलता और [[एल्गोरिथ्म की रचना]] की [[कंप्यूटर विज्ञान]] की अवधारणाओं को गेम थ्योरी और आर्थिक सिद्धांत के साथ संयोजित करता है. इंटरनेट के उद्भव ने खेलों, बाज़ारों, गणनात्मक नीलामियों, पीयर-से-पीयर तंत्रों और सुरक्षा तथा सूचना बाज़ार में संतुलनों की ख़ोज करने के लिये एल्गोरिथ्म के विकास को प्रेरित किया है.<ref name="algorithmic-game">{{cite book|url=http://www.cambridge.org/journals/nisan/downloads/Nisan_Non-printable.pdf|title=Algorithmic Game Theory}}</ref>
पंक्ति 135:
=== सहकारी या गैर-सहकारी ===
{{main|Cooperative game|Non-cooperative game}}
एक खेल ''सहकारी'' होता है, यदि खिलाड़ी बंधनकारी प्रतिबद्धताओं का निर्माण कर पाने में सक्षम हों. उदाहरण के लिये कानूनी तंत्र उनके लिये अपने वचनों का पालन करना आवश्यक बनाता है. गैर-सहकारी खेलों में यह संभव नहीं होता.
 
अक्सर ऐसा माना जाता है कि सहकारी खेलों में खिलाड़ियों के बीच ''संवाद'' की अनुमति दी जाती है, लेकिन गैर-सहकारी खेलों में नहीं. यह वर्गीकरण दो द्विआधारी कसौटियों के आधार पर अस्वीकार कर दिया गया है.{{harv|Harsanyi|1974}}
 
खेल के दो प्रकारों में से, गैर-सहकारी खेल सर्वश्रेष्ठ विवरणों तक परिस्थितियों के प्रदर्शन में सक्षम होते हैं और सटीक परिणाम उत्पन्न करते हैं. सहकारी खेल व्यापक रूप से खेल पर केंद्रित होते हैं. इन दो मार्गों को जोड़ने के लक्षणीय प्रयास किये गये हैं. तथाकथित नैश-प्रोग्राम {{Clarify me|date=April 2009}} ने पहले ही अनेक सहकारी स्थितियों को गैर-सहकारी संतुलनों के रूप में स्थापित कर दिया है.
 
''संकरित'' खेलों में सहकारी व गैर-सहकारी तत्व होते हैं. उदाहरण के लिये [[सहकारी खेलों]] में खिलाड़ियों के गठबंधन बनाये जाते हैं, लेकिन वे एक गैर-सहकारी शैली में खेलते हैं.
 
=== सममित और असममित ===
पंक्ति 169:
{{main|Sequential game}}
 
[[समकालिक खेल]] ऐसे खेल होते हैं, जिनमें दोनों खिलाड़ी अपनी चाल एक साथ चलते हैं, या यदि वे एक साथ चाल नहीं चलते, तो बाद वाले खिलाड़ी पहले खेलनेवाले खिलाड़ियों की चाल से अनभिज्ञ होते हैं (जो उन्हें ''प्रभावी रूप से'' समकालिक बनाता है). [[आनुक्रमिक खेल]] (या गेम थ्योरी शील खेल) ऐसे खेल होते हैं, जिनमें बाद में खेलनेवाले खिलाड़ियों को पूर्ववर्ती चालों की कुछ जानकारी होती है. यह आवश्यक रूप से पूर्ववर्ती खिलाड़ियों की प्रत्येक गेम थ्योरी िविधि की [[पूर्ण जानकारी]] नहीं होती; यह बहुत थोड़ी जानकारी हो सकती है. उदाहरण के लिये, संभव है कि कोई खिलाड़ी यह जानता हो कि किसी पूर्ववर्ती खिलाड़ी ने कोई विशिष्ट चाल नहीं चली थी, जबकि वह यह न जानता हो कि पहले खिलाड़ी ने अन्य उपलब्ध चालों में से वस्तुतः कौन-सी चाल चली थी.
 
समकालिक और आनुक्रमिक खेलों में मुख्य अंतर ऊपर चर्चित विभिन्न प्रदर्शनों में सम्मिलित किये गये हैं. अक्सर, समकालिक खेलों को दर्शाने के लिये [[सामान्य रूप]] का और आनुक्रमिक खेलों को दर्शाने के लिये [[विस्तृत रूप]] का प्रयोग किया जाता है; हालांकि, तकनीकी रूप से यह कोई सख़्त नियम नहीं है.
पंक्ति 184:
{{main|Determinacy}}
 
अर्थशास्त्रियों और वास्तविक-विश्व के खिलाड़ियों द्वारा अध्ययन किये जाने वाले खेल सामान्यतः चालों की सीमित संख्या में समाप्त हो जाते हैं. शुद्ध गणितज्ञ उतने बाध्य नहीं होते और [[समुच्चय सिद्धांतकार]] विशिष्टतः उन खेलों का अध्ययन करते हैं, जो चालों की असीमित संख्या तक जारी रहते हैं और उनमें विजेता (या अन्य लाभ) उन सभी चालों की समाप्ति के ''बाद'' तक ज्ञात नहीं होता.
 
सामान्यतः ध्यान इस बात पर ज़्यादा केंद्रित नहीं होता कि ऐसे खेलों को खेलने की सर्वश्रेष्ठ विधि क्या है, बल्कि केवल इस पर होता है कि क्या किसी खिलाड़ी के पास [[जीतने की रणनीति]] है. ([[चयन के सिद्धांत]] का प्रयोग करके यह सिद्ध किया जा सकता है कि ऐसे खेल होते हैं- यहां तक कि पूर्ण जानकारी के साथ और जहां परिणाम केवल "जीत" या "हार" होते हैं- जिनके लिये ''किसी'' खिलाड़ी के पास जीतने की रणनीति नहीं होती.) निपुणता से रचित खेलों के लिये [[वर्णनात्मक समुच्चय सिद्धांत]] में ऐसी रणनीतियों के अस्तित्व के महत्वपूर्ण प्रभाव होते हैं.
 
=== असतत और सतत खेल ===
पंक्ति 196:
=== एक-खिलाड़ी और अनेक-खिलाड़ियों वाले खेल ===
 
व्यक्तिगेम थ्योरी निर्णय समस्याओं को कभी-कभी "एक-खिलाड़ी वाले खेल" माना जाता है. हालांकि ये स्थितियां खेल सैद्धांतिक नहीं हैं, लेकिन उनकी रचना [[निर्णय सिद्धांत]] के नियमों के अंतर्गेम थ्योरी उन्हीं उपकरणों में से अनेक का प्रयोग करके की जाती है. केवल दो या दो से अधिक खिलाड़ियों के होने पर ही कोई समस्या खेल सैद्धांतिक बनती है. अक्सर बेतरतीब ढ़ंग से खेलने वाला कोई खिलाड़ी जोड़ा जाता है, जो "अवसरवादी चालें" चलता है, जिन्हें "[[स्वाभाविक चालों]]" के रूप में भी जाना जाता है.{{harv|Osborne & Rubinstein|1994}} दो-खिलाड़ियों वाले किसी खेल में इस खिलाड़ी को तीसरा खिलाड़ी नहीं माना जाता, बल्कि खेल में जहां आवश्यक हो, वहां वह केवल पासे की भूमिका निभाता है. खिलाड़ियों की असीमित संख्या वाले खेलों को अक्सर n-व्यक्ति खेल कहा जाता है.{{harv|Luce & Raiffa|1957}}
 
=== मेटाखेल ===
पंक्ति 204:
गेम थ्योरी की पहली ज्ञात चर्चा 1713 में [[जेम्स वाल्डेग्रेव]] द्वारा लिखित एक पत्र में हुई. इस पत्र में वाल्डेग्रेव ताश के खेल [[ले हर]] के दो-व्यक्तियों वाले संस्करण के समाधान के लिये एक [[मिनिमैक्स]] [[मिश्रित सिद्धांत]] प्रदान करते हैं.
 
[[जेम्स मेडिसन]] ने उसका निर्माण किया, जिसे अब हम इस बात के खेल-सैद्धांतिक विश्लेषण के रूप में जानते हैं कि करारोपण के विभिन्न तंत्रों के अंतर्गेम थ्योरी अवस्थाओं से किस प्रकार का व्यवहार करने की अपेक्षा की जा सकती है.<ref>जेम्स मेडिसन, संयुक्त राज्य अमेरिका की राजनैतिक व्यवस्था के दोष, अप्रैल 1787. [http://www.constitution.org/jm/17870400_vices.htm लिंक]</ref><ref>जैक रकोव, "जेम्स मैडिसन और संविधान", ''हिस्ट्री नाउ'' , अंक 13 सितम्बर 2007. [http://www.historynow.org/09_2007/historian2.html लिंक]</ref>
 
[[एंटोनी ऑगस्टिन कॉर्नट]] द्वारा 1838 में ''Recherches sur les principes mathématiques de la théorie des richesses'' (''धन के सिद्धांत के गणितीय सिद्धांतों में अनुसंधान'' ) का प्रकाशन किये जाने तक किसी सामान्य खेल सैद्धांतिक विश्लेषण का अनुसरण नहीं किया जाता था. इस कार्य में कॉर्नट ने एक [[द्वयाधिकार]] पर विचार किया है और एक समाधान प्रस्तुत किया है, जो [[नैश संतुलन]] का एक सीमित संस्करण है.
 
हालांकि कॉर्नट का विश्लेषण वाल्डेग्रेव के विश्लेषण से अधिक सामान्य है, लेकिन [[जॉन वॉन न्यूमैन]] द्वारा 1928 में शोध-पत्रों की एक श्रृंखला का प्रकाशन किये जाने से पूर्व तक एक अद्वितीय क्षेत्र के रूप में गेम थ्योरी का वस्तुतः कोई अस्तित्व नहीं था. हालांकि फ़्रांसीसी गणितज्ञ [[एमिली बोरेल]] ने खेलों पर कुछ प्रारंभिक कार्य किया, लेकिन वॉन न्यूमैन को गेम थ्योरी का आविष्कारक होने का श्रेय उचित रूप से दिया जा सकता है. वॉन न्यूमैन एक बुद्धिमान गणितज्ञ थे, जिनका कार्य समुच्चय सिद्धांत से लेकर उनकी गणनाओं, जो अणु व हाइड्रोजन बमों दोनों के विकास की कुंजी थीं, और अंततः संगणकों के विकास के उनके कार्य तक व्यापक रूप से फ़ैला हुआ था. गेम थ्योरी में वॉन न्यूमैन का कार्य 1944 में वॉन न्यूमैन और [[ऑस्कर मॉर्गेन्स्टेम]] की क़िताब ''[[Theory of Games and Economic Behavior]]'' (खेलों और आर्थिक व्यवहार का सिद्धांत) में अपने चरम पर पहुंचा. इस गहन कार्य में दो-व्यक्तियों वाले शून्य-राशि खेलों के लिये परस्पर संगेम थ्योरी समाधानों की खोज करने हेतु विधियां शामिल हैं. इस समयावधि के दौरान, गेम थ्योरी पर कार्य प्राथमिक रूप से [[सहकारी गेम थ्योरी]] पर केंद्रित था, जो व्यक्तियों के समूह के लिये यह मानते हुए इष्टतम रणनीतियों का विश्लेषण करता है कि वे उपयुक्त रणनीतियों के बारे में अपने बीच सहमति लागू कर सकते हैं.
 
1950 में, [[क़ैदी का असमंजस]] प्रकट हुआ और [[RAND कार्पोरेशन]] में इस खेल पर एक प्रयोग किया गया. इसी समय के आस-पास, [[जॉन नैश]] ने खिलाड़ियों की रणनीतियों की परस्पर संगेम थ्योरी ता के लिये एक मापदंड विकसित किया, जिसे [[नैश संतुलन]] के रूप में जाना जाता है और जो वॉन न्यूमैन और मॉर्गेन्स्टेम द्वारा प्रस्तावित मापदंड की तुलना में खेलों की एक व्यापक श्रेणी पर लागू होता है. यह संतुलन पर्याप्त रूप से इतना सामान्य है कि यह सहकारी खेलों के अतिरिक्त [[गैर-सहकारी खेलों]] के विश्लेषण की अनुमति भी देता है.
पंक्ति 216:
1965 में, [[रीनहार्ड सेल्टन]] ने [[उपखेल पूर्ण संतुलनों (subgame perfect equilibria)]] की अपनी [[समाधान अवधारणा]] प्रस्तुत की, जिसने [[नैश संतुलन]] को और अधिक परिष्कृत किया (बाद में उन्हें [[कांपते हाथ का अनुभव [trembling hand perception]]] भी प्रस्तुत करना था). 1967 में, [[जॉन हर्सेन्यि]] ने [[संपूर्ण सूचना]] और [[बायेसियन खेलों]] की अवधारणाएं विकसित कीं. आर्थिक गेम थ्योरी में उनके योगदान के लिये नैश, सेल्टन और हर्सेन्यि 1994 में [[अर्थशास्त्र के नोबल पुरस्कार विजेता]] बने.
 
1970 के दशक में, मुख्यतः [[जॉन मेनार्ड स्मिथ]] और उनकी [[विकासवादी रूप से स्थिर रणनीति]] के कार्य के फलस्वरूप गेम थ्योरी को [[जीवविज्ञान]] में गहन रूप से लागू किया गया. इसके अतिरिक्त [[सहसंबद्ध संतुलन]], कांपते हाथ का अनुभव और [[सामान्य ज्ञान]] की अवधारणाएं<ref>हालांकि सामान्य ज्ञान की चर्चा सबसे पहले 1960 के दशक के अंत में दार्शनिक [[डेविड लेविस]] ने अपने शोध प्रबंध (और बाद में पुस्तक) ''कन्वेंशन'' में की थी, लेकिन 1970 के दशक में [[रॉबर्ट ऑमन]] की कृति तक अर्थशास्त्रियों ने इस पर व्यापक रूप से विचार नहीं किया.</ref> प्रस्तुत की गईं और उनका विश्लेषण किया गया.
 
2005 में, गेम थ्योरीकारों [[थॉमस शेलिंग]] और [[रॉबर्ट ऑमैन]] ने नोबल विजेताओं के रूप में नैश, सेल्टन और हर्सेन्यि का अनुसरण किया. शेलिंग ने गेम थ्योरी िशील प्रतिमानों पर कार्य किया, जो [[विकासवादी गेम थ्योरी]] के प्रारंभिक उदाहरण थे. ऑमैन ने एक संतुलन कठोरता, सहसंबद्ध संतुलन, प्रस्तुत करके और [[सामान्य ज्ञान]] और इसके प्रभावों के अनुमानों का एक गहन औपचारिक विश्लेषण विकसित करके [[संतुलन विचारधारा]] में अधिक योगदान दिया.
 
सन 2007 में, [[रॉजर मायर्सन]] को [[लिओनिड हर्विज़]] और [[एरिक मस्किन]] के साथ "[[क्रियाविधि रचना]] सिद्धांत की नींव रखने के लिये" अर्थशास्त्र में नोबल पुरस्कार से सम्मानित किया गया. मायर्सन के योगदानों में [[उपयुक्त संतुलन]] का विचार और एक महत्वपूर्ण स्नातक पाठ्यपुस्तक: ''Game Theory, Analysis of Conflict'' (गेम थ्योरी, टकरावों का विश्लेषण), शामिल हैं.{{harv|Myerson|1997}}
 
== इन्हें भी देखें ==
पंक्ति 357:
* जिम रैटलीफ की [http://virtualperfection.com/gametheory/ गेम थ्योरी का स्नातक पाठ्यक्रम] (व्याख्यान नोट्स).
* द्विपक्षीय बातचीत (सौदेबाजी) के लिए वैलेन्टिन रोबू का [http://homepages.cwi.nl/~robu/aamas/aamas_demo.html सॉफ्टवेयर टूल]
* डॉन रॉस: ''स्टैनफोर्ड इनसाइक्लोपीडिया ऑफ़ फिलॉस्फी'' में [http://plato.stanford.edu/entries/game-theory/ गेम थ्योरी की समीक्षा].
* ब्रूनो वर्बीक और क्रिस्टोफर मॉरिस: [http://plato.stanford.edu/entries/game-ethics/ गेम थ्योरी और नीतिशास्त्र]
* क्रिस यिऊ की [http://www.yiu.co.uk/gametheory.php गेम थ्योरी लाउंज]