Class 11 Statistics Notes Chapter 7 (सहसंबंध) – Shankhyaiki Book

चलिए, आज हम सांख्यिकी की पुस्तक से अध्याय 7, 'सहसंबंध' का अध्ययन करेंगे। यह अध्याय सरकारी परीक्षाओं की दृष्टि से भी महत्वपूर्ण है, इसलिए इसके मुख्य बिंदुओं को ध्यान से समझना आवश्यक है।
अध्याय 7: सहसंबंध (Correlation) - विस्तृत नोट्स
1. सहसंबंध का अर्थ एवं परिभाषा:
- अर्थ: सांख्यिकी में, सहसंबंध (Correlation) दो या दो से अधिक चरों (variables) के बीच पाए जाने वाले पारस्परिक संबंध की दिशा और मात्रा का माप है। यह बताता है कि एक चर में परिवर्तन होने पर दूसरे चर में किस प्रकार और कितनी मात्रा में परिवर्तन होता है।
- उद्देश्य: सहसंबंध विश्लेषण का मुख्य उद्देश्य यह पता लगाना है कि क्या दो चरों के बीच कोई संबंध मौजूद है, और यदि है, तो वह कितना मजबूत है और किस दिशा (धनात्मक या ऋणात्मक) में है।
2. सहसंबंध के प्रकार:
सहसंबंध को मुख्यतः निम्न आधारों पर वर्गीकृत किया जा सकता है:
-
(क) दिशा के आधार पर:
- धनात्मक सहसंबंध (Positive Correlation): जब दो चरों में परिवर्तन एक ही दिशा में होता है, अर्थात् एक चर का मान बढ़ने पर दूसरे चर का मान भी बढ़ता है (या एक का मान घटने पर दूसरे का भी घटता है), तो उसे धनात्मक सहसंबंध कहते हैं।
- उदाहरण: आय और व्यय, विज्ञापन व्यय और बिक्री, ऊंचाई और वजन (सामान्यतः)।
- ऋणात्मक सहसंबंध (Negative Correlation): जब दो चरों में परिवर्तन विपरीत दिशा में होता है, अर्थात् एक चर का मान बढ़ने पर दूसरे चर का मान घटता है (या एक का मान घटने पर दूसरे का बढ़ता है), तो उसे ऋणात्मक सहसंबंध कहते हैं।
- उदाहरण: वस्तु की कीमत और उसकी मांग, तापमान और ऊनी कपड़ों की बिक्री।
- धनात्मक सहसंबंध (Positive Correlation): जब दो चरों में परिवर्तन एक ही दिशा में होता है, अर्थात् एक चर का मान बढ़ने पर दूसरे चर का मान भी बढ़ता है (या एक का मान घटने पर दूसरे का भी घटता है), तो उसे धनात्मक सहसंबंध कहते हैं।
-
(ख) रैखिकता के आधार पर:
- रेखीय सहसंबंध (Linear Correlation): यदि दो चरों के बीच परिवर्तन का अनुपात स्थिर रहता है, और जब उन्हें ग्राफ पर दर्शाया जाता है, तो बिंदु लगभग एक सीधी रेखा बनाते हैं।
- वक्ररेखीय/अरेखीय सहसंबंध (Non-linear/Curvilinear Correlation): यदि दो चरों के बीच परिवर्तन का अनुपात स्थिर नहीं रहता है, और ग्राफ पर बिंदु एक वक्र (curve) बनाते हैं।
-
(ग) चरों की संख्या के आधार पर:
- सरल सहसंबंध (Simple Correlation): जब केवल दो चरों के बीच संबंध का अध्ययन किया जाता है। (कक्षा 11 में मुख्यतः इसी का अध्ययन है)
- बहुगुणी सहसंबंध (Multiple Correlation): जब तीन या अधिक चरों के बीच संबंध का अध्ययन किया जाता है (एक चर का अन्य सभी चरों से संयुक्त रूप से)।
- आंशिक सहसंबंध (Partial Correlation): जब तीन या अधिक चरों में से दो चरों के बीच संबंध का अध्ययन किया जाता है, जबकि अन्य चरों के प्रभाव को स्थिर मान लिया जाता है।
3. सहसंबंध की मात्रा/डिग्री (Degree of Correlation):
सहसंबंध गुणांक (Coefficient of Correlation) द्वारा सहसंबंध की मात्रा या प्रबलता को मापा जाता है। इसका मान -1 से +1 के बीच होता है।
- पूर्ण सहसंबंध (Perfect Correlation):
- पूर्ण धनात्मक (+1): जब दो चरों में परिवर्तन समान अनुपात और समान दिशा में होता है। प्रकीर्ण आरेख पर सभी बिंदु नीचे बाएं से ऊपर दाएं ओर एक सीधी रेखा पर होते हैं।
- पूर्ण ऋणात्मक (-1): जब दो चरों में परिवर्तन समान अनुपात किन्तु विपरीत दिशा में होता है। प्रकीर्ण आरेख पर सभी बिंदु ऊपर बाएं से नीचे दाएं ओर एक सीधी रेखा पर होते हैं।
- सहसंबंध का अभाव (Absence of Correlation / Zero Correlation - 0): जब दो चरों के बीच कोई संबंध नहीं होता है। प्रकीर्ण आरेख पर बिंदु बिना किसी पैटर्न के बिखरे होते हैं।
- सीमित सहसंबंध (Limited Correlation): जब सहसंबंध गुणांक का मान 0 से अधिक लेकिन +1 से कम (धनात्मक) या 0 से कम लेकिन -1 से अधिक (ऋणात्मक) होता है।
- उच्च डिग्री (High Degree): मान +1 या -1 के करीब (जैसे ±0.75 से ±1)।
- मध्यम डिग्री (Moderate Degree): मान मध्य में (जैसे ±0.25 से ±0.75)।
- निम्न डिग्री (Low Degree): मान 0 के करीब (जैसे 0 से ±0.25)।
4. सहसंबंध मापने की विधियाँ:
-
(क) प्रकीर्ण आरेख (Scatter Diagram):
- यह सहसंबंध ज्ञात करने की एक चित्रमय (graphical) विधि है।
- इसमें एक चर (X) को X-अक्ष पर और दूसरे चर (Y) को Y-अक्ष पर लेकर बिंदुओं को ग्राफ पर अंकित किया जाता है।
- बिंदुओं के फैलाव (scatter) के पैटर्न को देखकर सहसंबंध की दिशा (धनात्मक/ऋणात्मक) और अनुमानित मात्रा (उच्च/मध्यम/निम्न/शून्य/पूर्ण) का पता लगाया जाता है।
- नीचे बाएं से ऊपर दाएं ओर झुकाव: धनात्मक सहसंबंध।
- ऊपर बाएं से नीचे दाएं ओर झुकाव: ऋणात्मक सहसंबंध।
- एक सीधी रेखा पर बिंदु: पूर्ण सहसंबंध।
- बिंदु बेतरतीब बिखरे हों: शून्य सहसंबंध।
-
(ख) कार्ल पियर्सन का सहसंबंध गुणांक (Karl Pearson's Coefficient of Correlation - 'r'):
- यह सहसंबंध की मात्रा और दिशा मापने की सबसे प्रचलित गणितीय विधि है। यह केवल रेखीय सहसंबंध को मापता है।
- गुण:
- इसका मान -1 से +1 तक होता है (r lies between -1 and +1)।
- यह इकाई मुक्त माप है (It is independent of units of measurement)।
- यह मूल बिंदु (origin) और पैमाने (scale) के परिवर्तन से स्वतंत्र होता है।
- सूत्र:
- प्रत्यक्ष विधि (Direct Method):
r = Σ[(X - X̄)(Y - Ȳ)] / √[Σ(X - X̄)² * Σ(Y - Ȳ)²]
या, r = Cov(X, Y) / (σₓ * σ<0xE1><0xB5><0xA7>)
जहाँ, X̄ = X का माध्य, Ȳ = Y का माध्य, Cov(X, Y) = X और Y का सहप्रसरण, σₓ = X का मानक विचलन, σ<0xE1><0xB5><0xA7> = Y का मानक विचलन। - लघु विधि (Short-cut Method / Assumed Mean Method):
r = [NΣdxdy - (Σdx)(Σdy)] / √{[NΣdx² - (Σdx)²] * [NΣdy² - (Σdy)²]}
जहाँ, dx = X - A (A = X का कल्पित माध्य), dy = Y - B (B = Y का कल्पित माध्य), N = युग्मों की संख्या। - पद विचलन विधि (Step-Deviation Method): (यदि वर्ग अंतराल समान हो)
r = [NΣd'xd'y - (Σd'x)(Σd'y)] / √{[NΣd'x² - (Σd'x)²] * [NΣd'y² - (Σd'y)²]}
जहाँ, d'x = (X - A) / i (i = X का वर्ग विस्तार), d'y = (Y - B) / j (j = Y का वर्ग विस्तार)।
- प्रत्यक्ष विधि (Direct Method):
-
(ग) स्पीयरमैन का कोटि सहसंबंध गुणांक (Spearman's Rank Correlation Coefficient - 'R' or 'ρ'):
- यह विधि तब उपयोगी होती है जब चरों को मात्रात्मक रूप से मापना कठिन हो, लेकिन उन्हें कोटि (rank) दी जा सकती हो (गुणात्मक डेटा जैसे सुंदरता, बुद्धिमत्ता)। या जब डेटा में चरम मान (extreme values) हों या पियर्सन की मान्यताएं पूरी न हों।
- सूत्र (जब कोटियाँ दोहराई न गई हों):
R = 1 - [6 * ΣD² / (N(N² - 1))]
जहाँ, D = दोनों चरों की कोटियों का अंतर (R₁ - R₂), N = युग्मों की संख्या। - सूत्र (जब कोटियाँ दोहराई गई हों / Tied Ranks):
जब समान मान वाले पदों को समान (औसत) कोटि दी जाती है, तो उपरोक्त सूत्र में संशोधन किया जाता है। ΣD² में एक संशोधन कारक (Correction Factor - CF) जोड़ा जाता है।
CF = Σ [m(m² - 1) / 12]
जहाँ 'm' एक मान की पुनरावृत्ति की संख्या है। यह गणना प्रत्येक दोहराए गए मान के लिए की जाती है और फिर जोड़ा जाता है।
संशोधित ΣD² = ΣD² + CF
फिर इस संशोधित मान का प्रयोग मुख्य सूत्र में किया जाता है।
5. सहसंबंध का महत्व/उपयोग:
- चरों के बीच संबंध की डिग्री और प्रकृति को समझने में मदद करता है।
- आर्थिक सिद्धांतों और व्यावसायिक निर्णयों में सहायक।
- पूर्वानुमान (prediction) में सहायक (हालांकि इसके लिए समाश्रयण विश्लेषण अधिक उपयुक्त है)।
- वैज्ञानिक अनुसंधान में उपयोगी।
6. सहसंबंध और कारणता (Correlation and Causation):
- यह ध्यान रखना अत्यंत महत्वपूर्ण है कि सहसंबंध का अर्थ कारणता नहीं है (Correlation does not imply causation)।
- यदि दो चरों में उच्च सहसंबंध है, तो इसका मतलब यह आवश्यक नहीं है कि एक चर दूसरे चर में परिवर्तन का कारण है। हो सकता है कि:
- X, Y का कारण हो।
- Y, X का कारण हो।
- कोई तीसरा छिपा हुआ चर (lurking variable) X और Y दोनों को प्रभावित कर रहा हो।
- यह संबंध केवल संयोगवश (by chance) हो।
अभ्यास हेतु बहुविकल्पीय प्रश्न (MCQs):
प्रश्न 1: यदि दो चरों में परिवर्तन एक ही दिशा में होता है, तो सहसंबंध कहलाता है:
(क) ऋणात्मक सहसंबंध
(ख) धनात्मक सहसंबंध
(ग) शून्य सहसंबंध
(घ) वक्ररेखीय सहसंबंध
प्रश्न 2: सहसंबंध गुणांक (r) का मान किसके बीच होता है?
(क) 0 से +1
(ख) -1 से 0
(ग) -1 से +1
(घ) -∞ से +∞
प्रश्न 3: प्रकीर्ण आरेख विधि सहसंबंध की ___________ विधि है।
(क) गणितीय
(ख) चित्रमय (ग्राफिकल)
(ग) बीजगणितीय
(घ) इनमें से कोई नहीं
प्रश्न 4: यदि सहसंबंध गुणांक (r) का मान +1 है, तो यह इंगित करता है:
(क) पूर्ण ऋणात्मक सहसंबंध
(ख) सहसंबंध का अभाव
(ग) उच्च धनात्मक सहसंबंध
(घ) पूर्ण धनात्मक सहसंबंध
प्रश्न 5: कार्ल पियर्सन का सहसंबंध गुणांक किस प्रकार के संबंध को मापता है?
(क) केवल वक्ररेखीय
(ख) केवल रेखीय
(ग) रेखीय और वक्ररेखीय दोनों
(घ) केवल गुणात्मक
प्रश्न 6: स्पीयरमैन का कोटि सहसंबंध गुणांक कब अधिक उपयुक्त होता है?
(क) जब डेटा मात्रात्मक हो
(ख) जब डेटा गुणात्मक हो (कोटि दी जा सके)
(ग) जब केवल दो अवलोकन हों
(घ) जब सहसंबंध हमेशा धनात्मक हो
प्रश्न 7: यदि दो चरों (X और Y) के बीच सहसंबंध गुणांक शून्य (r=0) है, तो इसका अर्थ है:
(क) X, Y का कारण है
(ख) Y, X का कारण है
(ग) X और Y के बीच कोई रेखीय संबंध नहीं है
(घ) X और Y के बीच पूर्ण संबंध है
प्रश्न 8: सूत्र R = 1 - [6 * ΣD² / (N(N² - 1))] किससे संबंधित है?
(क) कार्ल पियर्सन सहसंबंध गुणांक
(ख) स्पीयरमैन कोटि सहसंबंध गुणांक
(ग) मानक विचलन
(घ) माध्य विचलन
प्रश्न 9: यदि वस्तु की कीमत बढ़ने पर उसकी मांग घटती है, तो कीमत और मांग के बीच किस प्रकार का सहसंबंध होने की संभावना है?
(क) धनात्मक
(ख) ऋणात्मक
(ग) शून्य
(घ) पूर्ण धनात्मक
प्रश्न 10: "सहसंबंध का अर्थ कारणता नहीं है" - इस कथन का क्या तात्पर्य है?
(क) सहसंबंध और कारणता एक ही हैं।
(ख) यदि सहसंबंध है, तो कारणता अवश्य होगी।
(ग) दो चरों के बीच संबंध होने का मतलब यह जरूरी नहीं कि एक चर दूसरे का कारण हो।
(घ) कारणता का अध्ययन सहसंबंध से अधिक महत्वपूर्ण नहीं है।
उत्तरमाला (MCQs):
- (ख)
- (ग)
- (ख)
- (घ)
- (ख)
- (ख)
- (ग)
- (ख)
- (ख)
- (ग)
इन नोट्स को अच्छी तरह समझें और सूत्रों का अभ्यास करें। प्रकीर्ण आरेख और गुणांकों की व्याख्या पर विशेष ध्यान दें। शुभकामनाएँ!