Class 11 Mathematics Notes Chapter 15 (सांख्यिकी) – Ganit Book

चलिए, आज हम कक्षा 11 के गणित विषय के अध्याय 15, 'सांख्यिकी' (Statistics) का अध्ययन करेंगे, जो सरकारी परीक्षाओं की तैयारी के दृष्टिकोण से बहुत महत्वपूर्ण है। इस अध्याय में हम आंकड़ों के विश्लेषण और उनके फैलाव को मापने की विभिन्न विधियों को समझेंगे।
अध्याय 15: सांख्यिकी (Statistics) - विस्तृत नोट्स
1. परिचय (Introduction)
सांख्यिकी गणित की वह शाखा है जो आंकड़ों के संग्रहण, संगठन, विश्लेषण, व्याख्या और प्रस्तुतिकरण से संबंधित है। सरकारी परीक्षाओं में, आंकड़ों की व्याख्या करने और उनसे निष्कर्ष निकालने की क्षमता का परीक्षण किया जाता है। इस अध्याय में हम मुख्य रूप से 'प्रकीर्णन के माप' (Measures of Dispersion) पर ध्यान केंद्रित करेंगे।
2. प्रकीर्णन के माप (Measures of Dispersion)
केंद्रीय प्रवृत्ति के माप (जैसे माध्य, माध्यिका, बहुलक) हमें आंकड़ों के केंद्र के बारे में बताते हैं, लेकिन यह नहीं बताते कि आंकड़े उस केंद्रीय मान के आसपास कितने फैले हुए हैं। प्रकीर्णन के माप हमें आंकड़ों के इसी फैलाव या बिखराव की जानकारी देते हैं।
-
प्रकीर्णन की आवश्यकता क्यों?
- यह जानने के लिए कि केंद्रीय मान पूरे डेटा का कितना अच्छा प्रतिनिधित्व करता है। यदि फैलाव कम है, तो केंद्रीय मान अधिक प्रतिनिधि है।
- दो या दो से अधिक श्रृंखलाओं की परिवर्तनशीलता (variability) की तुलना करने के लिए।
- अन्य सांख्यिकीय मापों जैसे सहसंबंध, प्रतिगमन आदि की गणना के लिए आधार प्रदान करना।
-
प्रकीर्णन के मुख्य माप:
- परिसर (Range)
- माध्य विचलन (Mean Deviation)
- प्रसरण (Variance)
- मानक विचलन (Standard Deviation)
- विचरण गुणांक (Coefficient of Variation)
2.1 परिसर (Range)
यह प्रकीर्णन का सबसे सरल माप है। यह आंकड़ों के अधिकतम और न्यूनतम मानों के बीच का अंतर है।
- सूत्र: परिसर (R) = अधिकतम मान (Maximum Value) - न्यूनतम मान (Minimum Value)
- गुण: गणना करने में आसान।
- अवगुण: यह केवल दो चरम मानों पर निर्भर करता है और आंकड़ों के बाकी वितरण के बारे में कोई जानकारी नहीं देता। यह बाह्य मानों (outliers) से अत्यधिक प्रभावित होता है।
2.2 माध्य विचलन (Mean Deviation - MD)
यह किसी केंद्रीय प्रवृत्ति के माप (माध्य या माध्यिका) से आंकड़ों के विचलनों (deviations) के निरपेक्ष मानों (absolute values) का औसत होता है।
-
अवर्गीकृत आंकड़ों के लिए:
- माध्य से माध्य विचलन (MD about Mean):
MD(x̄) = (1/n) * Σ |xᵢ - x̄|(जहाँ n प्रेक्षणों की संख्या है, xᵢ प्रत्येक प्रेक्षण है, और x̄ माध्य है) - माध्यिका से माध्य विचलन (MD about Median):
MD(M) = (1/n) * Σ |xᵢ - M|(जहाँ M माध्यिका है)
- माध्य से माध्य विचलन (MD about Mean):
-
वर्गीकृत आंकड़ों (असतत/सतत बारंबारता बंटन) के लिए:
- माध्य से माध्य विचलन:
MD(x̄) = (1/N) * Σ fᵢ |xᵢ - x̄|(जहाँ N = Σfᵢ कुल बारंबारता है, fᵢ प्रत्येक वर्ग की बारंबारता है, और xᵢ वर्ग मध्य-बिंदु है) - माध्यिका से माध्य विचलन:
MD(M) = (1/N) * Σ fᵢ |xᵢ - M|
- माध्य से माध्य विचलन:
-
गुण: यह सभी प्रेक्षणों पर आधारित है। समझने में अपेक्षाकृत सरल।
-
अवगुण: निरपेक्ष मानों (| |) का उपयोग गणितीय रूप से असुविधाजनक होता है, जिससे आगे बीजगणितीय विवेचन कठिन हो जाता है। माध्यिका से माध्य विचलन का मान न्यूनतम होता है।
2.3 प्रसरण (Variance - σ²)
यह माध्य से प्रेक्षणों के विचलनों के वर्गों का औसत होता है। वर्ग करने से ऋणात्मक विचलन धनात्मक हो जाते हैं और बड़े विचलनों को अधिक महत्व मिलता है।
-
अवर्गीकृत आंकड़ों के लिए:
σ² = (1/n) * Σ (xᵢ - x̄)²- लघु विधि (Shortcut Method):
σ² = (Σ xᵢ² / n) - (Σ xᵢ / n)² = (Σ xᵢ² / n) - x̄²
-
वर्गीकृत आंकड़ों (असतत/सतत बारंबारता बंटन) के लिए:
σ² = (1/N) * Σ fᵢ (xᵢ - x̄)²- लघु विधि:
σ² = (Σ fᵢ xᵢ² / N) - (Σ fᵢ xᵢ / N)² = (Σ fᵢ xᵢ² / N) - x̄² - पद विचलन विधि (Step-Deviation Method - सतत बंटन के लिए):
σ² = h² [ (Σ fᵢ uᵢ² / N) - (Σ fᵢ uᵢ / N)² ]
जहाँuᵢ = (xᵢ - A) / h, A कल्पित माध्य है, और h वर्ग माप (class size) है।
-
गुण: यह सभी प्रेक्षणों पर आधारित है और आगे के गणितीय विश्लेषण के लिए उपयुक्त है।
-
अवगुण: इसकी इकाई मूल आंकड़ों की इकाई का वर्ग होती है (जैसे, यदि आंकड़े cm में हैं, तो प्रसरण cm² में होगा), जिससे व्याख्या करना कठिन हो जाता है।
2.4 मानक विचलन (Standard Deviation - σ)
यह प्रसरण का धनात्मक वर्गमूल होता है। यह प्रकीर्णन का सबसे महत्वपूर्ण और व्यापक रूप से उपयोग किया जाने वाला माप है।
- सूत्र:
σ = √Variance = √σ² - गुण:
- इसकी इकाई वही होती है जो मूल आंकड़ों की होती है, जिससे इसकी व्याख्या करना आसान होता है।
- यह सभी प्रेक्षणों पर आधारित है।
- यह बीजगणितीय विवेचन के लिए उपयुक्त है।
- यह माध्य के आसपास आंकड़ों के फैलाव का एक स्थिर माप देता है।
- अवगुण: गणना थोड़ी जटिल हो सकती है। चरम मानों से प्रभावित होता है (हालांकि परिसर जितना नहीं)।
2.5 विचरण गुणांक (Coefficient of Variation - CV)
यह प्रकीर्णन का एक सापेक्ष माप (relative measure) है। इसका उपयोग दो या दो से अधिक श्रृंखलाओं की परिवर्तनशीलता की तुलना करने के लिए किया जाता है, खासकर जब उनके माध्य अलग-अलग हों या उनकी इकाइयाँ भिन्न हों। इसे प्रतिशत में व्यक्त किया जाता है।
- सूत्र:
CV = (σ / x̄) * 100(जहाँ σ मानक विचलन है और x̄ माध्य है) - व्याख्या:
- CV का मान जितना अधिक होगा, आंकड़ों में उतनी ही अधिक सापेक्ष परिवर्तनशीलता होगी।
- CV का मान जितना कम होगा, आंकड़े उतने ही अधिक संगत (consistent) या स्थिर (stable) होंगे।
सरकारी परीक्षाओं के लिए महत्वपूर्ण बिंदु:
- सूत्र: माध्य विचलन, प्रसरण, मानक विचलन और विचरण गुणांक के सभी सूत्र (विशेषकर लघु विधि और पद विचलन विधि) अच्छी तरह याद रखें।
- गणना: इन मापों की गणना करने का अभ्यास करें, खासकर वर्गीकृत आंकड़ों के लिए।
- तुलना: विचरण गुणांक का उपयोग करके दो डेटा सेट की स्थिरता या परिवर्तनशीलता की तुलना करने वाले प्रश्न अक्सर पूछे जाते हैं।
- गुण और अवगुण: विभिन्न प्रकीर्णन मापों के गुण और अवगुणों की सैद्धांतिक समझ होनी चाहिए।
- मानक विचलन और प्रसरण के गुण:
- यदि प्रत्येक प्रेक्षण में एक अचर राशि 'a' जोड़ी या घटाई जाती है, तो प्रसरण और मानक विचलन अपरिवर्तित रहते हैं।
- यदि प्रत्येक प्रेक्षण को एक अचर राशि 'a' से गुणा किया जाता है, तो नया मानक विचलन मूल मानक विचलन का |a| गुना हो जाता है, और नया प्रसरण मूल प्रसरण का a² गुना हो जाता है।
अभ्यास हेतु बहुविकल्पीय प्रश्न (MCQs):
प्रश्न 1: आंकड़ों 3, 10, 7, 4, 9, 5 का परिसर (Range) क्या है?
(a) 6
(b) 7
(c) 5
(d) 8
प्रश्न 2: प्रथम पाँच धन पूर्णांकों (1, 2, 3, 4, 5) का माध्य से माध्य विचलन (Mean Deviation about Mean) क्या है?
(a) 1.0
(b) 1.2
(c) 1.5
(d) 2.0
प्रश्न 3: यदि आंकड़ों के एक समूह का प्रसरण (Variance) 64 है, तो मानक विचलन (Standard Deviation) क्या होगा?
(a) 4
(b) 8
(c) 16
(d) 4096
प्रश्न 4: निम्नलिखित में से कौन सा माप प्रकीर्णन का सबसे अच्छा माप माना जाता है क्योंकि इसकी इकाई आंकड़ों की इकाई के समान होती है?
(a) परिसर
(b) माध्य विचलन
(c) प्रसरण
(d) मानक विचलन
प्रश्न 5: आंकड़ों 2, 4, 6, 8, 10 का प्रसरण (Variance) ज्ञात कीजिए।
(a) 6
(b) 8
(c) 10
(d) 12
प्रश्न 6: यदि एक डेटा सेट के प्रत्येक प्रेक्षण को 3 से गुणा कर दिया जाए, तो नया मानक विचलन होगा:
(a) मूल मानक विचलन के समान
(b) मूल मानक विचलन का 3 गुना
(c) मूल मानक विचलन का 9 गुना
(d) मूल मानक विचलन का √3 गुना
प्रश्न 7: दो डेटा सेट A और B के लिए, माध्य और मानक विचलन क्रमशः (A: माध्य=50, σ=10) और (B: माध्य=100, σ=15) हैं। कौन सा डेटा सेट अधिक स्थिर (consistent) है?
(a) डेटा सेट A
(b) डेटा सेट B
(c) दोनों समान रूप से स्थिर हैं
(d) निर्धारित नहीं किया जा सकता
प्रश्न 8: माध्यिका से माध्य विचलन का मान, माध्य से माध्य विचलन के मान की तुलना में होता है:
(a) हमेशा अधिक
(b) हमेशा कम
(c) कम या बराबर
(d) अधिक या बराबर
प्रश्न 9: आंकड़ों 5, 5, 5, 5, 5 का मानक विचलन क्या है?
(a) 5
(b) 0
(c) 1
(d) 25
प्रश्न 10: विचरण गुणांक (Coefficient of Variation) की गणना का सूत्र है:
(a) (माध्य / मानक विचलन) * 100
(b) (मानक विचलन / माध्य) * 100
(c) (प्रसरण / माध्य) * 100
(d) (माध्य / प्रसरण) * 100
उत्तरमाला:
- (b) [अधिकतम मान = 10, न्यूनतम मान = 3, परिसर = 10 - 3 = 7]
- (b) [माध्य = (1+2+3+4+5)/5 = 3. विचलन = |-2|, |-1|, |0|, |1|, |2|. माध्य विचलन = (2+1+0+1+2)/5 = 6/5 = 1.2]
- (b) [मानक विचलन = √प्रसरण = √64 = 8]
- (d) [मानक विचलन की इकाई आंकड़ों की इकाई के समान होती है।]
- (b) [माध्य = (2+4+6+8+10)/5 = 6. विचलन का वर्ग = (2-6)², (4-6)², (6-6)², (8-6)², (10-6)² = 16, 4, 0, 4, 16. प्रसरण = (16+4+0+4+16)/5 = 40/5 = 8]
- (b) [गुणधर्म: σ(ax) = |a|σ(x)]
- (a) [CV(A) = (10/50)*100 = 20%. CV(B) = (15/100)*100 = 15%. चूँकि CV(B) < CV(A), डेटा सेट B अधिक स्थिर है। Correction: Lower CV means more consistent. So B is more consistent. Rechecking question 7... Ah, user asked which is more stable (consistent). Lower CV means more stable. CV(A) = 20%, CV(B) = 15%. So B is more stable. Let me correct the answer key. *Self-correction: The provided answer (a) implies A is more stable. Let me re-calculate. CV(A) = (10/50)*100 = 20%. CV(B) = (15/100)100 = 15%. Lower CV means more stable/consistent. So B is more stable/consistent. The answer should be (b). Let me fix the key. The key should be (b). Let me re-read the question and options. Okay, the question asks which is more stable. B has lower CV (15%) compared to A (20%). Hence B is more stable. The correct option is (b). Let me re-write the answer key entry.]
- (c) [माध्यिका से माध्य विचलन न्यूनतम होता है।]
- (b) [जब सभी प्रेक्षण समान होते हैं, तो कोई फैलाव नहीं होता, इसलिए मानक विचलन 0 होता है।]
- (b) [CV = (σ / x̄) * 100]
संशोधित उत्तरमाला:
- (b)
- (b)
- (b)
- (d)
- (b)
- (b)
- (b) [CV(A) = 20%, CV(B) = 15%. कम CV का अर्थ है अधिक स्थिरता, इसलिए B अधिक स्थिर है।]
- (c)
- (b)
- (b)
इन नोट्स और प्रश्नों का अच्छी तरह से अध्ययन करें। सांख्यिकी में सफलता के लिए सूत्रों को याद रखना और विभिन्न प्रकार के प्रश्नों को हल करने का अभ्यास करना महत्वपूर्ण है। शुभकामनाएँ!