Class 11 Statistics Notes Chapter 6 (परिक्षेपण के माप) – Shankhyaiki Book

चलिए, आज हम कक्षा 11 की सांख्यिकी पुस्तक 'शंक्याइकी' के अध्याय 6, 'परिक्षेपण के माप' (Measures of Dispersion) का गहन अध्ययन करेंगे। यह अध्याय सरकारी परीक्षाओं की दृष्टि से अत्यंत महत्वपूर्ण है, क्योंकि इससे आंकड़ों की प्रकृति को समझने में मदद मिलती है।
अध्याय 6: परिक्षेपण के माप (Measures of Dispersion)
परिचय:
केंद्रीय प्रवृत्ति के माप (जैसे माध्य, माध्यिका, बहुलक) हमें आंकड़ों के केंद्र या औसत मान के बारे में बताते हैं। लेकिन, ये माप यह नहीं बताते कि आंकड़े अपने औसत मान के आसपास कितने फैले हुए हैं या बिखरे हुए हैं। उदाहरण के लिए, दो क्रिकेट खिलाड़ियों के पिछली 5 पारियों के रन क्रमशः 50, 50, 50, 50, 50 और 0, 0, 50, 100, 100 हो सकते हैं। दोनों का औसत 50 है, लेकिन पहले खिलाड़ी के स्कोर में कोई बिखराव नहीं है, जबकि दूसरे खिलाड़ी के स्कोर में बहुत अधिक बिखराव है। इसी बिखराव या फैलाव को मापने के लिए हम 'परिक्षेपण के माप' का उपयोग करते हैं।
परिक्षेपण का अर्थ:
परिक्षेपण आंकड़ों के अपने केंद्रीय मान (आमतौर पर माध्य) से विचलन या फैलाव की सीमा को मापता है। यह बताता है कि श्रेणी के विभिन्न पद अपने औसत से कितनी दूरी पर स्थित हैं। यदि विचलन अधिक है, तो परिक्षेपण अधिक होगा, और यदि विचलन कम है, तो परिक्षेपण कम होगा।
परिक्षेपण के उद्देश्य/महत्व:
- केंद्रीय प्रवृत्ति की विश्वसनीयता जांचना: कम परिक्षेपण का अर्थ है कि औसत मान आंकड़ों का बेहतर प्रतिनिधित्व करता है।
- आंकड़ों के विचरण की सीमा जानना: यह बताता है कि आंकड़े न्यूनतम और अधिकतम मान के बीच कितने फैले हुए हैं।
- दो या अधिक श्रेणियों की तुलना करना: सापेक्ष मापों का उपयोग करके विभिन्न इकाइयों वाली श्रेणियों की परिवर्तनशीलता की तुलना की जा सकती है।
- अन्य सांख्यिकीय विश्लेषण का आधार: सहसंबंध, प्रतीपगमन आदि विश्लेषणों में परिक्षेपण के माप (विशेषकर मानक विचलन) का उपयोग होता है।
- गुणवत्ता नियंत्रण: उत्पादन प्रक्रिया में भिन्नता को नियंत्रित करने में मदद करता है।
परिक्षेपण के माप के प्रकार:
परिक्षेपण के माप मुख्यतः दो प्रकार के होते हैं:
1. निरपेक्ष माप (Absolute Measures):
ये माप उसी इकाई में व्यक्त किए जाते हैं जिसमें मूल आंकड़े होते हैं (जैसे रुपये, किलोग्राम, अंक)। ये एक ही श्रेणी के भीतर फैलाव को दर्शाते हैं, लेकिन विभिन्न इकाइयों वाली दो श्रेणियों की तुलना के लिए उपयुक्त नहीं हैं।
-
(क) परास (Range - R):
- परिभाषा: यह किसी श्रेणी के सबसे बड़े (L) और सबसे छोटे (S) मूल्य के बीच का अंतर है।
- सूत्र: R = L - S
- गुण: गणना में सबसे सरल। समझने में आसान।
- दोष: यह केवल चरम मूल्यों पर आधारित है, बीच के मूल्यों की स्थिति नहीं बताता। सीमान्त मूल्यों (outliers) से अत्यधिक प्रभावित होता है। अस्थिर माप है। खुली अंत वाली श्रेणियों (open-ended series) के लिए उपयुक्त नहीं।
- गणना:
- व्यक्तिगत श्रेणी: उच्चतम मान - न्यूनतम मान।
- खंडित श्रेणी: चर के उच्चतम मान - चर के न्यूनतम मान (आवृत्तियों पर ध्यान नहीं दिया जाता)।
- सतत श्रेणी: अंतिम वर्ग की ऊपरी सीमा - पहले वर्ग की निचली सीमा।
-
(ख) चतुर्थक विचलन (Quartile Deviation - QD) या अर्ध-अंतर-चतुर्थक परास (Semi-Interquartile Range):
- परिभाषा: यह तीसरे चतुर्थक (Q3) और पहले चतुर्थक (Q1) के अंतर का आधा होता है। यह आंकड़ों के मध्य 50% भाग के फैलाव को मापता है।
- सूत्र: QD = (Q3 - Q1) / 2
- अंतर-चतुर्थक परास (Interquartile Range): Q3 - Q1
- गुण: चरम मूल्यों से प्रभावित नहीं होता। खुली अंत वाली श्रेणियों के लिए उपयुक्त। परास से बेहतर माप।
- दोष: यह केवल मध्य के 50% आंकड़ों पर आधारित है, सभी आंकड़ों का प्रतिनिधित्व नहीं करता। बीजगणितीय विवेचन के लिए उपयुक्त नहीं।
- गणना: पहले Q1 और Q3 ज्ञात करें (जैसे माध्यिका ज्ञात करते हैं), फिर सूत्र का प्रयोग करें।
-
(ग) माध्य विचलन (Mean Deviation - MD):
- परिभाषा: यह किसी श्रेणी के सभी मूल्यों का उसके किसी केंद्रीय प्रवृत्ति के माप (माध्य, माध्यिका या बहुलक) से लिए गए विचलनों (अंतरों) के निरपेक्ष मानों (चिन्हों को अनदेखा करके) का समांतर माध्य है।
- सूत्र:
- माध्य से: MD(x̄) = Σ|X - x̄| / N (व्यक्तिगत), Σf|X - x̄| / Σf (खंडित/सतत)
- माध्यिका से: MD(M) = Σ|X - M| / N (व्यक्तिगत), Σf|X - M| / Σf (खंडित/सतत)
- बहुलक से: MD(Z) = Σ|X - Z| / N (व्यक्तिगत), Σf|X - Z| / Σf (खंडित/सतत)
- नोट: माध्यिका से लिया गया माध्य विचलन न्यूनतम होता है।
- गुण: सभी मूल्यों पर आधारित। चरम मूल्यों का प्रभाव परास और मानक विचलन से कम। समझने में अपेक्षाकृत सरल।
- दोष: विचलनों के चिन्हों (+/-) को अनदेखा करना गणितीय रूप से सही नहीं माना जाता, जिससे आगे बीजगणितीय विवेचन कठिन हो जाता है। बहुलक से गणना करना मुश्किल हो सकता है यदि बहुलक अस्पष्ट हो।
- गणना: पहले माध्य/माध्यिका/बहुलक ज्ञात करें, फिर प्रत्येक मान का उससे विचलन निकालें, विचलनों के निरपेक्ष मान लें, उनका योग करें और पदों की संख्या (या आवृत्तियों के योग) से भाग दें।
-
(घ) मानक विचलन (Standard Deviation - SD or σ):
- परिभाषा: यह किसी श्रेणी के समांतर माध्य से लिए गए विचलनों के वर्गों के समांतर माध्य का वर्गमूल होता है। इसे 'वर्ग माध्य मूल विचलन' (Root Mean Square Deviation) भी कहते हैं। यह परिक्षेपण का सबसे महत्वपूर्ण और वैज्ञानिक माप माना जाता है।
- सूत्र (व्यक्तिगत श्रेणी):
- प्रत्यक्ष विधि: σ = √[Σ(X - x̄)² / N]
- लघु विधि (कल्पित माध्य से): σ = √[Σd² / N - (Σd / N)²], जहाँ d = X - A (A = कल्पित माध्य)
- सूत्र (खंडित/सतत श्रेणी):
- प्रत्यक्ष विधि: σ = √[Σf(X - x̄)² / Σf]
- लघु विधि: σ = √[Σfd² / Σf - (Σfd / Σf)²], जहाँ d = X - A
- पद विचलन विधि (सतत श्रेणी): σ = √[Σfd'² / Σf - (Σfd' / Σf)²] * i, जहाँ d' = (X - A) / i (i = वर्ग अंतराल)
- गुण: सभी मूल्यों पर आधारित। बीजगणितीय विवेचन के लिए सर्वोत्तम (चिन्हों की उपेक्षा नहीं होती)। निश्चित मान होता है। नमूनाकरण (sampling) सिद्धांतों में बहुत उपयोगी। सबसे विश्वसनीय माप।
- दोष: गणना जटिल है। समझना कठिन है। चरम मूल्यों से अधिक प्रभावित होता है।
-
(ङ) प्रसरण (Variance - σ²):
- परिभाषा: यह मानक विचलन का वर्ग होता है।
- सूत्र: Variance = σ² = Σ(X - x̄)² / N (व्यक्तिगत), Σf(X - x̄)² / Σf (खंडित/सतत)
- उपयोग: इसका उपयोग सांख्यिकीय विश्लेषण, विशेष रूप से प्रसरण विश्लेषण (ANOVA) में किया जाता है।
2. सापेक्ष माप (Relative Measures):
ये माप अनुपात या प्रतिशत के रूप में व्यक्त किए जाते हैं और इकाई रहित होते हैं। इनका उपयोग विभिन्न इकाइयों वाली या भिन्न औसत मान वाली दो या अधिक श्रेणियों की परिवर्तनशीलता (variability) की तुलना करने के लिए किया जाता है।
-
(क) परास गुणांक (Coefficient of Range):
- सूत्र: (L - S) / (L + S)
-
(ख) चतुर्थक विचलन गुणांक (Coefficient of Quartile Deviation):
- सूत्र: (Q3 - Q1) / (Q3 + Q1)
-
(ग) माध्य विचलन गुणांक (Coefficient of Mean Deviation):
- सूत्र: MD / Average (जिससे MD निकाला गया है - माध्य, माध्यिका या बहुलक)
- Coefficient of MD(x̄) = MD(x̄) / x̄
- Coefficient of MD(M) = MD(M) / M
- Coefficient of MD(Z) = MD(Z) / Z
- सूत्र: MD / Average (जिससे MD निकाला गया है - माध्य, माध्यिका या बहुलक)
-
(घ) विचरण गुणांक (Coefficient of Variation - CV):
- परिभाषा: यह मानक विचलन (σ) को समांतर माध्य (x̄) के प्रतिशत के रूप में व्यक्त करता है। यह तुलना के लिए सबसे अधिक इस्तेमाल किया जाने वाला सापेक्ष माप है।
- सूत्र: CV = (σ / x̄) * 100
- व्याख्या: जिस श्रेणी का CV कम होता है, उसमें कम विचरणशीलता (अधिक एकरूपता/संगति) होती है। जिसका CV अधिक होता है, उसमें अधिक विचरणशीलता (कम एकरूपता/संगति) होती है।
लॉरेंज वक्र (Lorenz Curve):
यह परिक्षेपण को मापने की एक आलेखी (ग्राफिकल) विधि है, जिसका उपयोग विशेष रूप से आय या धन के वितरण की असमानता को दर्शाने के लिए किया जाता है।
- निर्माण: X-अक्ष पर व्यक्तियों या मदों का संचयी प्रतिशत और Y-अक्ष पर आय या चर मूल्य का संचयी प्रतिशत लेकर बिंदु अंकित किए जाते हैं। इन बिंदुओं को मिलाने से लॉरेंज वक्र बनता है।
- समान वितरण रेखा (Line of Equal Distribution): एक सीधी विकर्ण रेखा (0,0 से 100,100 तक) खींची जाती है जो पूर्ण समानता दर्शाती है।
- व्याख्या: लॉरेंज वक्र समान वितरण रेखा से जितना दूर होता है, असमानता (परिक्षेपण) उतनी ही अधिक होती है। यदि लॉरेंज वक्र समान वितरण रेखा के साथ संपाती हो जाता है, तो कोई परिक्षेपण नहीं होता (पूर्ण समानता)।
मानक विचलन के गुण:
- यदि श्रेणी के सभी मान समान हों, तो मानक विचलन शून्य होगा।
- यह मूल बिंदु (origin) में परिवर्तन से स्वतंत्र होता है, लेकिन पैमाने (scale) में परिवर्तन से प्रभावित होता है। अर्थात्, यदि प्रत्येक मान में कोई स्थिरांक जोड़ा या घटाया जाए, तो σ अपरिवर्तित रहता है, लेकिन यदि प्रत्येक मान को किसी स्थिरांक से गुणा या भाग किया जाए, तो σ भी उसी स्थिरांक से गुणा या भाग हो जाता है।
- संयुक्त मानक विचलन (Combined Standard Deviation) भी ज्ञात किया जा सकता है।
- माध्य से लिए गए विचलनों के वर्गों का योग न्यूनतम होता है।
अभ्यास हेतु बहुविकल्पीय प्रश्न (MCQs):
-
परिक्षेपण का कौन सा माप चरम मूल्यों (extreme values) से सबसे अधिक प्रभावित होता है?
(क) चतुर्थक विचलन
(ख) परास
(ग) माध्य विचलन
(घ) मानक विचलन -
यदि किसी श्रेणी के सभी पद 5 हैं, तो उसका मानक विचलन क्या होगा?
(क) 5
(ख) 1
(ग) 0
(घ) 25 -
दो श्रेणियों की संगति (consistency) की तुलना करने के लिए सबसे उपयुक्त माप कौन सा है?
(क) मानक विचलन
(ख) प्रसरण
(ग) विचरण गुणांक
(घ) चतुर्थक विचलन -
माध्य विचलन न्यूनतम होता है जब विचलनों को ______ से लिया जाता है।
(क) समांतर माध्य
(ख) बहुलक
(ग) माध्यिका
(घ) प्रथम चतुर्थक -
मानक विचलन का वर्ग कहलाता है:
(क) विचरण गुणांक
(ख) परास
(ग) प्रसरण (Variance)
(घ) माध्य विचलन -
कौन सा माप खुली अंत वाली श्रेणियों (open-ended series) के लिए परिकलित किया जा सकता है?
(क) परास
(ख) मानक विचलन
(ग) चतुर्थक विचलन
(घ) समांतर माध्य -
परास गुणांक का सूत्र है:
(क) (L+S)/(L-S)
(ख) (L-S)/(L+S)
(ग) (Q3-Q1)/(Q3+Q1)
(घ) σ / x̄ -
मानक विचलन (σ) परिक्षेपण का ______ माप है।
(क) निरपेक्ष
(ख) सापेक्ष
(ग) आलेखी
(घ) प्रतिशत -
आय की असमानता को दर्शाने के लिए सामान्यतः किस आलेखी विधि का प्रयोग किया जाता है?
(क) दंड आरेख
(ख) आयतचित्र
(ग) लॉरेंज वक्र
(घ) आवृत्ति बहुभुज -
यदि किसी श्रेणी के प्रत्येक मान में 10 जोड़ दिया जाए, तो मानक विचलन:
(क) 10 बढ़ जाएगा
(ख) 10 कम हो जाएगा
(ग) अपरिवर्तित रहेगा
(घ) 10 गुना हो जाएगा
उत्तर कुंजी:
- (ख)
- (ग)
- (ग)
- (ग)
- (ग)
- (ग)
- (ख)
- (क)
- (ग)
- (ग)
इन नोट्स को ध्यान से पढ़ें और सूत्रों तथा उनकी अवधारणाओं को समझें। विभिन्न प्रकार की श्रेणियों (व्यक्तिगत, खंडित, सतत) के लिए प्रत्येक माप की गणना का अभ्यास करना महत्वपूर्ण है। सरकारी परीक्षाओं में अवधारणाओं की स्पष्टता और सूत्रों का सही अनुप्रयोग आवश्यक है। शुभकामनाएँ!