Class 11 Statistics Notes Chapter 3 (आँकड़ों का संगठन) – Shankhyaiki Book

चलिए, आज हम सांख्यिकी की पुस्तक 'शंखयायिकी' के अध्याय 3, 'आँकड़ों का संगठन' पर विस्तार से चर्चा करेंगे। यह अध्याय सरकारी परीक्षाओं की तैयारी के दृष्टिकोण से बहुत महत्वपूर्ण है क्योंकि आँकड़ों को सही ढंग से प्रस्तुत और व्यवस्थित करना सांख्यिकीय विश्लेषण का पहला और सबसे महत्वपूर्ण कदम है।
अध्याय 3: आँकड़ों का संगठन (Organization of Data)
1. परिचय (Introduction):
एकत्रित किए गए मूल आँकड़े अव्यवस्थित होते हैं, जिन्हें अपरिष्कृत आँकड़े (Raw Data) कहा जाता है। ये आँकड़े इतने बिखरे हुए होते हैं कि इनसे कोई सार्थक निष्कर्ष निकालना कठिन होता है। इसलिए, इन आँकड़ों को समझने योग्य और विश्लेषण योग्य बनाने के लिए उन्हें व्यवस्थित और वर्गीकृत करना आवश्यक है। इसी प्रक्रिया को आँकड़ों का संगठन कहते हैं।
उद्देश्य:
- आँकड़ों को सरल और संक्षिप्त बनाना।
- तुलना में सुविधा प्रदान करना।
- विशेषताओं को उजागर करना।
- सांख्यिकीय विश्लेषण के लिए आधार तैयार करना।
- भ्रम को दूर करना और आँकड़ों को आकर्षक बनाना।
2. वर्गीकरण (Classification):
आँकड़ों को उनकी समान विशेषताओं के आधार पर विभिन्न वर्गों या समूहों में व्यवस्थित करने की प्रक्रिया वर्गीकरण कहलाती है।
वर्गीकरण के आधार (Basis of Classification):
- भौगोलिक वर्गीकरण (Geographical Classification): आँकड़ों को भौगोलिक स्थिति या स्थान (जैसे देश, राज्य, शहर, क्षेत्र) के आधार पर वर्गीकृत किया जाता है।
- उदाहरण: भारत के विभिन्न राज्यों में गेहूं का उत्पादन।
- कालानुक्रमिक वर्गीकरण (Chronological Classification): आँकड़ों को समय (जैसे वर्ष, महीना, सप्ताह, दिन) के आधार पर आरोही या अवरोही क्रम में व्यवस्थित किया जाता है।
- उदाहरण: पिछले 5 वर्षों में भारत की जनसंख्या।
- गुणात्मक वर्गीकरण (Qualitative Classification): आँकड़ों को गुणों या विशेषताओं (जैसे लिंग, धर्म, शिक्षा, वैवाहिक स्थिति) के आधार पर वर्गीकृत किया जाता है, जिन्हें मापा नहीं जा सकता।
- सरल वर्गीकरण (Simple Classification): जब आँकड़ों को केवल एक गुण (जैसे लिंग - पुरुष/महिला) के आधार पर दो वर्गों में बाँटा जाता है।
- बहुगुणी वर्गीकरण (Manifold Classification): जब आँकड़ों को एक से अधिक गुणों (जैसे लिंग और साक्षरता) के आधार पर कई उप-वर्गों में बाँटा जाता है।
- मात्रात्मक या संख्यात्मक वर्गीकरण (Quantitative Classification): आँकड़ों को उन विशेषताओं के आधार पर वर्गीकृत किया जाता है जिन्हें संख्यात्मक रूप में मापा जा सकता है (जैसे ऊँचाई, भार, आय, अंक)। इसी वर्गीकरण से आवृत्ति वितरण (Frequency Distribution) का निर्माण होता है।
3. चर (Variable):
एक विशेषता या घटना जिसे मापा जा सकता है और जिसका मान एक इकाई से दूसरी इकाई में बदलता रहता है, चर कहलाती है।
- खंडित चर (Discrete Variable): वह चर जो केवल निश्चित या पूर्णांक मान (जैसे 1, 2, 3) ही ग्रहण कर सकता है, भिन्नात्मक नहीं। ये सामान्यतः गणना द्वारा प्राप्त होते हैं।
- उदाहरण: एक कक्षा में छात्रों की संख्या, एक परिवार में बच्चों की संख्या।
- सतत चर (Continuous Variable): वह चर जो एक निश्चित सीमा के भीतर कोई भी मान (पूर्णांक या भिन्नात्मक) ग्रहण कर सकता है। ये सामान्यतः मापन द्वारा प्राप्त होते हैं।
- उदाहरण: छात्रों की ऊँचाई (150.5 सेमी, 160.2 सेमी), व्यक्तियों का भार (55.7 किग्रा)।
4. आवृत्ति वितरण (Frequency Distribution):
मात्रात्मक वर्गीकरण का वह तरीका जिसमें आँकड़ों को विभिन्न वर्गों में बाँटा जाता है और प्रत्येक वर्ग में आने वाली मदों (इकाइयों) की संख्या को दर्शाया जाता है। यह दिखाता है कि विभिन्न मान कितनी बार आते हैं।
आवृत्ति वितरण से संबंधित महत्वपूर्ण शब्द:
- वर्ग (Class): वह सीमा या समूह जिसमें आँकड़ों को बाँटा जाता है (जैसे 10-20)।
- वर्ग सीमाएँ (Class Limits): प्रत्येक वर्ग की दो सीमाएँ होती हैं - निम्न सीमा (Lower Limit - L1) और उच्च सीमा (Upper Limit - L2)।
- उदाहरण: वर्ग 10-20 में, 10 निम्न सीमा है और 20 उच्च सीमा है।
- वर्ग अंतराल (Class Interval - i): किसी वर्ग की उच्च सीमा और निम्न सीमा के बीच का अंतर (i = L2 - L1)।
- उदाहरण: वर्ग 10-20 का वर्ग अंतराल 20 - 10 = 10 है।
- मध्य-बिंदु या वर्ग चिह्न (Mid-point or Class Mark): किसी वर्ग की उच्च सीमा और निम्न सीमा का औसत [(L1 + L2) / 2]।
- उदाहरण: वर्ग 10-20 का मध्य-बिंदु (10 + 20) / 2 = 15 है।
- आवृत्ति (Frequency - f): किसी वर्ग विशेष में आने वाली मदों या प्रेक्षणों की संख्या।
- मिलान चिह्न (Tally Marks): आवृत्ति गिनने के लिए प्रयोग किए जाने वाले चिह्न। चार खड़ी रेखाओं (||||) के बाद पाँचवीं रेखा इन्हें काटती हुई (卌) लगाई जाती है, जो 5 की गिनती दर्शाती है।
आवृत्ति वितरण के प्रकार:
- खंडित या असतत आवृत्ति वितरण (Discrete Frequency Distribution): यह खंडित चरों के लिए बनाया जाता है। इसमें प्रत्येक निश्चित मान के सामने उसकी आवृत्ति लिखी जाती है।
- उदाहरण:
अंक (X) मिलान चिह्न आवृत्ति (f) 10 20 卌 5 30
- उदाहरण:
- सतत आवृत्ति वितरण (Continuous Frequency Distribution): यह सतत चरों या बड़ी संख्या में मान वाले खंडित चरों के लिए बनाया जाता है। इसमें आँकड़ों को विभिन्न वर्ग अंतरालों में समूहीकृत किया जाता है।
- अपवर्जी विधि (Exclusive Method): इस विधि में, एक वर्ग की उच्च सीमा अगले वर्ग की निम्न सीमा होती है (जैसे 10-20, 20-30, 30-40)। इसमें वर्ग की उच्च सीमा के बराबर मान को उस वर्ग में शामिल न करके अगले वर्ग में शामिल किया जाता है (जैसे 20 अंक वाले छात्र को 10-20 वर्ग में नहीं, बल्कि 20-30 वर्ग में गिना जाएगा)। यह विधि सतत चरों के लिए अधिक उपयुक्त है।
- समावेशी विधि (Inclusive Method): इस विधि में, एक वर्ग की उच्च सीमा अगले वर्ग की निम्न सीमा नहीं होती; दोनों सीमाएँ उसी वर्ग में शामिल होती हैं (जैसे 10-19, 20-29, 30-39)। गणनाओं के लिए अक्सर इसे अपवर्जी विधि में बदलना पड़ता है। बदलने के लिए, दो क्रमागत वर्गों की उच्च और निम्न सीमा के अंतर का आधा (Adjustment Factor = (Lower limit of next class - Upper limit of current class) / 2) पिछली उच्च सीमा में जोड़ा जाता है और निम्न सीमा से घटाया जाता है। (उदाहरण: 10-19, 20-29 में अंतर 1 है, आधा 0.5 हुआ। तो वर्ग बनेंगे 9.5-19.5, 19.5-29.5)।
- खुले सिरे वाले वर्ग (Open-End Classes): जब पहले वर्ग की निम्न सीमा या अंतिम वर्ग की उच्च सीमा निर्दिष्ट नहीं होती (जैसे '10 से कम', '50 और अधिक')।
- संचयी आवृत्ति वितरण (Cumulative Frequency Distribution): इसमें वर्ग आवृत्तियों को जोड़ते हुए दिखाया जाता है।
- 'से कम' विधि (Less Than Method): प्रत्येक वर्ग की उच्च सीमा से कम मान वाली कुल आवृत्तियों को दर्शाया जाता है। (जैसे '10 से कम', '20 से कम', '30 से कम')।
- 'से अधिक' विधि (More Than Method): प्रत्येक वर्ग की निम्न सीमा या उससे अधिक मान वाली कुल आवृत्तियों को दर्शाया जाता है। (जैसे '0 या अधिक', '10 या अधिक', '20 या अधिक')।
5. द्विचर आवृत्ति वितरण (Bivariate Frequency Distribution):
जब दो चरों के मूल्यों को एक साथ वर्गीकृत किया जाता है, तो उसे द्विचर आवृत्ति वितरण कहते हैं। यह दो चरों के बीच संबंध दर्शाने में सहायक होता है। (जैसे छात्रों की ऊँचाई और भार का संयुक्त वितरण)।
परीक्षा की दृष्टि से महत्वपूर्ण बिंदु:
- वर्गीकरण के विभिन्न आधारों को उदाहरण सहित समझें।
- खंडित और सतत चर के बीच अंतर स्पष्ट होना चाहिए।
- अपवर्जी और समावेशी विधि की पहचान और समावेशी को अपवर्जी में बदलना आना चाहिए।
- वर्ग अंतराल, मध्य-बिंदु, आवृत्ति और संचयी आवृत्ति की गणना और अवधारणा स्पष्ट होनी चाहिए।
- मिलान चिह्नों का प्रयोग समझना चाहिए।
अभ्यास हेतु बहुविकल्पीय प्रश्न (MCQs):
प्रश्न 1: आँकड़ों को उनकी विशेषताओं के आधार पर विभिन्न समूहों में बाँटने की प्रक्रिया क्या कहलाती है?
(क) सारणीयन
(ख) वर्गीकरण
(ग) विश्लेषण
(घ) प्रस्तुतीकरण
प्रश्न 2: जब आँकड़ों को समय के अनुसार (जैसे वर्ष, माह) व्यवस्थित किया जाता है, तो यह किस प्रकार का वर्गीकरण है?
(क) भौगोलिक
(ख) गुणात्मक
(ग) मात्रात्मक
(घ) कालानुक्रमिक
प्रश्न 3: निम्नलिखित में से कौन सा एक खंडित चर का उदाहरण है?
(क) छात्रों की ऊँचाई
(ख) व्यक्तियों का भार
(ग) एक कक्षा में छात्रों की संख्या
(घ) तापमान
प्रश्न 4: वर्ग अंतराल 20-30 का मध्य-बिंदु (Class Mark) क्या होगा?
(क) 20
(ख) 30
(ग) 25
(घ) 10
प्रश्न 5: अपवर्जी विधि (Exclusive Method) में, वर्ग 10-20 में कौन सा मान शामिल किया जाएगा?
(क) केवल 10
(ख) केवल 20
(ग) 10 से 19.99 तक के मान
(घ) 10 और 20 दोनों
प्रश्न 6: समावेशी विधि (Inclusive Method) में वर्ग 10-19, 20-29 दिए गए हैं। इसे अपवर्जी विधि में बदलने पर पहला वर्ग क्या होगा?
(क) 10-20
(ख) 9.5-19.5
(ग) 10.5-19.5
(घ) 9-19
प्रश्न 7: मिलान चिह्न (Tally Mark) '卌 ||' किस संख्या को दर्शाता है?
(क) 5
(ख) 6
(ग) 7
(घ) 2
प्रश्न 8: 'से कम' संचयी आवृत्ति वितरण में, प्रत्येक वर्ग के सामने लिखी आवृत्ति क्या दर्शाती है?
(क) उस वर्ग की आवृत्ति
(ख) उस वर्ग की निम्न सीमा से कम मानों की कुल आवृत्ति
(ग) उस वर्ग की उच्च सीमा से कम मानों की कुल आवृत्ति
(घ) उस वर्ग की उच्च सीमा से अधिक मानों की कुल आवृत्ति
प्रश्न 9: वर्गीकरण का मुख्य उद्देश्य क्या है?
(क) आँकड़ों को जटिल बनाना
(ख) आँकड़ों को सरल और तुलनीय बनाना
(ग) आँकड़ों को छुपाना
(घ) केवल आँकड़ों को गिनना
प्रश्न 10: यदि किसी आवृत्ति वितरण में पहला वर्ग '10 से कम' लिखा है, तो यह किस प्रकार का वर्ग है?
(क) अपवर्जी वर्ग
(ख) समावेशी वर्ग
(ग) खुला सिरा वर्ग (Open-End Class)
(घ) मध्य-बिंदु वर्ग
उत्तरमाला (MCQs):
- (ख)
- (घ)
- (ग)
- (ग)
- (ग)
- (ख) [Adjustment Factor = (20-19)/2 = 0.5; L1=10-0.5=9.5, L2=19+0.5=19.5]
- (ग) [卌 = 5, || = 2; Total = 7]
- (ग)
- (ख)
- (ग)
इन नोट्स का ध्यानपूर्वक अध्ययन करें और अवधारणाओं को स्पष्ट करें। MCQs का अभ्यास आपकी समझ को परखने में मदद करेगा। शुभकामनाएँ!