Class 12 Geography Notes Chapter 2 (आंकड़ों का प्रकमण) – Bhugol me Peryojnatmak Karya Book

प्रिय विद्यार्थियों,
आज हम भूगोल में प्रयोगात्मक कार्य पुस्तक के अध्याय 2 'आंकड़ों का प्रकमण' का विस्तृत अध्ययन करेंगे, जो आपकी सरकारी परीक्षाओं की तैयारी के लिए अत्यंत महत्वपूर्ण है। इस अध्याय में हम सीखेंगे कि कच्चे आंकड़ों को किस प्रकार व्यवस्थित, विश्लेषित और उपयोगी जानकारी में बदला जाता है।
अध्याय 2: आंकड़ों का प्रकमण (Processing of Data)
1. परिचय (Introduction)
कच्चे आंकड़े अपने आप में कोई महत्वपूर्ण जानकारी नहीं देते। उन्हें उपयोगी बनाने के लिए व्यवस्थित, वर्गीकृत, सारणीबद्ध और विश्लेषित करना आवश्यक होता है। आंकड़ों के प्रकमण में वे सभी विधियाँ शामिल हैं जिनके द्वारा आंकड़ों को अर्थपूर्ण और बोधगम्य बनाया जाता है।
2. आंकड़ों का वर्गीकरण (Classification of Data)
आंकड़ों को उनकी समान विशेषताओं के आधार पर विभिन्न वर्गों या समूहों में व्यवस्थित करना वर्गीकरण कहलाता है।
- उद्देश्य:
- आंकड़ों को सरल और संक्षिप्त बनाना।
- विभिन्न समूहों के बीच तुलना को आसान बनाना।
- आंकड़ों की मुख्य विशेषताओं को उजागर करना।
- विश्लेषण और व्याख्या का आधार तैयार करना।
- वर्गीकरण के आधार:
- गुणात्मक वर्गीकरण (Qualitative Classification): गुणों या विशेषताओं (जैसे लिंग, धर्म, व्यवसाय) के आधार पर।
- मात्रात्मक वर्गीकरण (Quantitative Classification): संख्यात्मक मानों (जैसे ऊंचाई, आय, जनसंख्या) के आधार पर।
- कालिक वर्गीकरण (Chronological Classification): समय के आधार पर (जैसे वार्षिक, मासिक आंकड़े)।
- स्थानिक वर्गीकरण (Spatial Classification): भौगोलिक स्थान के आधार पर (जैसे राज्यवार, जिलावार आंकड़े)।
3. आंकड़ों का सारणीयन (Tabulation of Data)
सारणीयन आंकड़ों को पंक्तियों (rows) और स्तंभों (columns) में व्यवस्थित करने की प्रक्रिया है।
- उद्देश्य:
- आंकड़ों को स्पष्ट और सुव्यवस्थित रूप में प्रस्तुत करना।
- तुलना में सुविधा प्रदान करना।
- स्थान की बचत करना।
- सांख्यिकीय विश्लेषण का आधार बनना।
- एक अच्छी सारणी के भाग:
- सारणी संख्या (Table Number): पहचान के लिए।
- शीर्षक (Title): सारणी की विषय-वस्तु का स्पष्ट विवरण।
- उपशीर्षक (Sub-title): यदि आवश्यक हो।
- स्तंभ शीर्षक/उपशीर्षक (Column Headings/Captions): स्तंभों की विषय-वस्तु।
- पंक्ति शीर्षक/उपशीर्षक (Row Headings/Stubs): पंक्तियों की विषय-वस्तु।
- मुख्य भाग (Body): वास्तविक आंकड़े।
- पाद टिप्पणी (Footnote): किसी विशेष जानकारी या अपवाद को स्पष्ट करने के लिए।
- स्रोत (Source): आंकड़ों के स्रोत का उल्लेख।
4. आंकड़ों का समूहन (Grouping of Data)
जब आंकड़े बड़ी संख्या में होते हैं, तो उन्हें छोटे समूहों या वर्ग अंतरालों में बांटा जाता है, जिसे बारंबारता वितरण (Frequency Distribution) कहते हैं।
- बारंबारता वितरण के प्रकार:
- विविक्त बारंबारता वितरण (Discrete Frequency Distribution): जब चर के मान निश्चित और अलग-अलग होते हैं (जैसे छात्रों की संख्या, परिवार के सदस्यों की संख्या)।
- सतत बारंबारता वितरण (Continuous Frequency Distribution): जब चर के मान एक सीमा के भीतर कोई भी मान ले सकते हैं (जैसे ऊंचाई, वजन, आय)।
- वर्ग अंतराल (Class Interval):
- निम्न सीमा (Lower Limit): वर्ग की सबसे छोटी संख्या।
- उच्च सीमा (Upper Limit): वर्ग की सबसे बड़ी संख्या।
- वर्ग विस्तार (Class Width/Size): उच्च सीमा और निम्न सीमा का अंतर।
- वर्ग मध्य बिंदु (Class Mid-point): (निम्न सीमा + उच्च सीमा) / 2।
- संचयी बारंबारता (Cumulative Frequency): किसी वर्ग या उससे कम/अधिक मानों की कुल बारंबारता।
- 'से कम' संचयी बारंबारता (Less Than Cumulative Frequency): किसी वर्ग की ऊपरी सीमा तक के सभी मानों की बारंबारता का योग।
- 'से अधिक' संचयी बारंबारता (More Than Cumulative Frequency): किसी वर्ग की निचली सीमा से ऊपर के सभी मानों की बारंबारता का योग।
5. केंद्रीय प्रवृत्ति के माप (Measures of Central Tendency)
ये वे मान हैं जो आंकड़ों के समूह के केंद्र या औसत को दर्शाते हैं। इन्हें 'औसत' भी कहते हैं।
- माध्य (Mean / Arithmetic Mean):
- अर्थ: सभी मानों के योग को मानों की कुल संख्या से विभाजित करने पर प्राप्त औसत।
- गणना:
- अवर्गीकृत आंकड़े: $\bar{X} = \Sigma X / N$
- वर्गीकृत आंकड़े (प्रत्यक्ष विधि): $\bar{X} = \Sigma fX / \Sigma f$ (जहाँ X वर्ग मध्य बिंदु है)
- वर्गीकृत आंकड़े (लघु विधि/कल्पित माध्य विधि): $\bar{X} = A + (\Sigma fd / \Sigma f)$ (जहाँ A कल्पित माध्य है, d = X - A)
- वर्गीकृत आंकड़े (पद-विचलन विधि): $\bar{X} = A + (\Sigma fd' / \Sigma f) \times i$ (जहाँ d' = (X - A) / i, i वर्ग अंतराल है)
- गुण: गणना में आसान, सभी मानों पर आधारित, बीजगणितीय विश्लेषण के लिए उपयुक्त, निश्चित और स्थिर।
- दोष: चरम मानों से अत्यधिक प्रभावित, खुले सिरे वाले वर्गों के लिए अनुपयुक्त।
- माध्यिका (Median):
- अर्थ: व्यवस्थित (आरोही या अवरोही क्रम में) आंकड़ों का केंद्रीय मान, जो आंकड़ों को दो बराबर भागों में बांटता है।
- गणना:
- अवर्गीकृत आंकड़े: पहले आंकड़ों को व्यवस्थित करें।
- यदि N विषम है, माध्यिका = $((N+1)/2)$ वां पद।
- यदि N सम है, माध्यिका = $(N/2)$ वें और $((N/2)+1)$ वें पद का औसत।
- वर्गीकृत आंकड़े: $M = L + ((N/2 - C_f) / f) \times i$
- जहाँ L = माध्यिका वर्ग की निचली सीमा, N = कुल बारंबारता, $C_f$ = माध्यिका वर्ग से ठीक पहले के वर्ग की संचयी बारंबारता, f = माध्यिका वर्ग की बारंबारता, i = माध्यिका वर्ग का वर्ग अंतराल।
- अवर्गीकृत आंकड़े: पहले आंकड़ों को व्यवस्थित करें।
- गुण: चरम मानों से अप्रभावित, खुले सिरे वाले वर्गों के लिए उपयुक्त, ग्राफीय रूप से ज्ञात किया जा सकता है।
- दोष: सभी मानों पर आधारित नहीं, बीजगणितीय विश्लेषण के लिए कम उपयुक्त, व्यवस्थित करना पड़ता है।
- बहुलक (Mode):
- अर्थ: आंकड़ों के समूह में सबसे अधिक बार आने वाला मान।
- गणना:
- अवर्गीकृत आंकड़े: सबसे अधिक बारंबारता वाला मान।
- वर्गीकृत आंकड़े: $Z = L + ((f_1 - f_0) / (2f_1 - f_0 - f_2)) \times i$
- जहाँ L = बहुलक वर्ग की निचली सीमा, $f_1$ = बहुलक वर्ग की बारंबारता, $f_0$ = बहुलक वर्ग से ठीक पहले के वर्ग की बारंबारता, $f_2$ = बहुलक वर्ग से ठीक बाद के वर्ग की बारंबारता, i = बहुलक वर्ग का वर्ग अंतराल।
- गुण: गणना में आसान, चरम मानों से अप्रभावित, गुणात्मक आंकड़ों के लिए भी उपयुक्त।
- दोष: हमेशा स्पष्ट रूप से परिभाषित नहीं होता (एक से अधिक बहुलक हो सकते हैं), सभी मानों पर आधारित नहीं।
- माध्य, माध्यिका और बहुलक के बीच आनुभाविक संबंध (Empirical Relationship):
- बहुलक = 3 माध्यिका - 2 माध्य (Mode = 3 Median - 2 Mean)
6. प्रकीर्णन के माप (Measures of Dispersion)
ये वे माप हैं जो दर्शाते हैं कि आंकड़े केंद्रीय मान से कितने फैले हुए या बिखरे हुए हैं।
- विस्तार (Range):
- अर्थ: आंकड़ों के अधिकतम और न्यूनतम मान के बीच का अंतर।
- गणना: विस्तार (R) = अधिकतम मान (L) - न्यूनतम मान (S)।
- गुण: गणना में सबसे आसान।
- दोष: केवल दो चरम मानों पर आधारित, आंकड़ों के फैलाव की पूरी जानकारी नहीं देता, चरम मानों से अत्यधिक प्रभावित।
- चतुर्थक विचलन (Quartile Deviation - QD):
- अर्थ: यह केंद्रीय 50% आंकड़ों के फैलाव को मापता है।
- गणना: $QD = (Q_3 - Q_1) / 2$
- $Q_1$ (प्रथम चतुर्थक) = $L + ((N/4 - C_f) / f) \times i$
- $Q_3$ (तृतीय चतुर्थक) = $L + ((3N/4 - C_f) / f) \times i$
- गुण: चरम मानों से अप्रभावित, खुले सिरे वाले वर्गों के लिए उपयुक्त।
- दोष: सभी मानों पर आधारित नहीं।
- माध्य विचलन (Mean Deviation - MD):
- अर्थ: आंकड़ों के मानों का उनके माध्य, माध्यिका या बहुलक से निरपेक्ष विचलनों का औसत।
- गणना: $MD = \Sigma |X - \bar{X}| / N$ (माध्य से) या $MD = \Sigma |X - M| / N$ (माध्यिका से)।
- गुण: गणना में आसान, सभी मानों पर आधारित।
- दोष: निरपेक्ष मानों का उपयोग बीजगणितीय विश्लेषण के लिए अनुपयुक्त बनाता है।
- मानक विचलन (Standard Deviation - SD or $\sigma$):
- अर्थ: यह माध्य से मानों के विचलनों के वर्गों के माध्य का वर्गमूल है। यह प्रकीर्णन का सबसे महत्वपूर्ण और व्यापक रूप से उपयोग किया जाने वाला माप है।
- गणना:
- अवर्गीकृत आंकड़े: $\sigma = \sqrt{(\Sigma (X - \bar{X})^2 / N)}$ या $\sigma = \sqrt{(\Sigma X^2 / N) - (\bar{X})^2}$
- वर्गीकृत आंकड़े (प्रत्यक्ष विधि): $\sigma = \sqrt{(\Sigma f(X - \bar{X})^2 / \Sigma f)}$
- वर्गीकृत आंकड़े (लघु विधि): $\sigma = \sqrt{(\Sigma fd^2 / \Sigma f) - (\Sigma fd / \Sigma f)^2}$ (जहाँ d = X - A)
- वर्गीकृत आंकड़े (पद-विचलन विधि): $\sigma = \sqrt{(\Sigma fd'^2 / \Sigma f) - (\Sigma fd' / \Sigma f)^2} \times i$ (जहाँ d' = (X - A) / i)
- गुण: सभी मानों पर आधारित, बीजगणितीय विश्लेषण के लिए उपयुक्त, प्रकीर्णन का सबसे स्थिर और विश्वसनीय माप।
- दोष: चरम मानों से प्रभावित, गणना में अपेक्षाकृत जटिल।
- विचरण (Variance): मानक विचलन का वर्ग ($\sigma^2$)।
- विचरण गुणांक (Coefficient of Variation - CV):
- अर्थ: यह प्रकीर्णन का एक सापेक्ष माप है, जिसका उपयोग दो या अधिक डेटा सेटों की तुलना करने के लिए किया जाता है, खासकर जब उनकी इकाइयाँ या माध्य अलग-अलग हों।
- गणना: $CV = (\sigma / \bar{X}) \times 100$
- उपयोग: तुलनात्मक अध्ययन में बहुत उपयोगी।
निष्कर्ष:
आंकड़ों का प्रकमण भूगोल में अनुसंधान और विश्लेषण के लिए एक आधारभूत कौशल है। केंद्रीय प्रवृत्ति और प्रकीर्णन के माप हमें आंकड़ों के समूह की विशेषताओं को समझने और विभिन्न भौगोलिक घटनाओं की तुलना करने में मदद करते हैं।
बहुविकल्पीय प्रश्न (Multiple Choice Questions - MCQs)
-
आंकड़ों को उनकी समान विशेषताओं के आधार पर विभिन्न वर्गों में व्यवस्थित करना क्या कहलाता है?
a) सारणीयन
b) वर्गीकरण
c) समूहन
d) प्रकमण
उत्तर: b) वर्गीकरण -
केंद्रीय प्रवृत्ति का कौन सा माप चरम मानों (extreme values) से सबसे कम प्रभावित होता है?
a) माध्य
b) माध्यिका
c) बहुलक
d) मानक विचलन
उत्तर: b) माध्यिका -
प्रकीर्णन का कौन सा माप सापेक्ष माप है और दो या अधिक डेटा सेटों की तुलना के लिए सबसे उपयुक्त है?
a) विस्तार
b) मानक विचलन
c) माध्य विचलन
d) विचरण गुणांक
उत्तर: d) विचरण गुणांक -
माध्य, माध्यिका और बहुलक के बीच आनुभाविक संबंध क्या है?
a) बहुलक = 2 माध्यिका - 3 माध्य
b) बहुलक = 3 माध्यिका - 2 माध्य
c) बहुलक = माध्य + माध्यिका
d) बहुलक = माध्य - माध्यिका
उत्तर: b) बहुलक = 3 माध्यिका - 2 माध्य -
यदि किसी डेटा सेट के सभी मान समान हों, तो उसका मानक विचलन क्या होगा?
a) 1
b) 100
c) 0
d) डेटा अपर्याप्त है
उत्तर: c) 0 -
वर्ग मध्य बिंदु की गणना का सूत्र क्या है?
a) (उच्च सीमा - निम्न सीमा) / 2
b) (उच्च सीमा + निम्न सीमा) / 2
c) उच्च सीमा - निम्न सीमा
d) उच्च सीमा + निम्न सीमा
उत्तर: b) (उच्च सीमा + निम्न सीमा) / 2 -
खुले सिरे वाले वर्ग अंतरालों (open-ended class intervals) वाले बारंबारता वितरण के लिए केंद्रीय प्रवृत्ति का कौन सा माप उपयुक्त नहीं है?
a) माध्यिका
b) बहुलक
c) माध्य
d) इनमें से कोई नहीं
उत्तर: c) माध्य -
वह माप जो आंकड़ों के अधिकतम और न्यूनतम मान के बीच का अंतर बताता है, क्या कहलाता है?
a) मानक विचलन
b) चतुर्थक विचलन
c) विस्तार
d) माध्य विचलन
उत्तर: c) विस्तार -
संचयी बारंबारता वितरण कितने प्रकार का होता है?
a) एक
b) दो
c) तीन
d) चार
उत्तर: b) दो ('से कम' और 'से अधिक') -
सारणी के किस भाग में आंकड़ों के स्रोत का उल्लेख किया जाता है?
a) शीर्षक
b) मुख्य भाग
c) पाद टिप्पणी
d) स्रोत
उत्तर: d) स्रोत
मुझे आशा है कि यह विस्तृत नोट्स और बहुविकल्पीय प्रश्न आपकी परीक्षा की तैयारी में सहायक होंगे। शुभकामनाएँ!