Class 11 Statistics Notes Chapter 2 (आँकड़ों का संग्रह) – Shankhyaiki Book

चलिए, आज हम सांख्यिकी के एक बहुत ही महत्वपूर्ण अध्याय 'आँकड़ों का संग्रह' (Collection of Data) पर विस्तार से चर्चा करेंगे। किसी भी सांख्यिकीय जांच या विश्लेषण की नींव सही और विश्वसनीय आँकड़ों पर टिकी होती है। सरकारी परीक्षाओं की दृष्टि से यह अध्याय अत्यंत महत्वपूर्ण है क्योंकि आँकड़ों की प्रकृति, स्रोत और संग्रह विधियों की समझ होना आवश्यक है।
आँकड़ों का संग्रह (Collection of Data)
सांख्यिकी में, 'आँकड़े' (Data) उन तथ्यों या सूचनाओं को कहते हैं जिन्हें संख्यात्मक रूप में व्यक्त किया जा सकता है और जिनका संग्रह किसी पूर्व-निश्चित उद्देश्य के लिए किया जाता है। आँकड़ों का संग्रह किसी भी सांख्यिकीय अनुसंधान का पहला और सबसे महत्वपूर्ण चरण है।
आँकड़ों के स्रोत (Sources of Data)
आँकड़ों के संग्रह के मुख्यतः दो स्रोत होते हैं:
-
प्राथमिक स्रोत (Primary Sources): जब अनुसंधानकर्ता स्वयं या अपने प्रतिनिधियों द्वारा मौलिक रूप से पहली बार आँकड़े एकत्रित करता है, तो इन आँकड़ों को प्राथमिक आँकड़े (Primary Data) कहा जाता है। ये आँकड़े मूल होते हैं और इन्हें अनुसंधान के उद्देश्य के अनुसार सीधे उद्गम स्थल से प्राप्त किया जाता है।
- उदाहरण: यदि आप अपने शहर के परिवारों की आय के बारे में जानकारी सीधे घर-घर जाकर पूछते हैं, तो यह प्राथमिक आँकड़े होंगे।
- लाभ: ये आँकड़े अनुसंधान के उद्देश्य के अनुरूप, अधिक विश्वसनीय और सटीक होते हैं।
- हानि: इनके संग्रह में अधिक समय, धन और श्रम लगता है।
-
द्वितीयक स्रोत (Secondary Sources): जब आँकड़े उन स्रोतों से प्राप्त किए जाते हैं जहाँ वे पहले से ही किसी अन्य उद्देश्य के लिए एकत्रित और संसाधित (processed) किए जा चुके होते हैं, तो उन्हें द्वितीयक आँकड़े (Secondary Data) कहा जाता है। ये आँकड़े मौलिक नहीं होते।
- उदाहरण: यदि आप परिवारों की आय की जानकारी सरकारी रिपोर्ट, पत्रिकाओं या किसी अन्य संस्था द्वारा प्रकाशित आँकड़ों से लेते हैं, तो यह द्वितीयक आँकड़े होंगे।
- लाभ: इनके संग्रह में कम समय, धन और श्रम लगता है क्योंकि ये पहले से उपलब्ध होते हैं।
- हानि: ये आँकड़े वर्तमान अनुसंधान के उद्देश्य के पूरी तरह उपयुक्त नहीं हो सकते हैं, इनकी विश्वसनीयता और सटीकता की जाँच आवश्यक होती है।
प्राथमिक आँकड़े एकत्रित करने की विधियाँ (Methods of Collecting Primary Data)
प्राथमिक आँकड़े एकत्रित करने की कई विधियाँ हैं, जिनमें प्रमुख हैं:
-
प्रत्यक्ष व्यक्तिगत अनुसंधान (Direct Personal Investigation):
- इसमें अनुसंधानकर्ता स्वयं सूचना देने वालों (informants) से प्रत्यक्ष संपर्क स्थापित करके जानकारी एकत्रित करता है।
- उपयुक्तता: जब अनुसंधान का क्षेत्र सीमित हो, आँकड़ों की शुद्धता और मौलिकता अत्यंत महत्वपूर्ण हो, और सूचना देने वालों से सीधा संपर्क संभव हो।
- गुण: उच्च स्तर की शुद्धता, लोचशीलता (प्रश्न बदले जा सकते हैं), विश्वसनीय आँकड़े।
- अवगुण: सीमित क्षेत्र के लिए उपयुक्त, खर्चीली (समय, धन, श्रम अधिक), व्यक्तिगत पक्षपात की संभावना।
-
अप्रत्यक्ष मौखिक अनुसंधान (Indirect Oral Investigation):
- इसमें समस्या से प्रत्यक्ष रूप से संबंधित व्यक्तियों से जानकारी न लेकर, उन अन्य व्यक्तियों (साक्षियों) से मौखिक पूछताछ द्वारा सूचना प्राप्त की जाती है, जिन्हें उस समस्या के बारे में जानकारी होने की उम्मीद होती है।
- उपयुक्तता: जब अनुसंधान का क्षेत्र विस्तृत हो, सूचना देने वाले सीधे जानकारी देने में अनिच्छुक हों या असमर्थ हों।
- गुण: विस्तृत क्षेत्र के लिए उपयुक्त, कम खर्चीली (प्रत्यक्ष की तुलना में), विशेषज्ञों की राय ली जा सकती है।
- अवगुण: साक्षियों के पक्षपात या अज्ञानता से आँकड़े प्रभावित हो सकते हैं, प्रत्यक्ष संपर्क न होने से विश्वसनीयता कम हो सकती है।
-
स्थानीय स्रोतों या संवाददाताओं द्वारा सूचना प्राप्ति (Information through Local Sources or Correspondents):
- इसमें अनुसंधानकर्ता विभिन्न स्थानों पर स्थानीय व्यक्ति या संवाददाता नियुक्त कर देता है, जो अपने-अपने क्षेत्रों से सूचनाएँ एकत्रित करके भेजते रहते हैं।
- उपयुक्तता: जब नियमित रूप से और लगातार सूचना की आवश्यकता हो, अनुसंधान का क्षेत्र बहुत विस्तृत हो, उच्च स्तर की शुद्धता आवश्यक न हो (जैसे समाचार पत्र, पत्रिकाएं)।
- गुण: विस्तृत क्षेत्र के लिए उपयुक्त, कम खर्चीली, नियमित सूचना प्राप्ति संभव।
- अवगुण: आँकड़ों में एकरूपता का अभाव, संवाददाताओं के व्यक्तिगत पक्षपात की संभावना, संग्रह में देरी हो सकती है।
-
प्रश्नावली तथा अनुसूचियों के माध्यम से सूचना संग्रह (Information through Questionnaires and Schedules):
- यह सबसे प्रचलित विधि है। इसमें प्रश्नों की एक सूची तैयार की जाती है, जिसे प्रश्नावली (Questionnaire) या अनुसूची (Schedule) कहते हैं।
- प्रश्नावली (Questionnaire): प्रश्नों की सूची सूचना देने वालों के पास डाक द्वारा भेजी जाती है और उनसे अनुरोध किया जाता है कि वे इसे भरकर वापस भेज दें।
- गुण: विस्तृत क्षेत्र के लिए उपयुक्त, कम खर्चीली (समय, धन, श्रम की बचत), सूचना देने वाले को सोचने का समय मिलता है, पक्षपात रहित।
- अवगुण: अशिक्षित लोगों के लिए अनुपयुक्त, उत्तर वापस न आने की संभावना, अस्पष्ट प्रश्नों का स्पष्टीकरण संभव नहीं, लोचशीलता का अभाव।
- अनुसूची (Schedule): इसमें अनुसंधानकर्ता द्वारा नियुक्त प्रगणक (Enumerator) स्वयं सूचना देने वालों के पास जाकर प्रश्न पूछता है और उत्तर अनुसूची में भरता है।
- गुण: विस्तृत क्षेत्र के लिए उपयुक्त, शिक्षित और अशिक्षित दोनों के लिए उपयोगी, व्यक्तिगत संपर्क से पूर्ण और शुद्ध जानकारी, प्रगणक प्रश्नों को स्पष्ट कर सकता है।
- अवगुण: खर्चीली (प्रगणकों का प्रशिक्षण और पारिश्रमिक), प्रगणकों के पक्षपात की संभावना, अधिक समय लगना।
एक अच्छी प्रश्नावली के गुण (Qualities of a Good Questionnaire):
- प्रश्नों की संख्या सीमित हो।
- प्रश्न सरल, स्पष्ट और छोटे हों।
- प्रश्न तार्किक क्रम में हों।
- प्रश्न व्यक्तिगत या विवादास्पद प्रकृति के न हों जिनसे उत्तरदाता असहज महसूस करे।
- गणना में सरलता हो (हाँ/नहीं, बहुविकल्पीय प्रश्न)।
- प्रश्नावली के साथ उद्देश्य स्पष्ट करने वाला एक कवर लेटर हो।
- प्रश्नावली का पूर्व-परीक्षण (Pilot Survey) कर लेना चाहिए।
द्वितीयक आँकड़े एकत्रित करने के स्रोत (Sources of Collecting Secondary Data)
द्वितीयक आँकड़े मुख्यतः दो स्रोतों से प्राप्त होते हैं:
-
प्रकाशित स्रोत (Published Sources):
- सरकारी प्रकाशन (केंद्रीय और राज्य सरकारों के मंत्रालय/विभाग, जैसे - भारत की जनगणना, राष्ट्रीय प्रतिदर्श सर्वेक्षण संगठन की रिपोर्टें, आर्थिक सर्वेक्षण)।
- अर्ध-सरकारी प्रकाशन (नगर पालिका, जिला परिषद)।
- समितियों और आयोगों की रिपोर्टें।
- व्यापार संघों के प्रकाशन।
- अनुसंधान संस्थाओं के प्रकाशन (जैसे - NCERT, ICAR)।
- पत्र-पत्रिकाएं और समाचार पत्र।
- अंतर्राष्ट्रीय प्रकाशन (जैसे - IMF, World Bank, UNO)।
-
अप्रकाशित स्रोत (Unpublished Sources):
- कई आँकड़े विभिन्न संगठनों (सरकारी, निजी) द्वारा अपने रिकॉर्ड के लिए एकत्रित किए जाते हैं लेकिन प्रकाशित नहीं होते।
- विश्वविद्यालयों में शोधकर्ताओं द्वारा किए गए शोध कार्य।
द्वितीयक आँकड़ों का उपयोग करते समय सावधानियाँ (Precautions while using Secondary Data):
द्वितीयक आँकड़ों का प्रयोग करने से पहले उनकी विश्वसनीयता, उपयुक्तता और पर्याप्तता की जाँच अवश्य करनी चाहिए। इसके लिए निम्नलिखित बातों पर ध्यान देना चाहिए:
- संग्रह करने वाली संस्था की योग्यता और उद्देश्य: क्या संस्था विश्वसनीय है? आँकड़े किस उद्देश्य से एकत्रित किए गए थे?
- संग्रह की विधि: आँकड़े किस विधि से एकत्रित किए गए थे? क्या वह विधि उपयुक्त थी?
- संग्रह का समय और परिस्थितियाँ: आँकड़े कब एकत्रित किए गए थे? क्या वे वर्तमान संदर्भ में प्रासंगिक हैं?
- परिभाषाएँ और इकाइयाँ: क्या आँकड़ों में प्रयुक्त परिभाषाएँ और इकाइयाँ वर्तमान अनुसंधान के अनुरूप हैं?
- शुद्धता का स्तर: आँकड़ों की शुद्धता का स्तर क्या है और क्या यह वर्तमान अनुसंधान के लिए पर्याप्त है?
भारत में आँकड़े एकत्रित करने वाली प्रमुख एजेंसियां (Major Agencies for Data Collection in India):
- भारत की जनगणना (Census of India): यह भारत सरकार के गृह मंत्रालय के अधीन महापंजीयक एवं जनगणना आयुक्त (Registrar General and Census Commissioner of India) द्वारा हर 10 वर्ष में आयोजित की जाती है। यह जनसंख्या, साक्षरता, लिंगानुपात, व्यवसायों आदि पर विस्तृत जानकारी प्रदान करती है।
- राष्ट्रीय प्रतिदर्श सर्वेक्षण कार्यालय (National Sample Survey Office - NSSO): अब यह राष्ट्रीय सांख्यिकी कार्यालय (National Statistical Office - NSO) का हिस्सा है। यह नियमित रूप से विभिन्न सामाजिक-आर्थिक विषयों जैसे गरीबी, रोज़गार, उपभोग व्यय, स्वास्थ्य, शिक्षा आदि पर राष्ट्रव्यापी सर्वेक्षण करता है।
- केंद्रीय सांख्यिकी कार्यालय (Central Statistics Office - CSO): अब यह भी NSO का हिस्सा है। यह राष्ट्रीय आय, औद्योगिक उत्पादन सूचकांक आदि जैसे महत्वपूर्ण आँकड़े संकलित और प्रकाशित करता है।
प्रारम्भिक/पायलट सर्वेक्षण (Pilot Survey):
किसी बड़े स्तर के सर्वेक्षण को वास्तविक रूप में करने से पहले, छोटे पैमाने पर एक जाँच सर्वेक्षण किया जाता है, जिसे पायलट सर्वेक्षण कहते हैं। इसका उद्देश्य प्रश्नावली/अनुसूची की कमियों, प्रश्नों की स्पष्टता, निर्देशों की उपयुक्तता और सर्वेक्षण की लागत तथा समय का अनुमान लगाना होता है। इससे मुख्य सर्वेक्षण को अधिक प्रभावी बनाया जा सकता है।
अभ्यास हेतु बहुविकल्पीय प्रश्न (MCQs for Practice):
प्रश्न 1: जब अनुसंधानकर्ता स्वयं पहली बार आँकड़े एकत्रित करता है, तो वे कहलाते हैं:
(क) द्वितीयक आँकड़े
(ख) प्राथमिक आँकड़े
(ग) प्रकाशित आँकड़े
(घ) अप्रकाशित आँकड़े
प्रश्न 2: निम्नलिखित में से कौन सी विधि प्राथमिक आँकड़े संग्रह की विधि नहीं है?
(क) प्रत्यक्ष व्यक्तिगत अनुसंधान
(ख) अप्रत्यक्ष मौखिक अनुसंधान
(ग) सरकारी रिपोर्टों से सूचना लेना
(घ) प्रश्नावली विधि
प्रश्न 3: डाक द्वारा प्रश्नावली भेजने की विधि की एक मुख्य सीमा क्या है?
(क) यह बहुत खर्चीली है।
(ख) यह केवल शिक्षित उत्तरदाताओं के लिए उपयुक्त है।
(ग) इसमें प्रगणक के पक्षपात की संभावना रहती है।
(घ) इसमें अधिक समय लगता है।
प्रश्न 4: भारत की जनगणना द्वारा एकत्रित आँकड़े किस प्रकार के आँकड़ों का उदाहरण हैं (जब कोई अन्य अनुसंधानकर्ता उनका प्रयोग करे)?
(क) प्राथमिक आँकड़े
(ख) द्वितीयक आँकड़े
(ग) मौखिक आँकड़े
(घ) इनमें से कोई नहीं
प्रश्न 5: NSSO (अब NSO) भारत में किस प्रकार के सर्वेक्षणों के लिए जाना जाता है?
(क) केवल जनसंख्या सर्वेक्षण
(ख) केवल औद्योगिक सर्वेक्षण
(ग) विभिन्न सामाजिक-आर्थिक सर्वेक्षण
(घ) केवल कृषि सर्वेक्षण
प्रश्न 6: द्वितीयक आँकड़ों का प्रयोग करने से पहले क्या जाँचना आवश्यक है?
(क) आँकड़ों की विश्वसनीयता
(ख) आँकड़ों की उपयुक्तता
(ग) आँकड़ों की पर्याप्तता
(घ) उपरोक्त सभी
प्रश्न 7: किस विधि में प्रगणक (Enumerator) स्वयं उत्तरदाता से प्रश्न पूछकर अनुसूची भरता है?
(क) डाक प्रश्नावली विधि
(ख) अनुसूची विधि (प्रगणक विधि)
(ग) अप्रत्यक्ष मौखिक अनुसंधान
(घ) स्थानीय संवाददाताओं द्वारा सूचना
प्रश्न 8: एक अच्छी प्रश्नावली का गुण है:
(क) प्रश्नों की अत्यधिक संख्या
(ख) अस्पष्ट और लंबे प्रश्न
(ग) सरल और स्पष्ट प्रश्न
(घ) व्यक्तिगत और विवादास्पद प्रश्न
प्रश्न 9: मुख्य सर्वेक्षण से पहले प्रश्नावली या प्रक्रिया की जाँच के लिए किया जाने वाला छोटा सर्वेक्षण कहलाता है:
(क) जनगणना सर्वेक्षण
(ख) प्रतिदर्श सर्वेक्षण
(ग) पायलट सर्वेक्षण
(घ) आर्थिक सर्वेक्षण
प्रश्न 10: समाचार पत्रों और पत्रिकाओं से प्राप्त आँकड़े सामान्यतः होते हैं:
(क) प्राथमिक आँकड़े
(ख) द्वितीयक आँकड़े
(ग) अप्रकाशित आँकड़े
(घ) मौलिक आँकड़े
उत्तरमाला (Answer Key):
- (ख) प्राथमिक आँकड़े
- (ग) सरकारी रिपोर्टों से सूचना लेना
- (ख) यह केवल शिक्षित उत्तरदाताओं के लिए उपयुक्त है।
- (ख) द्वितीयक आँकड़े
- (ग) विभिन्न सामाजिक-आर्थिक सर्वेक्षण
- (घ) उपरोक्त सभी
- (ख) अनुसूची विधि (प्रगणक विधि)
- (ग) सरल और स्पष्ट प्रश्न
- (ग) पायलट सर्वेक्षण
- (ख) द्वितीयक आँकड़े
मुझे उम्मीद है कि ये नोट्स और प्रश्न आपके लिए उपयोगी सिद्ध होंगे। ध्यान लगाकर पढ़ें और अभ्यास करें!