अध्याय 14: सांख्यिकी (Statistics)
परिचय
हमारे दैनिक जीवन में, हम अक्सर ऐसी जानकारी देखते हैं जो संख्यात्मक तथ्यों या आंकड़ों (Data) के रूप में होती है। उदाहरण के लिए, समाचार पत्र विभिन्न खेलों में अर्थव्यवस्था, क्रिकेट बैट्समैन के औसत रन, या कंपनियों के लाभ के आंकड़ों के बारे में जानकारी देते हैं। गणित की एक शाखा है जो इन आंकड़ों के संग्रह, संगठन, विश्लेषण, व्याख्या और प्रस्तुतीकरण से संबंधित है। इस शाखा को **सांख्यिकी (Statistics)** कहते हैं। इस अध्याय में, हम आंकड़ों के विभिन्न पहलुओं, उनके प्रस्तुतीकरण के तरीकों और केंद्रीय प्रवृत्ति के मापों के बारे में जानेंगे।
14.1 आंकड़ों का संग्रह
**आंकड़े (Data)** वे तथ्य या संख्याएँ होती हैं जिन्हें किसी विशिष्ट उद्देश्य के लिए एकत्र किया जाता है। आंकड़ों को दो मुख्य प्रकारों में वर्गीकृत किया जा सकता है:
- **प्राथमिक आंकड़े (Primary Data):** ये वे आंकड़े होते हैं जिन्हें अन्वेषक द्वारा स्वयं सीधे स्रोत से पहली बार एकत्र किया जाता है। उदाहरण के लिए, यदि आप अपनी कक्षा के छात्रों की पसंदीदा खेल जानने के लिए उनका साक्षात्कार लेते हैं।
- **द्वितीयक आंकड़े (Secondary Data):** ये वे आंकड़े होते हैं जिन्हें पहले ही किसी और के द्वारा एकत्र और प्रकाशित किया जा चुका है और अन्वेषक उन्हें किसी अन्य स्रोत से प्राप्त करता है। उदाहरण के लिए, समाचार रिपोर्टों, सरकारी वेबसाइटों या पुस्तकों से आंकड़े प्राप्त करना।
14.2 आंकड़ों का प्रस्तुतीकरण
एकत्र किए गए आंकड़ों को समझना आसान बनाने के लिए उन्हें व्यवस्थित करना और प्रस्तुत करना महत्वपूर्ण है।
14.2.1 अवर्गीकृत बारंबारता बंटन सारणी
जब प्रेक्षणों की संख्या कम होती है, तो हम प्रत्येक प्रेक्षण के लिए बारंबारता (Frequency - वह संख्या जितनी बार कोई प्रेक्षण आता है) को दर्शाने वाली एक सारणी बना सकते हैं। यह **अवर्गीकृत बारंबारता बंटन सारणी** कहलाती है।
14.2.2 वर्गीकृत बारंबारता बंटन सारणी
जब प्रेक्षणों की संख्या बहुत अधिक होती है, तो उन्हें व्यक्तिगत रूप से दर्शाना अव्यवहारिक हो जाता है। ऐसे मामलों में, हम प्रेक्षणों को **वर्ग अंतरालों (Class Intervals)** में समूहित करते हैं। फिर प्रत्येक वर्ग अंतराल की बारंबारता ज्ञात की जाती है। यह **वर्गीकृत बारंबारता बंटन सारणी** कहलाती है।
- **वर्ग अंतराल (Class Interval):** डेटा को विभाजित करने के लिए उपयोग की जाने वाली श्रेणी (जैसे 0-10, 10-20)।
- **वर्ग माप (Class Size) या वर्ग चौड़ाई:** एक वर्ग अंतराल की ऊपरी सीमा और निचली सीमा के बीच का अंतर।
- **वर्ग सीमाएँ (Class Limits):** वर्ग अंतराल की सबसे छोटी और सबसे बड़ी मान (निचली सीमा और ऊपरी सीमा)।
14.3 आंकड़ों का आलेखीय निरूपण
आंकड़ों को आलेखों के रूप में प्रस्तुत करने से उन्हें आसानी से समझने और तुलना करने में मदद मिलती है।
- **दंड आलेख (Bar Graphs):** इनका उपयोग अवर्गीकृत बारंबारता बंटन या गुणात्मक डेटा को दर्शाने के लिए किया जाता है। इसमें आयताकार दंड होते हैं जिनकी ऊँचाई बारंबारता को दर्शाती है और सभी दंडों की चौड़ाई समान होती है और उनके बीच एक समान दूरी होती है।
- **आयत् चित्र (Histograms):** आयत् चित्र वर्गीकृत बारंबारता बंटन को दर्शाने के लिए उपयोग किए जाते हैं, विशेष रूप से सतत (continuous) डेटा के लिए। इसमें आयताकार दंड होते हैं जो एक दूसरे से सटे हुए होते हैं (उनके बीच कोई जगह नहीं होती)। आयतों की चौड़ाई वर्ग अंतरालों को दर्शाती है और उनकी ऊँचाई बारंबारता (या क्षेत्रफल, यदि वर्ग माप असमान हैं) को दर्शाती है।
- **बारंबारता बहुभुज (Frequency Polygons):** इन्हें या तो एक आयत् चित्र के शीर्ष-बिंदुओं के मध्य-बिंदुओं को जोड़कर बनाया जा सकता है, या सीधे वर्ग अंतरालों के वर्ग-चिह्नों (मध्य-बिंदुओं) और उनकी संगत बारंबारताओं को प्लॉट करके और उन्हें सीधी रेखा खंडों से जोड़कर बनाया जा सकता है।
14.4 केंद्रीय प्रवृत्ति के माप
केंद्रीय प्रवृत्ति के माप वे एकल मान होते हैं जो डेटा सेट के केंद्र का प्रतिनिधित्व करते हैं। तीन मुख्य माप हैं:
- **माध्य (Mean):** यह सभी प्रेक्षणों के योग को प्रेक्षणों की कुल संख्या से विभाजित करके प्राप्त किया गया औसत मान होता है।
- **माध्यक (Median):** यह डेटा सेट का मध्य मान होता है जब डेटा को आरोही या अवरोही क्रम में व्यवस्थित किया जाता है।
- **बहुलक (Mode):** यह डेटा सेट में सबसे अधिक बार आने वाला प्रेक्षण होता है।
पाठ्यपुस्तक के प्रश्न और उत्तर (Questions & Answers)
I. कुछ शब्दों या एक-दो वाक्यों में उत्तर दें।
-
सांख्यिकी क्या है?
सांख्यिकी गणित की वह शाखा है जो आंकड़ों के संग्रह, संगठन, विश्लेषण, व्याख्या और प्रस्तुतीकरण से संबंधित है।
-
प्राथमिक आंकड़े (Primary Data) क्या होते हैं?
प्राथमिक आंकड़े वे आंकड़े होते हैं जिन्हें अन्वेषक द्वारा स्वयं सीधे स्रोत से पहली बार एकत्र किया जाता है।
-
द्वितीयक आंकड़े (Secondary Data) क्या होते हैं?
द्वितीयक आंकड़े वे आंकड़े होते हैं जिन्हें पहले ही किसी और के द्वारा एकत्र और प्रकाशित किया जा चुका है।
-
बारंबारता (Frequency) क्या है?
बारंबारता यह दर्शाती है कि कोई विशेष प्रेक्षण या वर्ग अंतराल में मान कितनी बार आता है।
-
केंद्रीय प्रवृत्ति के तीन माप क्या हैं?
केंद्रीय प्रवृत्ति के तीन माप **माध्य (Mean), माध्यक (Median), और बहुलक (Mode)** हैं।
II. प्रत्येक प्रश्न का एक लघु पैराग्राफ (लगभग 30 शब्द) में उत्तर दें।
-
अवर्गीकृत बारंबारता बंटन और वर्गीकृत बारंबारता बंटन में क्या अंतर है?
अवर्गीकृत बारंबारता बंटन में प्रत्येक व्यक्तिगत प्रेक्षण की बारंबारता दर्शाई जाती है। वहीं, वर्गीकृत बारंबारता बंटन में, बड़ी संख्या में प्रेक्षणों को वर्ग अंतरालों में समूहित किया जाता है और फिर उन अंतरालों की बारंबारता दर्शायी जाती है।
-
आयत चित्र (Histogram) क्या है और यह दंड आलेख (Bar Graph) से कैसे भिन्न है?
आयत चित्र एक वर्गीकृत बारंबारता बंटन का आलेखीय निरूपण है जिसमें आयतों की चौड़ाई वर्ग अंतराल को दर्शाती है और ऊँचाई बारंबारता को दर्शाती है। यह दंड आलेख से भिन्न है क्योंकि इसमें आयतों के बीच कोई अंतर नहीं होता, और वे लगातार (contiguous) होते हैं।
-
वर्ग अंतराल (Class Interval) और वर्ग माप (Class Size) को परिभाषित करें।
वर्ग अंतराल किसी वर्गीकृत आंकड़े के लिए मूल्यों की एक श्रेणी होती है (जैसे 10-20)। वर्ग माप (या वर्ग चौड़ाई) वर्ग अंतराल की ऊपरी सीमा और निचली सीमा के बीच का अंतर होता है।
-
बहुलक (Mode) को कब माध्य (Mean) या माध्यक (Median) से बेहतर माप माना जाता है?
बहुलक को तब बेहतर माप माना जाता है जब आंकड़े में सबसे अधिक बारंबारता वाला मान आसानी से पहचाना जा सके, या जब डेटा गुणात्मक (qualitative) हो। यह विशेष रूप से तब उपयोगी होता है जब चरम मान (outliers) माध्य को बहुत अधिक प्रभावित कर सकते हैं।
III. प्रत्येक प्रश्न का दो या तीन पैराग्राफ (100–150 शब्द) में उत्तर दें।
-
माध्य (Mean), माध्यक (Median), और बहुलक (Mode) को परिभाषित करें और उनके बीच के अंतर को स्पष्ट करें।
**माध्य (Mean):** माध्य, जिसे अंकगणितीय माध्य भी कहा जाता है, केंद्रीय प्रवृत्ति का सबसे सामान्य माप है। यह सभी प्रेक्षणों के योग को प्रेक्षणों की कुल संख्या से विभाजित करके प्राप्त किया जाता है। इसका सूत्र है: माध्य $(\bar{x}) = \frac{\text{सभी प्रेक्षणों का योग}}{\text{प्रेक्षणों की कुल संख्या}}$ माध्य डेटा सेट में सभी मानों को ध्यान में रखता है और इसलिए चरम मानों (बहुत बड़े या बहुत छोटे मानों) से काफी प्रभावित हो सकता है। यह मात्रात्मक डेटा (quantitative data) के लिए सबसे उपयुक्त है।
**माध्यक (Median):** माध्यक केंद्रीय प्रवृत्ति का वह माप है जो डेटा सेट के बिल्कुल बीच में स्थित होता है, जब डेटा को आरोही या अवरोही क्रम में व्यवस्थित किया जाता है। यदि प्रेक्षणों की संख्या विषम है, तो माध्यक मध्य वाला प्रेक्षण होता है। यदि प्रेक्षणों की संख्या सम है, तो माध्यक दो मध्यवर्ती प्रेक्षणों का औसत होता है। माध्यक चरम मानों से कम प्रभावित होता है और यह डेटा के वितरण की एक अच्छी तस्वीर प्रदान करता है, विशेष रूप से जब डेटा विषम (skewed) होता है।
**बहुलक (Mode):** बहुलक किसी डेटा सेट में सबसे अधिक बार आने वाला प्रेक्षण है। एक डेटा सेट में एक बहुलक (एकल), कई बहुलक (बहु-बहुलक), या कोई बहुलक नहीं हो सकता है यदि कोई भी मान एक से अधिक बार न आए। बहुलक गुणात्मक (categorical) डेटा के लिए सबसे उपयोगी माप है, और यह संख्यात्मक डेटा में भी सबसे सामान्य मान को दर्शाता है। यह भी चरम मानों से प्रभावित नहीं होता है। संक्षेप में, माध्य एक 'औसत' मान है, माध्यक 'मध्य' मान है, और बहुलक 'सबसे सामान्य' मान है। प्रत्येक का उपयोग डेटा की विभिन्न विशेषताओं को समझने के लिए किया जाता है और डेटा के प्रकार और विश्लेषण के उद्देश्य के आधार पर उपयुक्त माप का चुनाव किया जाता है।
-
आंकड़ों के आलेखीय निरूपण के विभिन्न प्रकारों का वर्णन करें जो कक्षा 9 में पढ़ाए जाते हैं।
आंकड़ों के आलेखीय निरूपण से जानकारी को दृश्य रूप में प्रस्तुत करने में मदद मिलती है, जिससे उसे समझना और विश्लेषण करना आसान हो जाता है। कक्षा 9 में मुख्य रूप से तीन प्रकार के आलेखीय निरूपण पढ़ाए जाते हैं: 1. **दंड आलेख (Bar Graphs):** दंड आलेख का उपयोग अवर्गीकृत बारंबारता बंटन या गुणात्मक डेटा (जैसे पसंदीदा रंग, विभिन्न फल) को दर्शाने के लिए किया जाता है। इसमें आयताकार दंड होते हैं जिनकी ऊँचाई या लंबाई बारंबारता को दर्शाती है। सभी दंडों की चौड़ाई समान होती है और उनके बीच एक समान दूरी होती है। दंड आलेख विभिन्न श्रेणियों के बीच मात्राओं की तुलना करने के लिए उपयोगी होते हैं।
2. **आयत् चित्र (Histograms):** आयत् चित्र वर्गीकृत बारंबारता बंटन को दर्शाने के लिए उपयोग किए जाते हैं, खासकर जब डेटा सतत (continuous) होता है (जैसे ऊँचाई की श्रेणियाँ, भार की श्रेणियाँ)। इसमें आयताकार दंड होते हैं जो एक दूसरे से सटे हुए होते हैं (उनके बीच कोई जगह नहीं होती) क्योंकि वर्ग अंतराल भी सतत होते हैं। आयतों की चौड़ाई वर्ग अंतरालों को दर्शाती है और उनकी ऊँचाई बारंबारता (या क्षेत्रफल, यदि वर्ग माप असमान हैं) को दर्शाती है। आयत् चित्र डेटा के वितरण के आकार और पैटर्न को देखने में मदद करते हैं, जैसे कि यह सममित है या विषम।
3. **बारंबारता बहुभुज (Frequency Polygons):** बारंबारता बहुभुज एक वर्गीकृत बारंबारता बंटन को दर्शाने का एक और तरीका है। इसे या तो एक आयत् चित्र के शीर्ष-बिंदुओं के मध्य-बिंदुओं को जोड़कर बनाया जा सकता है, या सीधे वर्ग अंतरालों के वर्ग-चिह्नों (वर्ग के मध्य-बिंदुओं) और उनकी संगत बारंबारताओं को प्लॉट करके और उन्हें सीधी रेखा खंडों से जोड़कर बनाया जा सकता है। बहुभुज को x-अक्ष पर एक अतिरिक्त वर्ग-चिह्न जोड़कर बंद किया जाता है ताकि यह एक बंद बहुभुज बन सके। यह दो या दो से अधिक वितरणों की तुलना करने के लिए विशेष रूप से उपयोगी है और डेटा के पैटर्न को अधिक सुचारू रूप से दिखाता है। ये आलेखीय निरूपण आंकड़ों से त्वरित अंतर्दृष्टि प्राप्त करने और जटिल डेटा सेट को समझने में महत्वपूर्ण भूमिका निभाते हैं।
(ब्राउज़र के प्रिंट-टू-पीडीएफ फ़ंक्शन का उपयोग करता है। दिखावट भिन्न हो सकती है।)