7.4 सैंपलिंग त्रुटियां
(Sampling Errors)
प्रस्तावना: जब हम पूरी जनसंख्या (Population) के बजाय केवल कुछ लोगों (Sample) का अध्ययन करते हैं, तो परिणाम 100% सटीक नहीं हो सकते। वास्तविक मान और अनुमानित मान के बीच के इसी अंतर को 'सैंपलिंग त्रुटि' कहते हैं।
"सैंपलिंग त्रुटि = जनसंख्या का वास्तविक मान (Parameter) - सैंपल का अनुमानित मान (Statistic)"
आप सूप बना रहे हैं। नमक चेक करने के लिए आप एक चम्मच (Sample) चखते हैं।
हो सकता है कि उस एक चम्मच में नमक की डली आ जाए और आपको लगे सूप खारा है, जबकि बाकी पतीला ठीक है।
यह आपकी गलती नहीं है, यह 'संयोग' (Chance) है। यही सैंपलिंग त्रुटि है।
यह सांख्यिकी का सबसे महत्वपूर्ण नियम है:
"जैसे-जैसे आप सैंपल का आकार बढ़ाते जाएंगे (n), त्रुटि कम होती जाएगी। यदि आप पूरी जनसंख्या का सर्वे कर लें, तो सैंपलिंग त्रुटि शून्य (0) हो जाएगी।"
A. त्रुटियों के प्रकार (Types of Errors)
शोध में केवल सैंपलिंग की वजह से गलतियां नहीं होतीं। गलतियां दो तरह की होती हैं:
(Sampling Error)
यह केवल इसलिए होती है क्योंकि हमने सबको नहीं चुना। यह 'रैंडम' होती है।
- कारण: छोटा सैंपल साइज या दोषपूर्ण चयन।
- उपाय: सैंपल का आकार बढ़ाएं।
- प्रकृति: इसे गणितीय रूप से नापा जा सकता है।
(Non-Sampling Error)
यह मानवीय गलतियों (Human Error) के कारण होती है। इसका सैंपल साइज से उल्टा रिश्ता है।
- कारण: गलत डेटा एंट्री, झूठ बोलना, गलत फॉर्मूला, पक्षपात।
- खतरा: सैंपल साइज बढ़ाने पर यह त्रुटि बढ़ती है (क्योंकि ज्यादा डेटा = ज्यादा गलतियां)।
B. मानक त्रुटि (Standard Error - SE)
सैंपलिंग त्रुटि को नापने के लिए हम 'Standard Error' का उपयोग करते हैं:
जहाँ $\sigma$ = मानक विचलन (Standard Deviation),
$n$ = सैंपल का आकार।
निष्कर्ष: "हम सैंपलिंग त्रुटि को पूरी तरह खत्म नहीं कर सकते (जब तक कि हम जनगणना न करें), लेकिन हम सैंपल साइज बढ़ाकर इसे कम (Minimize) जरूर कर सकते हैं।"
