11.3 विचलन के माप
(Standard Deviation & Variance)
प्रस्तावना: केंद्रीय प्रवृत्ति (Mean) हमें बताती है कि डेटा का "केंद्र" कहाँ है, लेकिन विचलन (Dispersion) हमें बताता है कि डेटा उस केंद्र से कितना दूर फैला हुआ है।
एक व्यक्ति ने सुना कि नदी की "औसत गहराई" 4 फीट है। उसने सोचा, "मैं तो 6 फीट लंबा हूँ, आराम से पार कर लूँगा।"
वह डूब गया। क्यों?
क्योंकि औसत 4 फीट था, लेकिन बीच में गहराई 10 फीट थी।
सबक: केवल औसत (Mean) पर भरोसा न करें, फैलाव (Variance) को भी देखें।
A. मुख्य माप (Key Measures)
यह बताता है कि डेटा अपने औसत (Mean) से औसतन कितना दूर है।
(समस्या: इसका उत्तर 'वर्ग' (Square) में आता है, जैसे cm²)
यह प्रसरण का वर्गमूल (Root) है। यह सबसे शुद्ध माप है क्योंकि यह डेटा की असली इकाई (Original Unit) में होता है।
B. फैलाव का मतलब (Understanding Spread)
कम विचलन (Low SD)
तीर निशाने के बिलकुल पास लगे हैं।
(Consistency)
अधिक विचलन (High SD)
तीर इधर-उधर बिखरे हुए हैं।
(Inconsistency)
डेटा: 3, 4, 5, 6, 7
-
Step 1:
Mean (औसत) निकालें:
(3+4+5+6+7) ÷ 5 = 5 -
Step 2:
अंतर (Deviation) निकालें (x - Mean):
-2, -1, 0, 1, 2 -
Step 3:
वर्ग (Square) करें:
4, 1, 0, 1, 4 -
Step 4:
इनका औसत निकालें (Variance):
(4+1+0+1+4) ÷ 5 = 2 (यह Variance है) -
Step 5:
वर्गमूल निकालें (Standard Deviation):
√2 = 1.41 (यह SD है)
निष्कर्ष: "Variance केवल बीच का रास्ता है, हमारी असली मंजिल Standard Deviation (SD) है, क्योंकि यह हमें बताता है कि डेटा कितना भरोसेमंद (Reliable) है।"
