12.3 सहसंबंध और प्रतिगमन
(Correlation and Regression Basics)
प्रस्तावना: सांख्यिकी में हम अक्सर दो चरों (Variables) के बीच का रिश्ता देखते हैं। क्या पढ़ाई करने से नंबर बढ़ते हैं? क्या धूप निकलने से आइसक्रीम ज्यादा बिकती है? इसे समझने के लिए हम इन दो तकनीकों का उपयोग करते हैं।
"यह रिश्ते को नापता है।"
क्या X और Y दोस्त हैं? क्या वे साथ-साथ चलते हैं?
"यह भविष्यवाणी करता है।"
अगर मुझे X पता है, तो क्या मैं Y की भविष्यवाणी (Prediction) कर सकता हूँ?
A. सहसंबंध (Correlation: r)
यह बताता है कि दो चरों में संबंध कितना मजबूत है। इसका मान -1 से +1 के बीच होता है।
जब एक बढ़ता है, तो दूसरा भी बढ़ता है।
जब एक बढ़ता है, तो दूसरा घटता है।
दोनों में कोई संबंध नहीं है।
B. प्रतिगमन (Regression: Prediction)
यह सहसंबंध से एक कदम आगे है। यह "कारण और प्रभाव" (Cause and Effect) का उपयोग करके भविष्य बताता है।
X = वह मान जो हमें पता है (Independent)
b = ढलान (Slope)
"अगर हमें X (पढ़ाई के घंटे) पता है, तो हम इस फॉर्मूले से Y (संभावित नंबर) निकाल सकते हैं।"
C. दोनों में मुख्य अंतर (Key Differences)
| आधार | सहसंबंध (Correlation) | प्रतिगमन (Regression) |
|---|---|---|
| उद्देश्य | रिश्ते की मजबूती नापना। | रिश्ते के आधार पर भविष्यवाणी करना। |
| चरों की भूमिका | X और Y दोनों समान हैं (Interchangeable)। | X (स्वतंत्र) और Y (आश्रित) तय होते हैं। |
| कारण और प्रभाव | यह कारण नहीं बताता (Correlation ≠ Causation)। | यह कारण और प्रभाव को दर्शाता है। |
| संकेत | r (rho) | Y = a + bX |
निष्कर्ष: "सहसंबंध हमें बताता है कि दो चीजें जुड़ी हुई हैं, लेकिन प्रतिगमन हमें उस जुड़ाव का उपयोग करके भविष्य देखने की शक्ति देता है।"
