Classification Metrics:Recall in hindi
Classification Metrics: Recall in Hindi
Table of Contents: Classification Metrics Recall in Hindi (Complete Guide)
Classification Metrics: Recall in Hindi
What is Recall in Classification Metrics
Machine Learning में जब हम किसी Classification model की performance को measure करते हैं, तब Recall एक बहुत ही important metric होता है। Recall का मतलब होता है — model ने actual positive cases में से कितने cases को सही तरीके से identify किया।
आसान भाषा में समझें तो Recall यह बताता है कि जिन data points का answer “Yes” होना चाहिए था, उनमें से model ने कितनों को सच में “Yes” predict किया। इसलिए इसे sensitivity या true positive rate भी कहा जाता है।
Recall Formula in Machine Learning
Recall को समझने के लिए हमें कुछ basic terms जाननी जरूरी हैं जैसे True Positive और False Negative। ये terms Confusion Matrix से आते हैं और exam point of view से बहुत important हैं।
Recall का mathematical formula बहुत simple होता है और इसे अक्सर numericals में पूछा जाता है।
Recall = True Positive / (True Positive + False Negative)
इस formula से साफ पता चलता है कि Recall सिर्फ actual positive cases पर focus करता है। Negative predictions इसमें directly involve नहीं होते।
Recall in Confusion Matrix
Confusion Matrix एक table होती है जो model की prediction को actual output के साथ compare करती है। इसमें चार values होती हैं: True Positive, True Negative, False Positive और False Negative।
Recall calculation में हम True Positive और False Negative का use करते हैं। इसका reason यह है कि Recall का focus होता है actual positive data को miss न करना।
| Actual / Predicted | Positive | Negative |
|---|---|---|
| Positive | True Positive (TP) | False Negative (FN) |
| Negative | False Positive (FP) | True Negative (TN) |
Recall calculate करते समय हम सिर्फ upper row यानी actual positive row को consider करते हैं। यही कारण है कि medical और fraud detection जैसे cases में Recall बहुत ज्यादा important होता है।
When to Use Recall Metric
Recall metric तब use किया जाता है जब actual positive case miss होना costly हो। ऐसे scenarios में model से ज्यादा उम्मीद की जाती है कि वह maximum positive cases पकड़ सके।
उदाहरण के लिए अगर किसी disease detection system में model किसी patient को disease-free बता दे जबकि उसे disease है, तो यह बहुत serious problem हो सकती है।
- Medical diagnosis systems
- Fraud detection in banking
- Spam email detection
- Security alert systems
इन सभी cases में Recall high होना जरूरी होता है ताकि कोई important case miss न हो। यहाँ Precision से ज्यादा Recall पर focus किया जाता है।
Advantages and Limitations of Recall
Recall का सबसे बड़ा advantage यह है कि यह false negatives को कम करने में help करता है। इसका मतलब है कि model important positive cases को ignore नहीं करता।
लेकिन Recall की limitation यह है कि यह false positives को ignore करता है। यानी model चाहे जितने गलत positive predict कर दे, Recall पर उसका असर नहीं पड़ता।
- High Recall means less missed positive cases
- Negative predictions की quality measure नहीं करता
- Precision के साथ combine करके बेहतर result देता है
Recall Example in Machine Learning
मान लो किसी exam में 100 students में से 40 students actually pass होने वाले हैं। Model ने 35 students को pass predict किया, जिनमें से 30 सच में pass थे।
यहाँ True Positive = 30 और False Negative = 10 होंगे, क्योंकि 10 actual pass students को model पहचान नहीं पाया।
Recall = 30 / (30 + 10) = 0.75
इसका मतलब है model ने 75% actual positive cases को सही identify किया। Exam में ऐसे examples अक्सर पूछे जाते हैं इसलिए concept clear होना जरूरी है।
Recall vs Precision in Classification Metrics
Classification में अक्सर students confuse हो जाते हैं कि Recall ज्यादा important है या Precision। दोनों metrics अलग-अलग situation में useful होते हैं और exam में इनका comparison बहुत पूछा जाता है।
Recall का focus होता है actual positive cases को miss न करना, जबकि Precision का focus होता है कि जो positive predict किए गए हैं वे कितने सही हैं।
| Metric | Main Focus | Use Case |
|---|---|---|
| Recall | Actual positives को पहचानना | Medical, Fraud, Security |
| Precision | Correct positive prediction | Spam filtering, Search results |
अगर exam में question आए कि “कौन सा metric use करेंगे”, तो situation समझना जरूरी है। जहाँ miss करना costly है, वहाँ Recall choose किया जाता है।
Recall and F1 Score Relationship
Real-world problems में सिर्फ Recall या सिर्फ Precision use करना सही approach नहीं होती। इसलिए F1 Score का concept introduce किया गया।
F1 Score Recall और Precision का harmonic mean होता है। इसका मतलब है कि दोनों metrics का balance measure किया जाता है।
F1 Score = 2 × (Precision × Recall) / (Precision + Recall)
Exam point of view से यह याद रखना जरूरी है कि अगर Recall high है लेकिन Precision low है, तो F1 Score भी balanced नहीं रहेगा।
Effect of Threshold on Recall
Classification models probability output देते हैं और threshold decide करता है कि output positive होगा या negative। Threshold change करने से Recall directly affect होता है।
जब threshold को कम कर दिया जाता है, तो model ज्यादा cases को positive predict करता है। इससे Recall बढ़ जाता है क्योंकि false negatives कम हो जाते हैं।
लेकिन threshold कम करने से false positives बढ़ते हैं, जिसका मतलब Precision decrease हो जाती है।
- Low threshold → High Recall
- High threshold → Low Recall
- Threshold tuning से model optimize होता है
Recall in Imbalanced Dataset
Imbalanced dataset वह होता है जहाँ classes बराबर नहीं होती, जैसे 95% negative और सिर्फ 5% positive cases।
ऐसे dataset में accuracy misleading हो सकती है, लेकिन Recall actual positive class की performance दिखाता है।
इसलिए exam में जब imbalanced data mention हो, तो Recall को important metric माना जाता है।
Real-Life Importance of Recall
Recall सिर्फ theoretical concept नहीं है, बल्कि real-life systems में इसका direct impact होता है।
Medical test में अगर Recall कम है, तो disease वाले patients miss हो सकते हैं, जो life-threatening situation बना सकता है।
- Cancer detection systems
- Credit card fraud detection
- Network intrusion detection
- Disaster alert systems
इन सभी examples में goal यह होता है कि कोई भी actual positive case छूटे नहीं।
Exam Oriented Notes on Recall
Competitive exams और university exams में Recall से जुड़े direct definition, formula और numericals पूछे जाते हैं।
कई बार question में confusion matrix दी जाती है और Recall calculate करने को कहा जाता है।
- Recall = TP / (TP + FN)
- Recall को Sensitivity भी कहते हैं
- False Negative कम करना Recall का goal है
- Imbalanced data में Recall ज्यादा reliable है
Common Mistakes Students Make with Recall
Students अक्सर Recall और Precision के formula को mix कर देते हैं, जो exam में negative marking का कारण बनता है।
एक common mistake यह है कि False Positive को Recall formula में include कर दिया जाता है, जो पूरी तरह गलत है।
Recall हमेशा actual positive class से related होता है, इस बात को clear रखना बहुत जरूरी है।
Deep Understanding of Recall for ML Students
Recall metric model की responsibility को दिखाता है कि वह कितनी seriousness से positive cases को पकड़ रहा है।
Machine Learning student के लिए Recall समझना जरूरी है, क्योंकि real projects में metric selection decision making को affect करता है।
अगर concept clear है, तो Precision, F1 Score और ROC curve जैसे advanced topics समझना आसान हो जाता है।