مثالوں سے تدریس
مشین لرننگ کی بنیاد: لیبل شدہ ڈیٹا سے نمونے سیکھنا اور مستقبل کی پیشین گوئی کرنا۔
کیا صرف مثالیں دیکھ کر مشین سیکھ سکتی ہے؟
۲۰۱۲ء میں گوگل کے محققین نے ایک تجربہ کیا۔ انہوں نے ایک نیورل نیٹ ورک کو ایک کروڑ یو ٹیوب ویڈیوز کے فریم دکھائے — بغیر کسی لیبل کے — اور نیٹ ورک نے خود بخود بلیوں کا تصور تیار کر لیا۔ اسے "گوگل کیٹ" تجربہ کہا گیا۔ یہ نتیجہ سائنسی دنیا میں حیران کن تھا: مشین نے کسی نے یہ نہیں بتایا کہ "بلی کیا ہوتی ہے" — پھر بھی اس نے انسانوں کی طرح درجہ بندی سیکھ لی۔
لیکن اس سے بھی اہم واقعہ اسی سال آیا جب AlexNet نے ImageNet مقابلے میں تمام روایتی طریقوں کو شکست دی — غلطی کی شرح ۲۶٪ سے ۱۵٪ تک لا کر۔ اس کامیابی کا راز؟ لاکھوں لیبل شدہ تصاویر اور گہری نیورل تعلیم۔ یہی "نگران تعلم" (Supervised Learning) کی طاقت تھی۔
نگران تعلم کیا ہے؟
نگران تعلم (Supervised Learning) وہ طریقہ ہے جس میں مشین کو ان پٹ اور درست آؤٹ پٹ کے جوڑے دکھائے جاتے ہیں۔ مثلاً: ایک تصویر دکھاؤ اور بتاؤ "یہ کتا ہے"۔ مشین ہزاروں ایسی مثالوں سے وہ فرق سیکھتی ہے جو کتے کو بلی یا گھوڑے سے الگ کرتا ہے۔
اس عمل میں تین چیزیں لازمی ہیں: ڈیٹا (مثالیں)، لیبل (درست جواب)، اور الگورتھم (سیکھنے کا طریقہ)۔ ہر بار جب مشین غلطی کرتی ہے، الگورتھم اسے درست کرتا ہے — بالکل اس طرح جیسے استاد طالب علم کو غلطی پر ٹوکے۔
لیبل (Label): ڈیٹا کا وہ درست جواب جو مشین کو سکھانے کے لیے انسان لگاتا ہے۔ مثلاً تصویر پر "بلی" لکھنا۔ بغیر لیبل کے نگران تعلم ممکن نہیں۔
ٹریننگ، ویلیڈیشن، اور ٹیسٹ
ڈیٹا کو عموماً تین حصوں میں تقسیم کیا جاتا ہے۔ پہلا حصہ "ٹریننگ سیٹ" ہے جس پر مشین سیکھتی ہے۔ دوسرا "ویلیڈیشن سیٹ" ہے جس پر سیکھنے کے دوران کارکردگی جانچی جاتی ہے۔ تیسرا "ٹیسٹ سیٹ" ہے جسے آخر میں استعمال کیا جاتا ہے تاکہ حقیقی کارکردگی پتہ چلے۔
- ٹریننگ سیٹ: عموماً ۷۰٪ ڈیٹا — یہاں مشین سیکھتی ہے
- ویلیڈیشن سیٹ: ۱۵٪ ڈیٹا — سیکھنے کے دوران جانچ
- ٹیسٹ سیٹ: ۱۵٪ ڈیٹا — آخری حقیقی جانچ
اوور فٹنگ کا خطرہ
اوور فٹنگ (Overfitting) وہ صورتحال ہے جب مشین ٹریننگ ڈیٹا کو اتنا اچھی طرح یاد کر لیتی ہے کہ نئے ڈیٹا پر ناکام ہو جاتی ہے۔ یہ ایسا ہے جیسے طالب علم امتحان کے سوالات رٹ لے لیکن اصل فہم نہ ہو۔ اچھا ماڈل وہ ہوتا ہے جو "عام کرے" — نئی صورتحال میں بھی کام کرے۔
مثالوں سے تدریس — کوئز
تین سوالوں سے اپنی سمجھ جانچیں۔
۱۔ نگران تعلم (Supervised Learning) میں لازمی کیا ہوتا ہے؟
۲۔ اوور فٹنگ (Overfitting) کا کیا مطلب ہے؟
۳۔ ۲۰۱۲ء کے AlexNet تجربے میں ImageNet پر غلطی کی شرح کتنی رہ گئی؟
مثالوں سے تدریس — لیب
AI استاد سے نگران تعلم کے بارے میں گفتگو کریں۔
لیب ہدایات
آپ ایک AI ماہر سے بات کریں گے جو نگران تعلم کے بنیادی تصورات پر آپ کی رہنمائی کرے گا۔
- AI کا سوال پڑھیں اور اپنا جواب اردو میں لکھیں۔
- مثالوں اور لیبل کے درمیان فرق پوچھیں۔
- اوور فٹنگ کی مثال دینے کی درخواست کریں۔
نمونے ہر جگہ
AI نمونے (پیٹرن) کیسے پہچانتی ہے — اور یہ نمونے کہاں سے آتے ہیں؟
کیا ہر قسم کے ڈیٹا میں کوئی نہ کوئی نمونہ چھپا ہوتا ہے؟
۲۰۱۶ء میں Google DeepMind کے AlphaGo نے گو (Go) کے عالمی چیمپئن Lee Sedol کو ۴-۱ سے شکست دی۔ گو ایک ایسا کھیل ہے جسے ماہرین "شطرنج سے زیادہ پیچیدہ" کہتے تھے۔ اس وقت تک کوئی نہیں سمجھتا تھا کہ مشین یہ کر سکے گی۔
AlphaGo کی کامیابی کا راز یہ تھا کہ اس نے انسانی کھلاڑیوں کی لاکھوں چالوں کے نمونے سیکھے، پھر خود سے کھیل کر اور بھی گہرے نمونے دریافت کیے۔ اس نے چال نمبر ۳۷ کھیلی جسے ماہرین نے "مافوق الفطرت" کہا — کیونکہ کوئی انسانی کتاب میں یہ چال نہ تھی۔ مشین نے نیا نمونہ خود تخلیق کیا تھا۔
نمونہ (پیٹرن) کیا ہے؟
نمونہ (Pattern) کوئی بھی باقاعدگی ہے جو ڈیٹا میں بار بار نظر آئے۔ ای میل میں "مفت" اور "فوری" الفاظ اسپام کی نشاندہی کرتے ہیں — یہ ایک نمونہ ہے۔ طبی تصویروں میں خاص قسم کی دھندلاہٹ کینسر کا اشارہ دے سکتی ہے — یہ بھی نمونہ ہے۔
AI کا کام یہ ہے کہ وہ ان نمونوں کو انسانوں سے زیادہ تیزی اور گہرائی سے پہچانے۔ نیورل نیٹ ورک کئی تہوں میں کام کرتا ہے: پہلی تہ سادہ خطوط پہچانتی ہے، دوسری شکلیں، تیسری اشیاء — اور یوں ایک پیچیدہ نمونہ ابھرتا ہے۔
پاکستان کے زرعی شعبے میں ڈرون سے لی گئی فصل کی تصاویر میں AI بیماری کے نمونے پہچان لیتی ہے۔ ایک کسان جو ہفتوں میں دیکھتا ہے، AI چند سیکنڈ میں شناخت کر لیتی ہے۔
خصوصیات کا انتخاب (Feature Selection)
تمام ڈیٹا یکساں اہم نہیں ہوتا۔ "فیچر سلیکشن" یعنی خصوصیات کا انتخاب وہ عمل ہے جس میں طے کیا جاتا ہے کہ کون سا ڈیٹا نمونے سیکھنے کے لیے اہم ہے۔ مثلاً مکان کی قیمت جاننے کے لیے مقام، رقبہ، اور کمروں کی تعداد اہم ہیں — دروازے کا رنگ غیر اہم۔
جدید ڈیپ لرننگ بعض اوقات خود بخود بہترین خصوصیات دریافت کر لیتی ہے — یہ اس کی سب سے بڑی طاقت ہے۔
- متعلقہ خصوصیات: نمونے کو مضبوط بناتی ہیں
- غیر متعلقہ خصوصیات: شور (Noise) پیدا کرتی ہیں
- ڈیپ لرننگ: خود بخود خصوصیات تلاش کرتی ہے
نمونے ہر جگہ — کوئز
نمونوں اور خصوصیات کے بارے میں اپنی سمجھ جانچیں۔
۱۔ AlphaGo کی چال نمبر ۳۷ کیوں حیران کن تھی؟
۲۔ "فیچر سلیکشن" کا مقصد کیا ہے؟
۳۔ نیورل نیٹ ورک تصویر میں نمونے کیسے پہچانتا ہے؟
نمونے ہر جگہ — لیب
روزمرہ زندگی میں AI کے نمونے دریافت کریں۔
لیب ہدایات
AI ماہر آپ کو روزمرہ ڈیٹا میں چھپے نمونوں کو دریافت کرنے میں مدد دے گا۔
- AI کا سوال سنیں اور کوئی حقیقی مثال دیں۔
- پوچھیں کہ اسپام ای میل میں کون سے نمونے ہوتے ہیں۔
- فیچر سلیکشن کی ایک مثال اپنے الفاظ میں بیان کریں۔
ماڈل کیا ہے؟
مشین لرننگ ماڈل: ریاضیاتی ڈھانچہ جو سیکھا ہوا علم محفوظ رکھتا ہے۔
ماڈل میں اصل میں کیا محفوظ ہوتا ہے؟
۲۰۲۳ء میں Meta نے LLaMA ماڈل جاری کیا — لیکن اس کے پیرامیٹرز (ماڈل کے اندر کی قدریں) لیک ہو گئے اور آن لائن پھیل گئے۔ یہ واقعہ اس لیے اہم ہے کیونکہ اس سے ظاہر ہوا کہ ایک ماڈل دراصل ارب ہا پیرامیٹرز کا مجموعہ ہے — اور یہی پیرامیٹرز "علم" ہیں۔ جس نے ماڈل کی فائل ڈاؤن لوڈ کی، اس نے وہ سارا سیکھا ہوا علم حاصل کر لیا۔
GPT-4 میں تخمیناً ایک ٹریلین سے زیادہ پیرامیٹرز ہیں۔ ہر پیرامیٹر ایک عدد ہے جو ٹریننگ کے دوران ایڈجسٹ ہوتا رہا۔ یہ اعداد مل کر زبان، منطق، اور علم کی نمائندگی کرتے ہیں۔
ماڈل کی ساخت
ماڈل (Model) ایک ریاضیاتی ڈھانچہ ہے جو ان پٹ کو آؤٹ پٹ میں تبدیل کرتا ہے۔ اس کے اندر "پیرامیٹرز" (Parameters) ہوتے ہیں — وہ اعداد جو ٹریننگ کے دوران بدلتے ہیں اور آخر میں "سیکھا ہوا علم" بن جاتے ہیں۔
نیورل نیٹ ورک میں نیورونز (Neurons) اور تہیں (Layers) ہوتی ہیں۔ ہر نیورون دوسرے سے "وزن" (Weight) کے ذریعے جڑا ہوتا ہے — اور یہ وزن ہی پیرامیٹرز ہیں۔ جتنے زیادہ پیرامیٹرز، اتنا پیچیدہ علم سیکھنے کی صلاحیت۔
GPT-2: ۱۵ کروڑ پیرامیٹرز (۲۰۱۹) · GPT-3: ۱۷۵ ارب (۲۰۲۰) · GPT-4: اندازاً ۱ ٹریلین سے زیادہ (۲۰۲۳)۔ ہر نسل میں پیرامیٹرز کئی گنا بڑھے۔
ٹریننگ کا عمل: نقصان اور اصلاح
ماڈل ٹریننگ کے دوران ایک چکر چلتا ہے: پہلے پیشین گوئی کریں، پھر غلطی ناپیں (Loss Function کے ذریعے)، پھر وزن ایڈجسٹ کریں (Back-propagation سے)۔ یہ چکر لاکھوں بار دہرایا جاتا ہے جب تک غلطی کم سے کم نہ ہو۔
گریڈیئنٹ ڈیسنٹ (Gradient Descent) وہ الگورتھم ہے جو یہ ایڈجسٹمنٹ کرتا ہے — یہ "پہاڑ سے نیچے اترنے" کی طرح ہے: ہر قدم غلطی کو تھوڑا کم کرتا ہے۔
- Loss Function: غلطی ناپنے کا پیمانہ
- Back-propagation: غلطی کو پیچھے پھیلانا
- Gradient Descent: وزن کو بہترین قدر کی طرف لے جانا
- Epoch: پورے ٹریننگ ڈیٹا کا ایک چکر
ماڈل کیا ہے؟ — کوئز
پیرامیٹرز اور ٹریننگ کے عمل پر اپنی سمجھ جانچیں۔
۱۔ ماڈل کے "پیرامیٹرز" کیا ہوتے ہیں؟
۲۔ "گریڈیئنٹ ڈیسنٹ" کیا کرتا ہے؟
۳۔ Meta کے LLaMA ماڈل کے لیک ہونے کا اہم سبق کیا تھا؟
ماڈل کیا ہے؟ — لیب
پیرامیٹرز، وزن، اور ٹریننگ کے عمل کو گہرائی سے سمجھیں۔
لیب ہدایات
AI ماہر سے ماڈل کی ریاضیاتی ساخت کے بارے میں سوال جواب کریں۔
- AI کا پہلا سوال سنیں اور اپنی سمجھ بتائیں۔
- پوچھیں کہ "ایپوک" (Epoch) کتنے ہونے چاہئیں۔
- بتائیں کہ آپ GPT ماڈل کے پیرامیٹرز کے بارے میں کیا جانتے ہیں۔
غیر نگران اور تقویتی تعلم
لیبل کے بغیر سیکھنا اور انعام کے ذریعے بہتر ہوتے رہنا۔
کیا مشین بغیر استاد کے خود سیکھ سکتی ہے؟
۲۰۱۳ء میں DeepMind نے ایک AI بنائی جس نے Atari ویڈیو گیمز سیکھے — صرف اسکرین کی تصاویر اور اسکور دیکھ کر۔ کسی نے اسے کھیلنا نہیں سکھایا۔ مشین نے خود اپنے تجربات سے سمجھا کہ کون سی حرکت اسکور بڑھاتی ہے۔
یہ "تقویتی تعلم" (Reinforcement Learning) کی کلاسیک مثال ہے۔ AI کو صرف "انعام" (Reward) ملتا تھا — اسکور بڑھے تو مثبت، کم ہو تو منفی۔ ۴۹ مختلف گیمز میں سے ۲۹ میں اس AI نے انسانی ماہرین کو پیچھے چھوڑ دیا۔ یہ بغیر کسی استاد کے، صرف آزمائش اور غلطی سے سیکھنا تھا۔
غیر نگران تعلم (Unsupervised Learning)
غیر نگران تعلم میں کوئی لیبل نہیں ہوتا۔ مشین خود ڈیٹا میں چھپے گروہ (Clusters) اور ڈھانچے دریافت کرتی ہے۔ مثلاً ایک بینک کروڑوں لین دین دیکھتا ہے — AI بغیر بتائے پہچان لیتی ہے کہ کون سے لین دین "غیر معمولی" ہیں۔
K-Means Clustering اور Autoencoders اس کی عام تکنیکیں ہیں۔ Netflix کا "آپ کو یہ پسند آئے گا" نظام بھی اسی پر کام کرتا ہے — وہ صارفین کو ان کی پسند کی بنیاد پر گروہوں میں تقسیم کرتا ہے۔
تقویتی تعلم (Reinforcement Learning)
تقویتی تعلم میں ایک "ایجنٹ" (Agent) ماحول میں قدم اٹھاتا ہے اور ہر قدم پر انعام یا سزا ملتی ہے۔ وقت کے ساتھ ایجنٹ سیکھتا ہے کہ کون سی "پالیسی" (Policy) زیادہ کل انعام دیتی ہے۔
ChatGPT اور GPT-4 کو بھی "RLHF" (Reinforcement Learning from Human Feedback) سے بہتر بنایا گیا — انسانی رائے کو انعام کے طور پر استعمال کیا گیا۔ یہی وجہ ہے کہ یہ ماڈل زیادہ مددگار اور محفوظ جوابات دیتے ہیں۔
- ایجنٹ: سیکھنے والی مشین
- ماحول: وہ دنیا جس میں ایجنٹ کام کرتا ہے
- انعام: مثبت یا منفی اشارہ
- پالیسی: بہترین اقدام کا منصوبہ
غیر نگران اور تقویتی تعلم — کوئز
تعلم کی اقسام پر اپنی سمجھ جانچیں۔
۱۔ تقویتی تعلم میں AI کیسے سیکھتی ہے؟
۲۔ RLHF کا مطلب کیا ہے؟
۳۔ DeepMind کے Atari تجربے میں AI کو کیا "انعام" ملتا تھا؟
غیر نگران اور تقویتی تعلم — لیب
تعلم کی مختلف اقسام اور ان کے فرق کو گہرائی سے سمجھیں۔
لیب ہدایات
AI ماہر سے تعلم کی اقسام کے درمیان فرق سمجھیں۔
- AI کا پہلا سوال سنیں اور فرق بیان کریں۔
- پوچھیں کہ روبوٹکس میں تقویتی تعلم کیسے کام کرتا ہے۔
- کوئی ایسا مسئلہ بتائیں جہاں غیر نگران تعلم بہتر ہو۔
ڈیٹا کا مسئلہ
غلط، ناکافی، یا متعصب ڈیٹا AI کو کیسے تباہ کر سکتا ہے؟
اگر ڈیٹا غلط ہو تو AI کیا سیکھے گی؟
۲۰۱۵ء میں Amazon نے ایک AI بھرتی نظام تیار کیا جو CVs کو خود بخود جانچے۔ لیکن ۲۰۱۸ء میں یہ انکشاف ہوا کہ یہ نظام خواتین کے درخواستیں مسترد کر رہا تھا — کیونکہ اسے جس ٹریننگ ڈیٹا سے سکھایا گیا تھا وہ پچھلے دس سال کی بھرتیوں پر مبنی تھا جس میں مرد اکثریت میں تھے۔
AI نے انسانی تعصب سیکھ لیا اور اسے "قانون" سمجھ لیا۔ Amazon نے یہ پروگرام بند کر دیا۔ یہ واقعہ ثابت کرتا ہے کہ ڈیٹا اگر متعصب ہو تو AI بھی متعصب ہو جاتی ہے — چاہے الگورتھم کتنا بھی اچھا ہو۔
تعصب (Bias) کہاں سے آتا ہے؟
ڈیٹا میں تعصب کئی طریقوں سے داخل ہوتا ہے۔ پہلا: تاریخی تعصب — اگر ماضی کے فیصلے غیر منصفانہ تھے تو AI وہی سیکھے گی۔ دوسرا: نمائندگی کا فقدان — اگر کچھ گروہ ڈیٹا میں کم ہیں تو AI ان پر ناقص کام کرے گی۔ تیسرا: پیمائش کا تعصب — اگر غلط چیز ناپی جا رہی ہو۔
۲۰۱۹ء میں امریکہ میں ایک طبی الگورتھم نے سیاہ فام مریضوں کو کم ترجیح دی۔ وجہ: یہ خرچ کو "ضرورت" کا اشارہ سمجھتا تھا — اور تاریخی طور پر سیاہ فام مریضوں پر کم خرچ ہوا تھا۔ (ماخذ: Science جریدہ، ۲۰۱۹)
ڈیٹا کے دیگر مسائل
ڈیٹا کا حجم بھی اہم ہے۔ کم ڈیٹا پر سیکھا ماڈل اعتماد کے ساتھ غلط نتائج دے سکتا ہے۔ ڈیٹا کا معیار بھی ضروری ہے — غلط لیبل، ڈپلیکیٹ مثالیں، یا گمشدہ قدریں ماڈل کو نقصان پہنچاتی ہیں۔
اردو، پشتو، اور سندھی جیسی زبانوں کے لیے AI کم کارآمد ہے کیونکہ انٹرنیٹ پر ان زبانوں کا ڈیٹا کم ہے — یہ بھی نمائندگی کا بحران ہے۔
- کم ڈیٹا: ماڈل کم قابل اعتماد
- غلط لیبل: ماڈل غلط چیز سیکھتا ہے
- متعصب ڈیٹا: AI انصاف سے کام نہیں کرتی
- نمائندگی کا فقدان: اقلیتی گروہوں پر خراب کارکردگی
ڈیٹا کا مسئلہ — کوئز
ڈیٹا کے تعصب اور مسائل پر اپنی سمجھ جانچیں۔
۱۔ Amazon کے AI بھرتی نظام نے خواتین کو مسترد کیوں کیا؟
۲۔ اردو کے لیے AI ماڈل کیوں کم کارآمد ہیں؟
۳۔ ڈیٹا کے معیار کا سب سے بڑا خطرہ کیا ہے؟
ڈیٹا کا مسئلہ — لیب
ڈیٹا کے تعصب اور اس کے نتائج کو سمجھیں۔
لیب ہدایات
AI ماہر سے ڈیٹا کے تعصب، معیار، اور منصفانہ AI کے بارے میں بات کریں۔
- AI کا پہلا سوال سنیں اور جواب دیں۔
- پوچھیں کہ ڈیٹا کا تعصب کیسے دریافت کیا جا سکتا ہے۔
- پاکستانی سیاق میں ایک مثال دیں جہاں متعصب AI نقصاندہ ہو سکتی ہے۔
پری ٹریننگ اور فائن ٹیوننگ
عام بڑے ماڈل کو مخصوص کام کے لیے تیار کرنے کا فن۔
کیا ایک ماڈل ہر کام کے لیے الگ سکھانا ضروری ہے؟
۲۰۱۸ء میں Google نے BERT (Bidirectional Encoder Representations from Transformers) جاری کیا۔ BERT کو پہلے انٹرنیٹ کے ارب ہا الفاظ پر "پری ٹرین" کیا گیا — یہ سیکھا کہ زبان کیسے کام کرتی ہے، الفاظ کے درمیان تعلق کیا ہے۔
پھر اسی ماڈل کو چھوٹے مخصوص ڈیٹا سیٹس پر "فائن ٹیون" کیا گیا — طبی تشخیص، قانونی دستاویزات، جذباتی تجزیہ۔ ہر بار پری ٹرینڈ علم محفوظ رہا اور صرف نئی مہارت شامل کی گئی۔ BERT نے ۱۱ مختلف NLP کاموں میں نئے ریکارڈ قائم کیے — یہ "ٹرانسفر لرننگ" کا انقلاب تھا۔
پری ٹریننگ: بنیاد بنانا
پری ٹریننگ (Pre-training) وہ مرحلہ ہے جس میں ایک بہت بڑا ماڈل بہت زیادہ عام ڈیٹا پر سیکھتا ہے۔ GPT-4 کو انٹرنیٹ کے کھربوں الفاظ پر پری ٹرین کیا گیا — کتابیں، مضامین، ویب صفحات، کوڈ۔ اس مرحلے میں ماڈل زبان کی عمومی سمجھ حاصل کرتا ہے۔
یہ عمل بہت مہنگا اور وقت طلب ہے۔ GPT-4 کی ٹریننگ میں تخمیناً ۱۰۰ ملین ڈالر خرچ ہوئے اور ہزاروں GPU کئی ماہ چلے۔ اسی لیے صرف بڑی کمپنیاں یہ کر سکتی ہیں۔
فائن ٹیوننگ: مہارت شامل کرنا
فائن ٹیوننگ (Fine-tuning) میں ایک پری ٹرینڈ ماڈل کو کسی مخصوص کام کے لیے کم ڈیٹا پر مزید سکھایا جاتا ہے۔ مثلاً: ایک ہسپتال GPT بیس ماڈل کو اپنے طبی ریکارڈ پر فائن ٹیون کر کے مریض کی تشخیص میں مدد لے سکتا ہے۔
ٹرانسفر لرننگ (Transfer Learning) اس پورے خیال کا نام ہے: ایک کام میں سیکھا علم دوسرے کام میں منتقل کرنا۔ یہ وقت اور پیسے دونوں بچاتا ہے۔
- پری ٹریننگ: عام، بڑا، مہنگا — صرف ایک بار
- فائن ٹیوننگ: مخصوص، چھوٹا، سستا — بار بار ممکن
- ٹرانسفر لرننگ: علم کی منتقلی — AI کا اہم ہتھیار
- PEFT: بہت کم پیرامیٹرز فائن ٹیون کر کے کام نکالنا
پری ٹریننگ اور فائن ٹیوننگ — کوئز
ٹرانسفر لرننگ اور ماڈل تیاری پر اپنی سمجھ جانچیں۔
۱۔ BERT ماڈل نے ۲۰۱۸ء میں کیا کامیابی حاصل کی؟
۲۔ فائن ٹیوننگ، پری ٹریننگ سے کیسے مختلف ہے؟
۳۔ GPT-4 کی پری ٹریننگ کا اندازاً خرچ کتنا تھا؟
پری ٹریننگ اور فائن ٹیوننگ — لیب
ٹرانسفر لرننگ کو عملی سیاق میں سمجھیں۔
لیب ہدایات
AI ماہر سے پری ٹریننگ اور فائن ٹیوننگ کے عملی پہلوؤں پر گفتگو کریں۔
- AI کا پہلا سوال سنیں اور جواب دیں۔
- پوچھیں کہ پاکستانی یونیورسٹیاں GPT ماڈل فائن ٹیون کر سکتی ہیں؟
- ایک ایسا شعبہ بتائیں جہاں فائن ٹیوننگ پاکستان میں مفید ہو۔
جانچ اور بینچ مارکس
AI کی کارکردگی کیسے ناپی جاتی ہے — اور اس پیمائش کی حدود کیا ہیں؟
کیا بینچ مارک اسکور ہمیشہ حقیقی صلاحیت ظاہر کرتا ہے؟
۲۰۲۳ء میں متعدد AI کمپنیوں نے دعویٰ کیا کہ ان کے ماڈل MMLU (Massive Multitask Language Understanding) بینچ مارک پر انسانی سطح سے بہتر ہیں۔ لیکن جب محققین نے انہی ماڈلوں کو MMLU کے سوالات کی معمولی تبدیلیوں کے ساتھ آزمایا تو کارکردگی ڈرامائی انداز میں گر گئی۔
اس مسئلے کو "بینچ مارک سیچوریشن" (Benchmark Saturation) کہا جاتا ہے — جب ماڈل بینچ مارک کے سوالات "رٹ" لیتے ہیں کیونکہ وہ ٹریننگ ڈیٹا میں موجود تھے۔ ۲۰۲۴ء میں ARC-AGI بینچ مارک متعارف کرایا گیا جسے نئی قسم کے مسائل سے بنایا گیا تاکہ اسے رٹا نہ جا سکے۔
بینچ مارک کیا ہے؟
بینچ مارک (Benchmark) وہ معیاری امتحان ہے جس سے AI ماڈلوں کی کارکردگی ناپی اور موازنہ کی جاتی ہے۔ مشہور بینچ مارکس میں MMLU (کثیر مضامین)، HumanEval (کوڈنگ)، HellaSwag (عام فہم)، اور GSM8K (ریاضی) شامل ہیں۔
Accuracy: کتنے فیصد جوابات درست۔ Precision: مثبت جوابات میں سے کتنے واقعی مثبت۔ Recall: تمام مثبت صورتحالوں میں سے کتنی پکڑی گئیں۔ F1 Score: Precision اور Recall کا توازن۔
بینچ مارک کی حدود
بینچ مارک ہمیشہ حقیقی دنیا کی کارکردگی نہیں ظاہر کرتا۔ "ڈیٹا کنٹامینیشن" ایک بڑا مسئلہ ہے — اگر بینچ مارک کے سوالات ٹریننگ ڈیٹا میں تھے تو اسکور مصنوعی طور پر اونچا ہو گا۔ اسے "Goodhart's Law" بھی کہتے ہیں: جب پیمانہ ہدف بن جائے تو پیمانہ ناکارہ ہو جاتا ہے۔
اسی لیے انسانی جانچ (Human Evaluation) بھی ضروری ہے — خاص طور پر تخلیقی کاموں، ہمدردی، اور سماجی سمجھ بوجھ کے لیے جہاں اعداد ناکافی ہیں۔
- بینچ مارک سیچوریشن: ماڈل سوالات رٹ لیتے ہیں
- ڈیٹا کنٹامینیشن: بینچ مارک ٹریننگ ڈیٹا میں آ جاتا ہے
- Goodhart's Law: پیمانہ ہدف بنا تو بے کار ہو گیا
- انسانی جانچ: سماجی اور تخلیقی کاموں کے لیے لازم
جانچ اور بینچ مارکس — کوئز
AI کی جانچ اور پیمائش پر اپنی سمجھ جانچیں۔
۱۔ "بینچ مارک سیچوریشن" کا کیا مطلب ہے؟
۲۔ F1 Score کیا ناپتا ہے؟
۳۔ Goodhart's Law کا AI پر کیا اطلاق ہوتا ہے؟
جانچ اور بینچ مارکس — لیب
AI جانچ کے طریقوں اور ان کی حدود کو تنقیدی نگاہ سے دیکھیں۔
لیب ہدایات
AI ماہر سے بینچ مارکس اور جانچ کے طریقوں پر تنقیدی گفتگو کریں۔
- AI کا پہلا سوال سنیں اور اپنی رائے دیں۔
- پوچھیں کہ کون سا بینچ مارک سب سے قابل اعتماد ہے۔
- انسانی جانچ اور خودکار جانچ کے فرق پر بحث کریں۔
سرحد: AI ابھی کیا نہیں سیکھ سکتی
موجودہ AI کی بنیادی حدود — وہ مسائل جو ابھی حل نہیں ہوئے۔
کیا AI کبھی انسان کی طرح سمجھ اور محسوس کر سکتی ہے؟
۲۰۲۳ء میں OpenAI کے GPT-4 نے بار کا امتحان پاس کیا — ایک ایسی کامیابی جو چند سال پہلے ناممکن لگتی تھی۔ لیکن اسی سال ایک مشہور واقعہ پیش آیا: ایک امریکی وکیل نے ChatGPT سے عدالتی حوالہ جات مانگے — اور AI نے ایسے مقدمات کے حوالے دیے جو کبھی موجود ہی نہ تھے۔
یہ "ہیلوسینیشن" (Hallucination) — یعنی پراعتماد غلط بیانی — AI کی سب سے خطرناک خامی ہے۔ AI کو یہ نہیں معلوم کہ وہ کیا نہیں جانتی۔ یہ وہ سرحد ہے جسے موجودہ ماڈل عبور نہیں کر سکے۔
AI کی بنیادی حدود
موجودہ AI ماڈلوں کی کئی بنیادی حدود ہیں۔ پہلی: علّی سمجھ (Causal Reasoning) — AI رابطے سیکھتی ہے مگر "کیوں" نہیں سمجھتی۔ وہ بتا سکتی ہے کہ آگ اور دھواں اکثر ساتھ ہوتے ہیں، لیکن یہ نہیں کہ آگ دھوئیں کا سبب ہے۔
دوسری: مستقل یادداشت — ہر مکالمہ نئے سرے سے شروع ہوتا ہے (جب تک خاص انتظام نہ ہو)۔ تیسری: جسمانی سمجھ (Embodied Cognition) — AI نے کبھی گرم چائے نہیں پی، تھکاوٹ نہیں محسوس کی۔ یہ جسمانی تجربات کے بغیر بہت کچھ نہیں سمجھا جا سکتا۔
AI پراعتماد انداز میں غلط معلومات دے سکتی ہے۔ نہ صرف وکالت، بلکہ طب، تحقیق، اور صحافت میں یہ خطرناک ہے۔ ۲۰۲۳ء کا "Schwartz v. Mata" مقدمہ اس کی مشہور مثال ہے جہاں وکیل پر جرمانہ عائد ہوا۔
AGI کی طرف — ابھی کتنا فاصلہ؟
AGI (Artificial General Intelligence — عمومی مصنوعی ذہانت) وہ کاموی مرحلہ ہے جہاں AI انسان کی طرح کسی بھی نئے کام میں مہارت حاصل کر سکے۔ ماہرین میں اس کے وقت پر گہرا اختلاف ہے — کچھ کہتے ہیں ۱۰ سال، کچھ کہتے ہیں کبھی نہیں۔
فی الحال AI مخصوص کاموں میں انسانوں سے بہتر ہے (ANI — Artificial Narrow Intelligence)۔ لیکن نئے، غیر متوقع مسائل حل کرنا، سماجی سمجھ، اخلاقی فیصلے — یہ ابھی انسانی برتری کے شعبے ہیں۔
- ہیلوسینیشن: پراعتماد غلط بیانی
- علّی سمجھ کا فقدان: "کیوں" نہیں جانتی
- جسمانی تجربے کا فقدان: دنیا کو محسوس نہیں کیا
- مستقل یادداشت نہیں: ہر بار نیا
- اخلاقی حقیقی فہم: ہدایات پر انحصار، سمجھ نہیں
AI کی حدود — کوئز
موجودہ AI کی بنیادی خامیوں پر اپنی سمجھ جانچیں۔
۱۔ "ہیلوسینیشن" AI میں کیا ہے؟
۲۔ موجودہ AI کو "علّی سمجھ" میں کیا مشکل ہے؟
۳۔ AGI (عمومی مصنوعی ذہانت) ANI سے کیسے مختلف ہے؟
AI کی حدود — لیب
AI کی بنیادی خامیوں کو تنقیدی نگاہ سے سمجھیں۔
لیب ہدایات
AI ماہر سے موجودہ ماڈلوں کی حدود اور مستقبل کے خطرات پر گفتگو کریں۔
- AI کا پہلا سوال سنیں اور اپنی رائے دیں۔
- پوچھیں کہ ہیلوسینیشن کو کم کرنے کے کیا طریقے ہیں۔
- AGI کے بارے میں اپنا نقطہ نظر بیان کریں — کیا یہ ممکن ہے؟
AI کیسے سیکھتی ہے — حتمی ٹیسٹ
پندرہ سوالوں سے پورے ماڈیول کی سمجھ جانچیں۔
۱۔ نگران تعلم (Supervised Learning) کی تعریف کیا ہے؟
۲۔ AlexNet نے ۲۰۱۲ء میں ImageNet میں غلطی کی شرح کتنی کی؟
۳۔ AlphaGo نے Lee Sedol کو ۲۰۱۶ء میں کتنے گیمز میں شکست دی؟
۴۔ ماڈل کے پیرامیٹرز کیا ہوتے ہیں؟
۵۔ تقویتی تعلم کا بنیادی اصول کیا ہے؟
۶۔ Amazon کے AI بھرتی نظام کو کیوں بند کیا گیا؟
۷۔ پری ٹریننگ کے بعد فائن ٹیوننگ کا فائدہ کیا ہے؟
۸۔ "ڈیٹا کنٹامینیشن" بینچ مارک میں کیا مسئلہ پیدا کرتا ہے؟
۹۔ "گریڈیئنٹ ڈیسنٹ" کی بہترین تشبیہ کیا ہے؟
۱۰۔ DeepMind کی Atari AI نے ۴۹ گیمز میں سے کتنے میں انسانی ماہرین کو پیچھے چھوڑا؟
۱۱۔ BERT ماڈل کا بنیادی خیال کیا تھا؟
۱۲۔ اوور فٹنگ کو روکنے کا بہترین طریقہ کیا ہے؟
۱۳۔ Goodhart's Law کا AI جانچ پر اطلاق کیا ہے؟
۱۴۔ موجودہ AI ماڈلوں کی سب سے اہم خامی کون سی ہے؟
۱۵۔ نمائندگی کا فقدان (Representation Gap) AI میں کیا مسئلہ پیدا کرتا ہے؟