```html AI کیسے سیکھتی ہے — ایڈوانسڈ | AESOP AI Academy ماڈیول 6
🎯 ایڈوانسڈ · سبق ۱

مثالوں سے تدریس

مشین لرننگ کی بنیاد: لیبل شدہ ڈیٹا سے نمونے سیکھنا اور مستقبل کی پیشین گوئی کرنا۔

کیا صرف مثالیں دیکھ کر مشین سیکھ سکتی ہے؟

۲۰۱۲ء میں گوگل کے محققین نے ایک تجربہ کیا۔ انہوں نے ایک نیورل نیٹ ورک کو ایک کروڑ یو ٹیوب ویڈیوز کے فریم دکھائے — بغیر کسی لیبل کے — اور نیٹ ورک نے خود بخود بلیوں کا تصور تیار کر لیا۔ اسے "گوگل کیٹ" تجربہ کہا گیا۔ یہ نتیجہ سائنسی دنیا میں حیران کن تھا: مشین نے کسی نے یہ نہیں بتایا کہ "بلی کیا ہوتی ہے" — پھر بھی اس نے انسانوں کی طرح درجہ بندی سیکھ لی۔

لیکن اس سے بھی اہم واقعہ اسی سال آیا جب AlexNet نے ImageNet مقابلے میں تمام روایتی طریقوں کو شکست دی — غلطی کی شرح ۲۶٪ سے ۱۵٪ تک لا کر۔ اس کامیابی کا راز؟ لاکھوں لیبل شدہ تصاویر اور گہری نیورل تعلیم۔ یہی "نگران تعلم" (Supervised Learning) کی طاقت تھی۔

نگران تعلم کیا ہے؟

نگران تعلم (Supervised Learning) وہ طریقہ ہے جس میں مشین کو ان پٹ اور درست آؤٹ پٹ کے جوڑے دکھائے جاتے ہیں۔ مثلاً: ایک تصویر دکھاؤ اور بتاؤ "یہ کتا ہے"۔ مشین ہزاروں ایسی مثالوں سے وہ فرق سیکھتی ہے جو کتے کو بلی یا گھوڑے سے الگ کرتا ہے۔

اس عمل میں تین چیزیں لازمی ہیں: ڈیٹا (مثالیں)، لیبل (درست جواب)، اور الگورتھم (سیکھنے کا طریقہ)۔ ہر بار جب مشین غلطی کرتی ہے، الگورتھم اسے درست کرتا ہے — بالکل اس طرح جیسے استاد طالب علم کو غلطی پر ٹوکے۔

اہم اصطلاح

لیبل (Label): ڈیٹا کا وہ درست جواب جو مشین کو سکھانے کے لیے انسان لگاتا ہے۔ مثلاً تصویر پر "بلی" لکھنا۔ بغیر لیبل کے نگران تعلم ممکن نہیں۔

ٹریننگ، ویلیڈیشن، اور ٹیسٹ

ڈیٹا کو عموماً تین حصوں میں تقسیم کیا جاتا ہے۔ پہلا حصہ "ٹریننگ سیٹ" ہے جس پر مشین سیکھتی ہے۔ دوسرا "ویلیڈیشن سیٹ" ہے جس پر سیکھنے کے دوران کارکردگی جانچی جاتی ہے۔ تیسرا "ٹیسٹ سیٹ" ہے جسے آخر میں استعمال کیا جاتا ہے تاکہ حقیقی کارکردگی پتہ چلے۔

  • ٹریننگ سیٹ: عموماً ۷۰٪ ڈیٹا — یہاں مشین سیکھتی ہے
  • ویلیڈیشن سیٹ: ۱۵٪ ڈیٹا — سیکھنے کے دوران جانچ
  • ٹیسٹ سیٹ: ۱۵٪ ڈیٹا — آخری حقیقی جانچ

اوور فٹنگ کا خطرہ

اوور فٹنگ (Overfitting) وہ صورتحال ہے جب مشین ٹریننگ ڈیٹا کو اتنا اچھی طرح یاد کر لیتی ہے کہ نئے ڈیٹا پر ناکام ہو جاتی ہے۔ یہ ایسا ہے جیسے طالب علم امتحان کے سوالات رٹ لے لیکن اصل فہم نہ ہو۔ اچھا ماڈل وہ ہوتا ہے جو "عام کرے" — نئی صورتحال میں بھی کام کرے۔

📝 کوئز · سبق ۱

مثالوں سے تدریس — کوئز

تین سوالوں سے اپنی سمجھ جانچیں۔

۱۔ نگران تعلم (Supervised Learning) میں لازمی کیا ہوتا ہے؟

✓ بالکل درست! نگران تعلم میں ہر مثال کے ساتھ درست جواب (لیبل) ضروری ہے تاکہ مشین غلطیاں سدھار سکے۔
✗ نہیں۔ نگران تعلم میں لیبل شدہ ڈیٹا ناگزیر ہے — یعنی ہر مثال کے ساتھ درست جواب ہونا چاہیے۔

۲۔ اوور فٹنگ (Overfitting) کا کیا مطلب ہے؟

✓ شاباش! اوور فٹنگ میں ماڈل ٹریننگ ڈیٹا میں بہت اچھا لگتا ہے لیکن حقیقی دنیا میں کام نہیں کرتا۔
✗ غلط۔ اوور فٹنگ وہ مسئلہ ہے جب مشین ٹریننگ مثالیں "رٹ" لیتی ہے مگر نئی صورتحال میں ناکام ہو جاتی ہے۔

۳۔ ۲۰۱۲ء کے AlexNet تجربے میں ImageNet پر غلطی کی شرح کتنی رہ گئی؟

✓ بالکل! AlexNet نے غلطی کی شرح ۲۶٪ سے ۱۵٪ تک لائی — یہ AI تاریخ کا اہم موڑ تھا۔
✗ درست نہیں۔ AlexNet نے ImageNet میں غلطی کی شرح ۲۶٪ سے گھٹا کر تقریباً ۱۵٪ کی تھی۔
🧪 لیب · سبق ۱

مثالوں سے تدریس — لیب

AI استاد سے نگران تعلم کے بارے میں گفتگو کریں۔

لیب ہدایات

آپ ایک AI ماہر سے بات کریں گے جو نگران تعلم کے بنیادی تصورات پر آپ کی رہنمائی کرے گا۔

  1. AI کا سوال پڑھیں اور اپنا جواب اردو میں لکھیں۔
  2. مثالوں اور لیبل کے درمیان فرق پوچھیں۔
  3. اوور فٹنگ کی مثال دینے کی درخواست کریں۔
💡 مجوزہ سوال: "نگران تعلم اور غیر نگران تعلم میں کیا فرق ہے؟"
🤖 AI تعلم ماہر نگران تعلم
🎯 ایڈوانسڈ · سبق ۲

نمونے ہر جگہ

AI نمونے (پیٹرن) کیسے پہچانتی ہے — اور یہ نمونے کہاں سے آتے ہیں؟

کیا ہر قسم کے ڈیٹا میں کوئی نہ کوئی نمونہ چھپا ہوتا ہے؟

۲۰۱۶ء میں Google DeepMind کے AlphaGo نے گو (Go) کے عالمی چیمپئن Lee Sedol کو ۴-۱ سے شکست دی۔ گو ایک ایسا کھیل ہے جسے ماہرین "شطرنج سے زیادہ پیچیدہ" کہتے تھے۔ اس وقت تک کوئی نہیں سمجھتا تھا کہ مشین یہ کر سکے گی۔

AlphaGo کی کامیابی کا راز یہ تھا کہ اس نے انسانی کھلاڑیوں کی لاکھوں چالوں کے نمونے سیکھے، پھر خود سے کھیل کر اور بھی گہرے نمونے دریافت کیے۔ اس نے چال نمبر ۳۷ کھیلی جسے ماہرین نے "مافوق الفطرت" کہا — کیونکہ کوئی انسانی کتاب میں یہ چال نہ تھی۔ مشین نے نیا نمونہ خود تخلیق کیا تھا۔

نمونہ (پیٹرن) کیا ہے؟

نمونہ (Pattern) کوئی بھی باقاعدگی ہے جو ڈیٹا میں بار بار نظر آئے۔ ای میل میں "مفت" اور "فوری" الفاظ اسپام کی نشاندہی کرتے ہیں — یہ ایک نمونہ ہے۔ طبی تصویروں میں خاص قسم کی دھندلاہٹ کینسر کا اشارہ دے سکتی ہے — یہ بھی نمونہ ہے۔

AI کا کام یہ ہے کہ وہ ان نمونوں کو انسانوں سے زیادہ تیزی اور گہرائی سے پہچانے۔ نیورل نیٹ ورک کئی تہوں میں کام کرتا ہے: پہلی تہ سادہ خطوط پہچانتی ہے، دوسری شکلیں، تیسری اشیاء — اور یوں ایک پیچیدہ نمونہ ابھرتا ہے۔

حقیقی مثال

پاکستان کے زرعی شعبے میں ڈرون سے لی گئی فصل کی تصاویر میں AI بیماری کے نمونے پہچان لیتی ہے۔ ایک کسان جو ہفتوں میں دیکھتا ہے، AI چند سیکنڈ میں شناخت کر لیتی ہے۔

خصوصیات کا انتخاب (Feature Selection)

تمام ڈیٹا یکساں اہم نہیں ہوتا۔ "فیچر سلیکشن" یعنی خصوصیات کا انتخاب وہ عمل ہے جس میں طے کیا جاتا ہے کہ کون سا ڈیٹا نمونے سیکھنے کے لیے اہم ہے۔ مثلاً مکان کی قیمت جاننے کے لیے مقام، رقبہ، اور کمروں کی تعداد اہم ہیں — دروازے کا رنگ غیر اہم۔

جدید ڈیپ لرننگ بعض اوقات خود بخود بہترین خصوصیات دریافت کر لیتی ہے — یہ اس کی سب سے بڑی طاقت ہے۔

  • متعلقہ خصوصیات: نمونے کو مضبوط بناتی ہیں
  • غیر متعلقہ خصوصیات: شور (Noise) پیدا کرتی ہیں
  • ڈیپ لرننگ: خود بخود خصوصیات تلاش کرتی ہے
📝 کوئز · سبق ۲

نمونے ہر جگہ — کوئز

نمونوں اور خصوصیات کے بارے میں اپنی سمجھ جانچیں۔

۱۔ AlphaGo کی چال نمبر ۳۷ کیوں حیران کن تھی؟

✓ بالکل درست! AlphaGo نے وہ نمونہ دریافت کیا جو انسانی تجربے سے پرے تھا۔
✗ نہیں۔ چال نمبر ۳۷ اس لیے مشہور ہوئی کہ یہ کسی انسانی ماہر کی کتاب میں موجود نہ تھی — AI نے نیا نمونہ خود بنایا۔

۲۔ "فیچر سلیکشن" کا مقصد کیا ہے؟

✓ صحیح! فیچر سلیکشن سے ماڈل متعلقہ نمونوں پر توجہ دیتا ہے اور شور کم ہوتا ہے۔
✗ غلط۔ فیچر سلیکشن اہم خصوصیات چننے کا عمل ہے — یہ ماڈل کو بہتر بناتا ہے۔

۳۔ نیورل نیٹ ورک تصویر میں نمونے کیسے پہچانتا ہے؟

✓ بالکل! یہ تہہ در تہہ نمونہ پہچان ہی ڈیپ لرننگ کی طاقت ہے۔
✗ درست نہیں۔ نیورل نیٹ ورک کئی تہوں میں کام کرتا ہے: سادہ خطوط سے شکلوں تک، اور شکلوں سے اشیاء تک۔
🧪 لیب · سبق ۲

نمونے ہر جگہ — لیب

روزمرہ زندگی میں AI کے نمونے دریافت کریں۔

لیب ہدایات

AI ماہر آپ کو روزمرہ ڈیٹا میں چھپے نمونوں کو دریافت کرنے میں مدد دے گا۔

  1. AI کا سوال سنیں اور کوئی حقیقی مثال دیں۔
  2. پوچھیں کہ اسپام ای میل میں کون سے نمونے ہوتے ہیں۔
  3. فیچر سلیکشن کی ایک مثال اپنے الفاظ میں بیان کریں۔
💡 مجوزہ سوال: "پاکستان کی سڑکوں پر ٹریفک AI کون سے نمونے استعمال کرتی ہے؟"
🤖 AI نمونہ ماہر پیٹرن ریکوگنیشن
🎯 ایڈوانسڈ · سبق ۳

ماڈل کیا ہے؟

مشین لرننگ ماڈل: ریاضیاتی ڈھانچہ جو سیکھا ہوا علم محفوظ رکھتا ہے۔

ماڈل میں اصل میں کیا محفوظ ہوتا ہے؟

۲۰۲۳ء میں Meta نے LLaMA ماڈل جاری کیا — لیکن اس کے پیرامیٹرز (ماڈل کے اندر کی قدریں) لیک ہو گئے اور آن لائن پھیل گئے۔ یہ واقعہ اس لیے اہم ہے کیونکہ اس سے ظاہر ہوا کہ ایک ماڈل دراصل ارب ہا پیرامیٹرز کا مجموعہ ہے — اور یہی پیرامیٹرز "علم" ہیں۔ جس نے ماڈل کی فائل ڈاؤن لوڈ کی، اس نے وہ سارا سیکھا ہوا علم حاصل کر لیا۔

GPT-4 میں تخمیناً ایک ٹریلین سے زیادہ پیرامیٹرز ہیں۔ ہر پیرامیٹر ایک عدد ہے جو ٹریننگ کے دوران ایڈجسٹ ہوتا رہا۔ یہ اعداد مل کر زبان، منطق، اور علم کی نمائندگی کرتے ہیں۔

ماڈل کی ساخت

ماڈل (Model) ایک ریاضیاتی ڈھانچہ ہے جو ان پٹ کو آؤٹ پٹ میں تبدیل کرتا ہے۔ اس کے اندر "پیرامیٹرز" (Parameters) ہوتے ہیں — وہ اعداد جو ٹریننگ کے دوران بدلتے ہیں اور آخر میں "سیکھا ہوا علم" بن جاتے ہیں۔

نیورل نیٹ ورک میں نیورونز (Neurons) اور تہیں (Layers) ہوتی ہیں۔ ہر نیورون دوسرے سے "وزن" (Weight) کے ذریعے جڑا ہوتا ہے — اور یہ وزن ہی پیرامیٹرز ہیں۔ جتنے زیادہ پیرامیٹرز، اتنا پیچیدہ علم سیکھنے کی صلاحیت۔

عددی تناظر

GPT-2: ۱۵ کروڑ پیرامیٹرز (۲۰۱۹) · GPT-3: ۱۷۵ ارب (۲۰۲۰) · GPT-4: اندازاً ۱ ٹریلین سے زیادہ (۲۰۲۳)۔ ہر نسل میں پیرامیٹرز کئی گنا بڑھے۔

ٹریننگ کا عمل: نقصان اور اصلاح

ماڈل ٹریننگ کے دوران ایک چکر چلتا ہے: پہلے پیشین گوئی کریں، پھر غلطی ناپیں (Loss Function کے ذریعے)، پھر وزن ایڈجسٹ کریں (Back-propagation سے)۔ یہ چکر لاکھوں بار دہرایا جاتا ہے جب تک غلطی کم سے کم نہ ہو۔

گریڈیئنٹ ڈیسنٹ (Gradient Descent) وہ الگورتھم ہے جو یہ ایڈجسٹمنٹ کرتا ہے — یہ "پہاڑ سے نیچے اترنے" کی طرح ہے: ہر قدم غلطی کو تھوڑا کم کرتا ہے۔

  • Loss Function: غلطی ناپنے کا پیمانہ
  • Back-propagation: غلطی کو پیچھے پھیلانا
  • Gradient Descent: وزن کو بہترین قدر کی طرف لے جانا
  • Epoch: پورے ٹریننگ ڈیٹا کا ایک چکر
📝 کوئز · سبق ۳

ماڈل کیا ہے؟ — کوئز

پیرامیٹرز اور ٹریننگ کے عمل پر اپنی سمجھ جانچیں۔

۱۔ ماڈل کے "پیرامیٹرز" کیا ہوتے ہیں؟

✓ بالکل درست! پیرامیٹرز وہ ریاضیاتی اعداد ہیں جن میں ماڈل کا سارا سیکھا ہوا علم محفوظ ہے۔
✗ نہیں۔ پیرامیٹرز وہ اعداد ہیں جو ٹریننگ کے دوران ایڈجسٹ ہوتے ہیں اور ماڈل کا "علم" بنتے ہیں۔

۲۔ "گریڈیئنٹ ڈیسنٹ" کیا کرتا ہے؟

✓ شاباش! گریڈیئنٹ ڈیسنٹ پہاڑ سے نیچے اترنے کی طرح کام کرتا ہے — غلطی کو آہستہ آہستہ کم کرتا ہے۔
✗ غلط۔ گریڈیئنٹ ڈیسنٹ وہ الگورتھم ہے جو ماڈل کے وزن کو بہترین قدر کی طرف لے جاتا ہے۔

۳۔ Meta کے LLaMA ماڈل کے لیک ہونے کا اہم سبق کیا تھا؟

✓ بالکل! LLaMA کیس نے ثابت کیا کہ ماڈل کے پیرامیٹرز اصل "فکری ملکیت" ہیں۔
✗ درست نہیں۔ LLaMA لیک کا سبق یہ تھا کہ ماڈل فائل میں سارا سیکھا ہوا علم موجود ہوتا ہے۔
🧪 لیب · سبق ۳

ماڈل کیا ہے؟ — لیب

پیرامیٹرز، وزن، اور ٹریننگ کے عمل کو گہرائی سے سمجھیں۔

لیب ہدایات

AI ماہر سے ماڈل کی ریاضیاتی ساخت کے بارے میں سوال جواب کریں۔

  1. AI کا پہلا سوال سنیں اور اپنی سمجھ بتائیں۔
  2. پوچھیں کہ "ایپوک" (Epoch) کتنے ہونے چاہئیں۔
  3. بتائیں کہ آپ GPT ماڈل کے پیرامیٹرز کے بارے میں کیا جانتے ہیں۔
💡 مجوزہ سوال: "کیا زیادہ پیرامیٹرز ہمیشہ بہتر ماڈل بناتے ہیں؟"
🤖 AI ماڈل ماہر پیرامیٹرز و ٹریننگ
🎯 ایڈوانسڈ · سبق ۴

غیر نگران اور تقویتی تعلم

لیبل کے بغیر سیکھنا اور انعام کے ذریعے بہتر ہوتے رہنا۔

کیا مشین بغیر استاد کے خود سیکھ سکتی ہے؟

۲۰۱۳ء میں DeepMind نے ایک AI بنائی جس نے Atari ویڈیو گیمز سیکھے — صرف اسکرین کی تصاویر اور اسکور دیکھ کر۔ کسی نے اسے کھیلنا نہیں سکھایا۔ مشین نے خود اپنے تجربات سے سمجھا کہ کون سی حرکت اسکور بڑھاتی ہے۔

یہ "تقویتی تعلم" (Reinforcement Learning) کی کلاسیک مثال ہے۔ AI کو صرف "انعام" (Reward) ملتا تھا — اسکور بڑھے تو مثبت، کم ہو تو منفی۔ ۴۹ مختلف گیمز میں سے ۲۹ میں اس AI نے انسانی ماہرین کو پیچھے چھوڑ دیا۔ یہ بغیر کسی استاد کے، صرف آزمائش اور غلطی سے سیکھنا تھا۔

غیر نگران تعلم (Unsupervised Learning)

غیر نگران تعلم میں کوئی لیبل نہیں ہوتا۔ مشین خود ڈیٹا میں چھپے گروہ (Clusters) اور ڈھانچے دریافت کرتی ہے۔ مثلاً ایک بینک کروڑوں لین دین دیکھتا ہے — AI بغیر بتائے پہچان لیتی ہے کہ کون سے لین دین "غیر معمولی" ہیں۔

K-Means Clustering اور Autoencoders اس کی عام تکنیکیں ہیں۔ Netflix کا "آپ کو یہ پسند آئے گا" نظام بھی اسی پر کام کرتا ہے — وہ صارفین کو ان کی پسند کی بنیاد پر گروہوں میں تقسیم کرتا ہے۔

تقویتی تعلم (Reinforcement Learning)

تقویتی تعلم میں ایک "ایجنٹ" (Agent) ماحول میں قدم اٹھاتا ہے اور ہر قدم پر انعام یا سزا ملتی ہے۔ وقت کے ساتھ ایجنٹ سیکھتا ہے کہ کون سی "پالیسی" (Policy) زیادہ کل انعام دیتی ہے۔

ChatGPT اور GPT-4 کو بھی "RLHF" (Reinforcement Learning from Human Feedback) سے بہتر بنایا گیا — انسانی رائے کو انعام کے طور پر استعمال کیا گیا۔ یہی وجہ ہے کہ یہ ماڈل زیادہ مددگار اور محفوظ جوابات دیتے ہیں۔

  • ایجنٹ: سیکھنے والی مشین
  • ماحول: وہ دنیا جس میں ایجنٹ کام کرتا ہے
  • انعام: مثبت یا منفی اشارہ
  • پالیسی: بہترین اقدام کا منصوبہ
📝 کوئز · سبق ۴

غیر نگران اور تقویتی تعلم — کوئز

تعلم کی اقسام پر اپنی سمجھ جانچیں۔

۱۔ تقویتی تعلم میں AI کیسے سیکھتی ہے؟

✓ بالکل! تقویتی تعلم میں AI خود تجربہ کرتی ہے اور انعام کے ذریعے سیکھتی ہے۔
✗ نہیں۔ تقویتی تعلم میں AI انعام اور سزا کے نظام سے، آزمائش اور غلطی کے ذریعے سیکھتی ہے۔

۲۔ RLHF کا مطلب کیا ہے؟

✓ شاباش! RLHF وہ طریقہ ہے جس سے ChatGPT جیسے ماڈل انسانی پسند کے مطابق بہتر ہوئے۔
✗ غلط۔ RLHF یعنی Reinforcement Learning from Human Feedback — انسانی رائے کو انعام بنا کر ماڈل بہتر کیا جاتا ہے۔

۳۔ DeepMind کے Atari تجربے میں AI کو کیا "انعام" ملتا تھا؟

✓ بالکل درست! Atari AI کا واحد اشارہ گیم اسکور تھا — یہی اس کا انعام یا سزا تھی۔
✗ درست نہیں۔ DeepMind کی Atari AI صرف گیم اسکور دیکھتی تھی — یہی اس کا انعام یا سزا تھا۔
🧪 لیب · سبق ۴

غیر نگران اور تقویتی تعلم — لیب

تعلم کی مختلف اقسام اور ان کے فرق کو گہرائی سے سمجھیں۔

لیب ہدایات

AI ماہر سے تعلم کی اقسام کے درمیان فرق سمجھیں۔

  1. AI کا پہلا سوال سنیں اور فرق بیان کریں۔
  2. پوچھیں کہ روبوٹکس میں تقویتی تعلم کیسے کام کرتا ہے۔
  3. کوئی ایسا مسئلہ بتائیں جہاں غیر نگران تعلم بہتر ہو۔
💡 مجوزہ سوال: "نگران، غیر نگران، اور تقویتی تعلم میں سے کون سا پاکستانی تعلیمی نظام کو بہتر کر سکتا ہے؟"
🤖 AI تعلم ماہر تعلم کی اقسام
🎯 ایڈوانسڈ · سبق ۵

ڈیٹا کا مسئلہ

غلط، ناکافی، یا متعصب ڈیٹا AI کو کیسے تباہ کر سکتا ہے؟

اگر ڈیٹا غلط ہو تو AI کیا سیکھے گی؟

۲۰۱۵ء میں Amazon نے ایک AI بھرتی نظام تیار کیا جو CVs کو خود بخود جانچے۔ لیکن ۲۰۱۸ء میں یہ انکشاف ہوا کہ یہ نظام خواتین کے درخواستیں مسترد کر رہا تھا — کیونکہ اسے جس ٹریننگ ڈیٹا سے سکھایا گیا تھا وہ پچھلے دس سال کی بھرتیوں پر مبنی تھا جس میں مرد اکثریت میں تھے۔

AI نے انسانی تعصب سیکھ لیا اور اسے "قانون" سمجھ لیا۔ Amazon نے یہ پروگرام بند کر دیا۔ یہ واقعہ ثابت کرتا ہے کہ ڈیٹا اگر متعصب ہو تو AI بھی متعصب ہو جاتی ہے — چاہے الگورتھم کتنا بھی اچھا ہو۔

تعصب (Bias) کہاں سے آتا ہے؟

ڈیٹا میں تعصب کئی طریقوں سے داخل ہوتا ہے۔ پہلا: تاریخی تعصب — اگر ماضی کے فیصلے غیر منصفانہ تھے تو AI وہی سیکھے گی۔ دوسرا: نمائندگی کا فقدان — اگر کچھ گروہ ڈیٹا میں کم ہیں تو AI ان پر ناقص کام کرے گی۔ تیسرا: پیمائش کا تعصب — اگر غلط چیز ناپی جا رہی ہو۔

حقیقی نتیجہ

۲۰۱۹ء میں امریکہ میں ایک طبی الگورتھم نے سیاہ فام مریضوں کو کم ترجیح دی۔ وجہ: یہ خرچ کو "ضرورت" کا اشارہ سمجھتا تھا — اور تاریخی طور پر سیاہ فام مریضوں پر کم خرچ ہوا تھا۔ (ماخذ: Science جریدہ، ۲۰۱۹)

ڈیٹا کے دیگر مسائل

ڈیٹا کا حجم بھی اہم ہے۔ کم ڈیٹا پر سیکھا ماڈل اعتماد کے ساتھ غلط نتائج دے سکتا ہے۔ ڈیٹا کا معیار بھی ضروری ہے — غلط لیبل، ڈپلیکیٹ مثالیں، یا گمشدہ قدریں ماڈل کو نقصان پہنچاتی ہیں۔

اردو، پشتو، اور سندھی جیسی زبانوں کے لیے AI کم کارآمد ہے کیونکہ انٹرنیٹ پر ان زبانوں کا ڈیٹا کم ہے — یہ بھی نمائندگی کا بحران ہے۔

  • کم ڈیٹا: ماڈل کم قابل اعتماد
  • غلط لیبل: ماڈل غلط چیز سیکھتا ہے
  • متعصب ڈیٹا: AI انصاف سے کام نہیں کرتی
  • نمائندگی کا فقدان: اقلیتی گروہوں پر خراب کارکردگی
📝 کوئز · سبق ۵

ڈیٹا کا مسئلہ — کوئز

ڈیٹا کے تعصب اور مسائل پر اپنی سمجھ جانچیں۔

۱۔ Amazon کے AI بھرتی نظام نے خواتین کو مسترد کیوں کیا؟

✓ بالکل درست! ماضی کا ڈیٹا متعصب تھا تو AI نے وہی تعصب سیکھ لیا۔
✗ نہیں۔ مسئلہ ٹریننگ ڈیٹا کا تھا جس میں دس سال کی مرد اکثریتی بھرتیاں تھیں — AI نے وہی تعصب سیکھا۔

۲۔ اردو کے لیے AI ماڈل کیوں کم کارآمد ہیں؟

✓ درست! جب ڈیٹا کم ہو تو ماڈل اس زبان میں ناقص کام کرتا ہے — یہ نمائندگی کا مسئلہ ہے۔
✗ غلط۔ اردو، پشتو جیسی زبانوں میں AI کم اچھی ہے کیونکہ انٹرنیٹ پر ان کا ڈیٹا انگریزی سے کہیں کم ہے۔

۳۔ ڈیٹا کے معیار کا سب سے بڑا خطرہ کیا ہے؟

✓ بالکل! خراب ڈیٹا سے بنا ماڈل اعتماد کے ساتھ غلط فیصلے کرتا ہے۔
✗ درست نہیں۔ سب سے بڑا خطرہ یہ ہے کہ غلط یا متعصب ڈیٹا سے ماڈل غلط چیز "سیکھ" لیتا ہے۔
🧪 لیب · سبق ۵

ڈیٹا کا مسئلہ — لیب

ڈیٹا کے تعصب اور اس کے نتائج کو سمجھیں۔

لیب ہدایات

AI ماہر سے ڈیٹا کے تعصب، معیار، اور منصفانہ AI کے بارے میں بات کریں۔

  1. AI کا پہلا سوال سنیں اور جواب دیں۔
  2. پوچھیں کہ ڈیٹا کا تعصب کیسے دریافت کیا جا سکتا ہے۔
  3. پاکستانی سیاق میں ایک مثال دیں جہاں متعصب AI نقصاندہ ہو سکتی ہے۔
💡 مجوزہ سوال: "پاکستانی زبانوں کے لیے AI کو بہتر بنانے کے لیے ڈیٹا کیسے اکٹھا کیا جا سکتا ہے؟"
🤖 AI ڈیٹا ماہر ڈیٹا کا معیار
🎯 ایڈوانسڈ · سبق ۶

پری ٹریننگ اور فائن ٹیوننگ

عام بڑے ماڈل کو مخصوص کام کے لیے تیار کرنے کا فن۔

کیا ایک ماڈل ہر کام کے لیے الگ سکھانا ضروری ہے؟

۲۰۱۸ء میں Google نے BERT (Bidirectional Encoder Representations from Transformers) جاری کیا۔ BERT کو پہلے انٹرنیٹ کے ارب ہا الفاظ پر "پری ٹرین" کیا گیا — یہ سیکھا کہ زبان کیسے کام کرتی ہے، الفاظ کے درمیان تعلق کیا ہے۔

پھر اسی ماڈل کو چھوٹے مخصوص ڈیٹا سیٹس پر "فائن ٹیون" کیا گیا — طبی تشخیص، قانونی دستاویزات، جذباتی تجزیہ۔ ہر بار پری ٹرینڈ علم محفوظ رہا اور صرف نئی مہارت شامل کی گئی۔ BERT نے ۱۱ مختلف NLP کاموں میں نئے ریکارڈ قائم کیے — یہ "ٹرانسفر لرننگ" کا انقلاب تھا۔

پری ٹریننگ: بنیاد بنانا

پری ٹریننگ (Pre-training) وہ مرحلہ ہے جس میں ایک بہت بڑا ماڈل بہت زیادہ عام ڈیٹا پر سیکھتا ہے۔ GPT-4 کو انٹرنیٹ کے کھربوں الفاظ پر پری ٹرین کیا گیا — کتابیں، مضامین، ویب صفحات، کوڈ۔ اس مرحلے میں ماڈل زبان کی عمومی سمجھ حاصل کرتا ہے۔

یہ عمل بہت مہنگا اور وقت طلب ہے۔ GPT-4 کی ٹریننگ میں تخمیناً ۱۰۰ ملین ڈالر خرچ ہوئے اور ہزاروں GPU کئی ماہ چلے۔ اسی لیے صرف بڑی کمپنیاں یہ کر سکتی ہیں۔

فائن ٹیوننگ: مہارت شامل کرنا

فائن ٹیوننگ (Fine-tuning) میں ایک پری ٹرینڈ ماڈل کو کسی مخصوص کام کے لیے کم ڈیٹا پر مزید سکھایا جاتا ہے۔ مثلاً: ایک ہسپتال GPT بیس ماڈل کو اپنے طبی ریکارڈ پر فائن ٹیون کر کے مریض کی تشخیص میں مدد لے سکتا ہے۔

ٹرانسفر لرننگ (Transfer Learning) اس پورے خیال کا نام ہے: ایک کام میں سیکھا علم دوسرے کام میں منتقل کرنا۔ یہ وقت اور پیسے دونوں بچاتا ہے۔

  • پری ٹریننگ: عام، بڑا، مہنگا — صرف ایک بار
  • فائن ٹیوننگ: مخصوص، چھوٹا، سستا — بار بار ممکن
  • ٹرانسفر لرننگ: علم کی منتقلی — AI کا اہم ہتھیار
  • PEFT: بہت کم پیرامیٹرز فائن ٹیون کر کے کام نکالنا
📝 کوئز · سبق ۶

پری ٹریننگ اور فائن ٹیوننگ — کوئز

ٹرانسفر لرننگ اور ماڈل تیاری پر اپنی سمجھ جانچیں۔

۱۔ BERT ماڈل نے ۲۰۱۸ء میں کیا کامیابی حاصل کی؟

✓ بالکل! BERT نے پری ٹریننگ اور فائن ٹیوننگ کو یکجا کر کے NLP میں انقلاب برپا کیا۔
✗ غلط۔ BERT نے ۱۱ قدرتی زبان کے کاموں (NLP tasks) میں نئے ریکارڈ قائم کیے تھے۔

۲۔ فائن ٹیوننگ، پری ٹریننگ سے کیسے مختلف ہے؟

✓ شاباش! فائن ٹیوننگ کم ڈیٹا، کم وقت، اور کم پیسے میں مخصوص مہارت شامل کرتی ہے۔
✗ درست نہیں۔ فائن ٹیوننگ پہلے سے سیکھے ماڈل کو کم ڈیٹا پر مخصوص کام کے لیے تیار کرتی ہے۔

۳۔ GPT-4 کی پری ٹریننگ کا اندازاً خرچ کتنا تھا؟

✓ بالکل درست! اسی لیے پری ٹریننگ صرف بڑی تکنیکی کمپنیوں کی پہنچ میں ہے۔
✗ نہیں۔ GPT-4 جیسے ماڈل کی پری ٹریننگ میں تخمیناً ۱۰ کروڑ (۱۰۰ ملین) ڈالر خرچ ہوئے۔
🧪 لیب · سبق ۶

پری ٹریننگ اور فائن ٹیوننگ — لیب

ٹرانسفر لرننگ کو عملی سیاق میں سمجھیں۔

لیب ہدایات

AI ماہر سے پری ٹریننگ اور فائن ٹیوننگ کے عملی پہلوؤں پر گفتگو کریں۔

  1. AI کا پہلا سوال سنیں اور جواب دیں۔
  2. پوچھیں کہ پاکستانی یونیورسٹیاں GPT ماڈل فائن ٹیون کر سکتی ہیں؟
  3. ایک ایسا شعبہ بتائیں جہاں فائن ٹیوننگ پاکستان میں مفید ہو۔
💡 مجوزہ سوال: "کیا LoRA یا PEFT سے فائن ٹیوننگ سستی ہو سکتی ہے؟"
🤖 AI ٹرانسفر لرننگ ماہر پری ٹریننگ · فائن ٹیوننگ
🎯 ایڈوانسڈ · سبق ۷

جانچ اور بینچ مارکس

AI کی کارکردگی کیسے ناپی جاتی ہے — اور اس پیمائش کی حدود کیا ہیں؟

کیا بینچ مارک اسکور ہمیشہ حقیقی صلاحیت ظاہر کرتا ہے؟

۲۰۲۳ء میں متعدد AI کمپنیوں نے دعویٰ کیا کہ ان کے ماڈل MMLU (Massive Multitask Language Understanding) بینچ مارک پر انسانی سطح سے بہتر ہیں۔ لیکن جب محققین نے انہی ماڈلوں کو MMLU کے سوالات کی معمولی تبدیلیوں کے ساتھ آزمایا تو کارکردگی ڈرامائی انداز میں گر گئی۔

اس مسئلے کو "بینچ مارک سیچوریشن" (Benchmark Saturation) کہا جاتا ہے — جب ماڈل بینچ مارک کے سوالات "رٹ" لیتے ہیں کیونکہ وہ ٹریننگ ڈیٹا میں موجود تھے۔ ۲۰۲۴ء میں ARC-AGI بینچ مارک متعارف کرایا گیا جسے نئی قسم کے مسائل سے بنایا گیا تاکہ اسے رٹا نہ جا سکے۔

بینچ مارک کیا ہے؟

بینچ مارک (Benchmark) وہ معیاری امتحان ہے جس سے AI ماڈلوں کی کارکردگی ناپی اور موازنہ کی جاتی ہے۔ مشہور بینچ مارکس میں MMLU (کثیر مضامین)، HumanEval (کوڈنگ)، HellaSwag (عام فہم)، اور GSM8K (ریاضی) شامل ہیں۔

اہم اصطلاحات

Accuracy: کتنے فیصد جوابات درست۔ Precision: مثبت جوابات میں سے کتنے واقعی مثبت۔ Recall: تمام مثبت صورتحالوں میں سے کتنی پکڑی گئیں۔ F1 Score: Precision اور Recall کا توازن۔

بینچ مارک کی حدود

بینچ مارک ہمیشہ حقیقی دنیا کی کارکردگی نہیں ظاہر کرتا۔ "ڈیٹا کنٹامینیشن" ایک بڑا مسئلہ ہے — اگر بینچ مارک کے سوالات ٹریننگ ڈیٹا میں تھے تو اسکور مصنوعی طور پر اونچا ہو گا۔ اسے "Goodhart's Law" بھی کہتے ہیں: جب پیمانہ ہدف بن جائے تو پیمانہ ناکارہ ہو جاتا ہے۔

اسی لیے انسانی جانچ (Human Evaluation) بھی ضروری ہے — خاص طور پر تخلیقی کاموں، ہمدردی، اور سماجی سمجھ بوجھ کے لیے جہاں اعداد ناکافی ہیں۔

  • بینچ مارک سیچوریشن: ماڈل سوالات رٹ لیتے ہیں
  • ڈیٹا کنٹامینیشن: بینچ مارک ٹریننگ ڈیٹا میں آ جاتا ہے
  • Goodhart's Law: پیمانہ ہدف بنا تو بے کار ہو گیا
  • انسانی جانچ: سماجی اور تخلیقی کاموں کے لیے لازم
📝 کوئز · سبق ۷

جانچ اور بینچ مارکس — کوئز

AI کی جانچ اور پیمائش پر اپنی سمجھ جانچیں۔

۱۔ "بینچ مارک سیچوریشن" کا کیا مطلب ہے؟

✓ درست! جب ماڈل بینچ مارک کے سوالات ٹریننگ میں دیکھ چکا ہو تو اسکور گمراہ کن ہوتا ہے۔
✗ نہیں۔ بینچ مارک سیچوریشن وہ ہے جب ماڈل سوالات رٹ لیتے ہیں اور اسکور حقیقی صلاحیت نہیں ظاہر کرتا۔

۲۔ F1 Score کیا ناپتا ہے؟

✓ شاباش! F1 Score Precision اور Recall دونوں کو یکجا کرتا ہے — جب دونوں اہم ہوں تو یہ پیمانہ استعمال ہوتا ہے۔
✗ غلط۔ F1 Score Precision (صحت) اور Recall (احاطہ) کا توازن ظاہر کرتا ہے۔

۳۔ Goodhart's Law کا AI پر کیا اطلاق ہوتا ہے؟

✓ بالکل! Goodhart's Law: جب پیمانہ ہدف بنے تو پیمانہ معنی کھو دیتا ہے۔
✗ درست نہیں۔ Goodhart's Law کہتا ہے: جب بینچ مارک خود ہدف بن جائے تو وہ حقیقی کارکردگی ناپنا بند کر دیتا ہے۔
🧪 لیب · سبق ۷

جانچ اور بینچ مارکس — لیب

AI جانچ کے طریقوں اور ان کی حدود کو تنقیدی نگاہ سے دیکھیں۔

لیب ہدایات

AI ماہر سے بینچ مارکس اور جانچ کے طریقوں پر تنقیدی گفتگو کریں۔

  1. AI کا پہلا سوال سنیں اور اپنی رائے دیں۔
  2. پوچھیں کہ کون سا بینچ مارک سب سے قابل اعتماد ہے۔
  3. انسانی جانچ اور خودکار جانچ کے فرق پر بحث کریں۔
💡 مجوزہ سوال: "اگر ایک AI نے اردو بینچ مارک میں ۹۰٪ اسکور کیا تو کیا وہ واقعی اردو سمجھتی ہے؟"
🤖 AI جانچ ماہر بینچ مارک · جانچ
🎯 ایڈوانسڈ · سبق ۸

سرحد: AI ابھی کیا نہیں سیکھ سکتی

موجودہ AI کی بنیادی حدود — وہ مسائل جو ابھی حل نہیں ہوئے۔

کیا AI کبھی انسان کی طرح سمجھ اور محسوس کر سکتی ہے؟

۲۰۲۳ء میں OpenAI کے GPT-4 نے بار کا امتحان پاس کیا — ایک ایسی کامیابی جو چند سال پہلے ناممکن لگتی تھی۔ لیکن اسی سال ایک مشہور واقعہ پیش آیا: ایک امریکی وکیل نے ChatGPT سے عدالتی حوالہ جات مانگے — اور AI نے ایسے مقدمات کے حوالے دیے جو کبھی موجود ہی نہ تھے۔

یہ "ہیلوسینیشن" (Hallucination) — یعنی پراعتماد غلط بیانی — AI کی سب سے خطرناک خامی ہے۔ AI کو یہ نہیں معلوم کہ وہ کیا نہیں جانتی۔ یہ وہ سرحد ہے جسے موجودہ ماڈل عبور نہیں کر سکے۔

AI کی بنیادی حدود

موجودہ AI ماڈلوں کی کئی بنیادی حدود ہیں۔ پہلی: علّی سمجھ (Causal Reasoning) — AI رابطے سیکھتی ہے مگر "کیوں" نہیں سمجھتی۔ وہ بتا سکتی ہے کہ آگ اور دھواں اکثر ساتھ ہوتے ہیں، لیکن یہ نہیں کہ آگ دھوئیں کا سبب ہے۔

دوسری: مستقل یادداشت — ہر مکالمہ نئے سرے سے شروع ہوتا ہے (جب تک خاص انتظام نہ ہو)۔ تیسری: جسمانی سمجھ (Embodied Cognition) — AI نے کبھی گرم چائے نہیں پی، تھکاوٹ نہیں محسوس کی۔ یہ جسمانی تجربات کے بغیر بہت کچھ نہیں سمجھا جا سکتا۔

ہیلوسینیشن کا خطرہ

AI پراعتماد انداز میں غلط معلومات دے سکتی ہے۔ نہ صرف وکالت، بلکہ طب، تحقیق، اور صحافت میں یہ خطرناک ہے۔ ۲۰۲۳ء کا "Schwartz v. Mata" مقدمہ اس کی مشہور مثال ہے جہاں وکیل پر جرمانہ عائد ہوا۔

AGI کی طرف — ابھی کتنا فاصلہ؟

AGI (Artificial General Intelligence — عمومی مصنوعی ذہانت) وہ کاموی مرحلہ ہے جہاں AI انسان کی طرح کسی بھی نئے کام میں مہارت حاصل کر سکے۔ ماہرین میں اس کے وقت پر گہرا اختلاف ہے — کچھ کہتے ہیں ۱۰ سال، کچھ کہتے ہیں کبھی نہیں۔

فی الحال AI مخصوص کاموں میں انسانوں سے بہتر ہے (ANI — Artificial Narrow Intelligence)۔ لیکن نئے، غیر متوقع مسائل حل کرنا، سماجی سمجھ، اخلاقی فیصلے — یہ ابھی انسانی برتری کے شعبے ہیں۔

  • ہیلوسینیشن: پراعتماد غلط بیانی
  • علّی سمجھ کا فقدان: "کیوں" نہیں جانتی
  • جسمانی تجربے کا فقدان: دنیا کو محسوس نہیں کیا
  • مستقل یادداشت نہیں: ہر بار نیا
  • اخلاقی حقیقی فہم: ہدایات پر انحصار، سمجھ نہیں
📝 کوئز · سبق ۸

AI کی حدود — کوئز

موجودہ AI کی بنیادی خامیوں پر اپنی سمجھ جانچیں۔

۱۔ "ہیلوسینیشن" AI میں کیا ہے؟

✓ بالکل! ہیلوسینیشن AI کی خطرناک خامی ہے — وہ جھوٹ کو اعتماد سے پیش کرتی ہے۔
✗ نہیں۔ ہیلوسینیشن یہ ہے کہ AI پراعتماد انداز میں غلط یا من گھڑت معلومات دیتی ہے۔

۲۔ موجودہ AI کو "علّی سمجھ" میں کیا مشکل ہے؟

✓ شاباش! AI رابطے (Correlations) سیکھتی ہے مگر سبب و نتیجہ (Causality) کو حقیقی معنوں میں نہیں سمجھتی۔
✗ غلط۔ AI کا بڑا مسئلہ یہ ہے کہ وہ رابطے دیکھتی ہے لیکن "کیوں" — یعنی سبب و نتیجہ — نہیں سمجھتی۔

۳۔ AGI (عمومی مصنوعی ذہانت) ANI سے کیسے مختلف ہے؟

✓ بالکل درست! فی الحال ہمارے پاس ANI ہے — AGI ابھی مستقبل کا خواب ہے۔
✗ نہیں۔ AGI کسی بھی نئے کام میں انسان کی طرح سیکھ سکتی ہے — ANI صرف مخصوص کاموں میں اچھی ہے۔
🧪 لیب · سبق ۸

AI کی حدود — لیب

AI کی بنیادی خامیوں کو تنقیدی نگاہ سے سمجھیں۔

لیب ہدایات

AI ماہر سے موجودہ ماڈلوں کی حدود اور مستقبل کے خطرات پر گفتگو کریں۔

  1. AI کا پہلا سوال سنیں اور اپنی رائے دیں۔
  2. پوچھیں کہ ہیلوسینیشن کو کم کرنے کے کیا طریقے ہیں۔
  3. AGI کے بارے میں اپنا نقطہ نظر بیان کریں — کیا یہ ممکن ہے؟
💡 مجوزہ سوال: "کیا AI کبھی واقعی محسوس کر سکے گی — یا صرف محسوس کرنے کی نقل؟"
🤖 AI حدود ماہر AI کی حدود · AGI
📋 ماڈیول ٹیسٹ

AI کیسے سیکھتی ہے — حتمی ٹیسٹ

پندرہ سوالوں سے پورے ماڈیول کی سمجھ جانچیں۔

۱۔ نگران تعلم (Supervised Learning) کی تعریف کیا ہے؟

✓ درست! نگران تعلم میں ہر مثال کے ساتھ درست جواب ہوتا ہے۔
✗ نہیں۔ نگران تعلم لیبل شدہ مثالوں پر کام کرتا ہے جہاں ان پٹ اور درست آؤٹ پٹ دونوں ہوتے ہیں۔

۲۔ AlexNet نے ۲۰۱۲ء میں ImageNet میں غلطی کی شرح کتنی کی؟

✓ بالکل! ۲۶٪ سے ۱۵٪ — یہ AI تاریخ کا اہم موڑ تھا۔
✗ غلط۔ AlexNet نے غلطی کی شرح ۲۶٪ سے تقریباً ۱۵٪ تک لائی۔

۳۔ AlphaGo نے Lee Sedol کو ۲۰۱۶ء میں کتنے گیمز میں شکست دی؟

✓ درست! AlphaGo نے ۵ میں سے ۴ گیمز جیتے۔
✗ نہیں۔ AlphaGo نے Lee Sedol کو ۴-۱ سے شکست دی تھی۔

۴۔ ماڈل کے پیرامیٹرز کیا ہوتے ہیں؟

✓ شاباش! پیرامیٹرز ریاضیاتی اعداد ہیں جن میں ماڈل کا علم محفوظ ہوتا ہے۔
✗ غلط۔ پیرامیٹرز وہ اعداد ہیں جو ٹریننگ کے دوران ایڈجسٹ ہوتے ہیں۔

۵۔ تقویتی تعلم کا بنیادی اصول کیا ہے؟

✓ بالکل! تقویتی تعلم انعام اور سزا کے نظام پر کام کرتا ہے۔
✗ درست نہیں۔ تقویتی تعلم میں انعام اور سزا کے ذریعے آزمائش اور غلطی سے سیکھا جاتا ہے۔

۶۔ Amazon کے AI بھرتی نظام کو کیوں بند کیا گیا؟

✓ درست! یہ ڈیٹا تعصب کی کلاسیک مثال ہے۔
✗ نہیں۔ متعصب ٹریننگ ڈیٹا کی وجہ سے یہ نظام خواتین کو ناانصافی سے مسترد کر رہا تھا۔

۷۔ پری ٹریننگ کے بعد فائن ٹیوننگ کا فائدہ کیا ہے؟

✓ شاباش! فائن ٹیوننگ ٹرانسفر لرننگ کا عملی اطلاق ہے۔
✗ غلط۔ فائن ٹیوننگ میں عمومی علم محفوظ رکھتے ہوئے مخصوص مہارت شامل کی جاتی ہے — یہ وقت اور پیسہ بچاتا ہے۔

۸۔ "ڈیٹا کنٹامینیشن" بینچ مارک میں کیا مسئلہ پیدا کرتا ہے؟

✓ بالکل! اس لیے نئے بینچ مارکس بنانے پڑتے ہیں۔
✗ نہیں۔ ڈیٹا کنٹامینیشن میں بینچ مارک کے سوالات ٹریننگ میں آ جاتے ہیں جس سے اسکور گمراہ کن ہو جاتا ہے۔

۹۔ "گریڈیئنٹ ڈیسنٹ" کی بہترین تشبیہ کیا ہے؟

✓ درست تشبیہ! گریڈیئنٹ ڈیسنٹ آہستہ آہستہ سب سے کم غلطی کی طرف بڑھتا ہے۔
✗ غلط۔ گریڈیئنٹ ڈیسنٹ پہاڑ سے آہستہ آہستہ نیچے اترنے کی طرح ہر قدم پر غلطی کم کرتا ہے۔

۱۰۔ DeepMind کی Atari AI نے ۴۹ گیمز میں سے کتنے میں انسانی ماہرین کو پیچھے چھوڑا؟

✓ بالکل! ۴۹ میں سے ۲۹ گیمز — تقویتی تعلم کی زبردست کامیابی۔
✗ نہیں۔ DeepMind کی Atari AI نے ۴۹ میں سے ۲۹ گیمز میں انسانی ماہرین کو پیچھے چھوڑا۔

۱۱۔ BERT ماڈل کا بنیادی خیال کیا تھا؟

✓ شاباش! BERT نے ٹرانسفر لرننگ کو زبان کی دنیا میں انقلاب دیا۔
✗ غلط۔ BERT کا خیال بڑے ڈیٹا پر پری ٹریننگ اور پھر مخصوص کاموں پر فائن ٹیوننگ تھا۔

۱۲۔ اوور فٹنگ کو روکنے کا بہترین طریقہ کیا ہے؟

✓ درست! ویلیڈیشن سیٹ اور ریگولرائزیشن اوور فٹنگ سے بچاتے ہیں۔
✗ نہیں۔ اوور فٹنگ روکنے کے لیے ویلیڈیشن سیٹ اور مناسب ماڈل سائز اہم ہیں۔

۱۳۔ Goodhart's Law کا AI جانچ پر اطلاق کیا ہے؟

✓ بالکل درست! اس لیے بینچ مارکس کو باقاعدگی سے بدلنا ضروری ہے۔
✗ غلط۔ Goodhart's Law: جب پیمانہ خود ہدف بن جائے تو وہ حقیقی کارکردگی ناپنا بند کر دیتا ہے۔

۱۴۔ موجودہ AI ماڈلوں کی سب سے اہم خامی کون سی ہے؟

✓ شاباش! ہیلوسینیشن AI کی سب سے خطرناک خامی ہے جو طب اور قانون میں نقصاندہ ہو سکتی ہے۔
✗ نہیں۔ ہیلوسینیشن — یعنی پراعتماد غلط معلومات دینا — موجودہ AI کی سب سے اہم خامی ہے۔

۱۵۔ نمائندگی کا فقدان (Representation Gap) AI میں کیا مسئلہ پیدا کرتا ہے؟

✓ بالکل! جو گروہ ڈیٹا میں کم ہوں، ان کے لیے AI کم کارآمد ہوتی ہے۔
✗ غلط۔ نمائندگی کا فقدان وہ مسئلہ ہے جس میں کم نمائندہ گروہوں پر AI ناقص کام کرتی ہے۔
```