🎯 ایڈوانسڈ · سبق ۱

مسئلہ پہلے متعین کریں

AI نظام بنانے سے پہلے یہ سمجھنا ضروری ہے کہ آپ اصل میں کیا حل کرنا چاہتے ہیں۔

کیا ٹیکنالوجی خود بخود کسی مسئلے کا حل ہو سکتی ہے؟

۲۰۱۸ء میں IBM نے واٹسن فار انکالوجی (Watson for Oncology) نامی AI نظام کو کینسر کے علاج کی سفارشات کے لیے متعدد ہسپتالوں میں نافذ کیا۔ تاہم STAT News کی تحقیقات سے معلوم ہوا کہ یہ نظام بعض اوقات ایسے علاج تجویز کرتا تھا جنہیں طبی ماہرین "غیر محفوظ اور غلط" قرار دیتے تھے۔ جانچ پڑتال سے پتہ چلا کہ نظام کو حقیقی مریضوں کے ڈیٹا پر نہیں بلکہ فرضی کیس سینیریوز پر تربیت دی گئی تھی۔ IBM نے بالآخر ۲۰۲۲ء میں یہ پروگرام بند کر دیا۔ بنیادی خرابی یہ تھی کہ مسئلے کی تعریف غلط تھی — نظام طبی فیصلہ سازی کی پیچیدگی کو سمجھے بغیر بنایا گیا۔

مسئلے کی واضح تعریف کیوں ضروری ہے؟

AI نظام بنانے کی سب سے عام غلطی یہ ہے کہ ٹیکنالوجی سے آغاز کیا جائے — "ہم ایک AI چیٹ بوٹ بنائیں گے" — بجائے اس کے کہ پہلے یہ پوچھا جائے: "اصل مسئلہ کیا ہے اور کیا AI اسے حل کرنے کا بہترین ذریعہ ہے؟"

IBM واٹسن کا معاملہ اس کی واضح مثال ہے۔ انجینئروں نے ایک طاقتور نظام بنایا لیکن انہوں نے طبی حقیقت کو نہیں سمجھا: کینسر کا علاج صرف ڈیٹا کا مسئلہ نہیں، بلکہ اس میں مریض کی ذاتی صورتحال، ڈاکٹر کا تجربہ، اور مقامی صحت نظام شامل ہوتے ہیں۔

مسئلہ فریمنگ کے چار سوال

کسی بھی AI منصوبے کے آغاز میں یہ چار سوال لازمی پوچھنے چاہئیں:

مسئلہ کیا ہے؟ — اسے ممکنہ حد تک مخصوص الفاظ میں بیان کریں۔ "ہسپتال کی کارکردگی بہتر کرنا" بہت مبہم ہے؛ "داخلے کے وقت انتظار کو ۳۰ منٹ سے کم کرنا" قابل عمل ہے۔
AI ضروری ہے؟ — کیا یہ مسئلہ ایک سادہ ڈیٹا بیس یا عمل کی بہتری سے حل نہیں ہو سکتا؟ سب سے پہلے سادہ حل آزمائیں۔
ڈیٹا کہاں سے آئے گا؟ — کیا تربیتی ڈیٹا حقیقی صورتحال کی صحیح عکاسی کرتا ہے؟
کامیابی کی پیمائش کیسے ہوگی؟ — تکنیکی میٹرکس (جیسے دقت/accuracy) اور حقیقی دنیا کے نتائج (جیسے مریض کی صحت) میں فرق کریں۔

اہم نکتہ

گوگل فلو (Google Flu Trends) نے ۲۰۰۸ء میں انفلوئنزا کے پھیلاؤ کی پیش گوئی کا دعویٰ کیا لیکن ۲۰۱۳ء میں حقیقی اعداد و شمار سے دوگنا زیادہ کیسز ظاہر کیے۔ وجہ: ماڈل سرچ رویے پر منحصر تھا، اصل بیماری پر نہیں — مسئلے کی غلط تعریف کا نتیجہ۔

مسئلہ فریمنگ دستاویز

ایک موثر AI منصوبے کا آغاز ایک مختصر "مسئلہ فریمنگ دستاویز" سے ہوتا ہے جس میں درج ہو:

عنصر	مثال
مسئلہ کا بیان	طلبہ کو ریاضی کے ہوم ورک میں فوری مدد نہیں ملتی
متاثرہ افراد	ثانوی سطح کے طلبہ، خاص طور پر دور دراز علاقوں کے
موجودہ حل اور ان کی کمی	ٹیوٹر مہنگے ہیں، یوٹیوب ویڈیوز غیر انٹرایکٹو ہیں
کیا AI صحیح ابزار ہے؟	ہاں — قدرتی زبان میں سوالات کا فوری جواب دینا AI کی خاصیت ہے
کامیابی کا معیار	۸۰٪ طلبہ اگلے سوال پر آگے بڑھ سکیں بغیر استاد کی مدد کے

📝 کوئز · سبق ۱

مسئلہ پہلے متعین کریں

تین سوالات کے جوابات دیں

۱. IBM واٹسن فار انکالوجی کی بنیادی خامی کیا تھی؟

بالکل درست! IBM نے فرضی سینیریوز پر انحصار کیا جو حقیقی طبی پیچیدگی کی عکاسی نہیں کرتے تھے — یہ مسئلے کی غلط تعریف کا نتیجہ تھا۔

غلط۔ اصل مسئلہ تکنیکی طاقت نہیں بلکہ تربیتی ڈیٹا اور مسئلے کی غلط تعریف تھی۔

۲. AI منصوبے کے لیے مسئلہ فریمنگ کے چار سوالوں میں سے کون سا سوال سب سے پہلے پوچھا جانا چاہیے؟

درست! مسئلے کی واضح اور مخصوص تعریف باقی تمام فیصلوں کی بنیاد ہے۔

یہ سوال بعد میں آتا ہے۔ سب سے پہلے یہ سمجھنا ضروری ہے کہ مسئلہ اصل میں کیا ہے۔

۳. گوگل فلو ٹرینڈز کی ناکامی کی بنیادی وجہ کیا تھی؟

بالکل صحیح! یہ مسئلے کی غلط فریمنگ کی کلاسک مثال ہے — "لوگ بیمار ہیں" اور "لوگ بیماری کے بارے میں سرچ کر رہے ہیں" دو الگ باتیں ہیں۔

غلط۔ گوگل کے پاس وافر ڈیٹا تھا، لیکن ڈیٹا غلط چیز کی پیمائش کر رہا تھا۔

🧪 لیب · سبق ۱

مسئلہ فریمنگ مشق

AI کے ساتھ مل کر کسی حقیقی مسئلے کی فریمنگ کریں

اس لیب میں آپ کیا کریں گے

AI آپ سے ایک مسئلہ لے گا اور چار سوالوں کے ذریعے اسے واضح کرنے میں مدد کرے گا۔ پاکستان یا آپ کے اردگرد کسی حقیقی مسئلے کا انتخاب کریں جسے آپ AI سے حل کرنا چاہتے ہیں۔

مثال: "ہمارے شہر کے سرکاری اسکولوں میں حاضری کم ہے" یا "گاؤں میں بجلی کے بلوں کی غلطیاں بہت ہوتی ہیں"

اپنا مسئلہ AI کو بتائیں
AI کے سوالات کے جوابات دیں
آخر میں دیکھیں کہ آپ کا مسئلہ کتنا واضح ہو گیا

🧪 مسئلہ فریمنگ اسسٹنٹ AI گفتگو

🎯 ایڈوانسڈ · سبق ۲

ڈیزائن کے طور پر پرامپٹنگ

پرامپٹ (ہدایت نامہ) محض ایک جملہ نہیں — یہ ایک ڈیزائن فیصلہ ہے جو نظام کے رویے کو متعین کرتا ہے۔

کیا ایک پرامپٹ کی چھوٹی تبدیلی AI کے جواب کو مکمل بدل سکتی ہے؟

۲۰۲۳ء میں Chevrolet کی ڈیلرشپ نے اپنی ویب سائٹ پر ایک AI چیٹ بوٹ نصب کیا۔ ایک صارف نے ہوشیاری سے بوٹ کو اس طرح ہدایت دی کہ وہ گاڑی ایک ڈالر میں فروخت کرنے پر "رضامند" ہو گیا۔ وجہ: سسٹم پرامپٹ میں کوئی واضح حدود نہیں تھیں۔ اسی سال ایک اور مشہور واقعہ میں ایئر کینیڈا کے AI بوٹ نے مسافر کو غلط چھوٹ کا وعدہ کیا جسے بعد میں عدالت نے لاگو قرار دیا — کمپنی کو نقصان اٹھانا پڑا۔

پرامپٹ انجینئرنگ بطور ڈیزائن

جب آپ کسی AI نظام کو عوامی استعمال کے لیے تیار کرتے ہیں تو پرامپٹ دراصل ایک "سافٹ وئیر انٹرفیس" کا کام کرتا ہے۔ یہ متعین کرتا ہے کہ AI کیا کرے گا، کیا نہیں کرے گا، کس لہجے میں بات کرے گا، اور کہاں انسان کو بھیجے گا۔

Chevrolet اور Air Canada کے واقعات یہ ثابت کرتے ہیں کہ ناقص پرامپٹ ڈیزائن کے قانونی اور مالی نتائج ہو سکتے ہیں۔ پرامپٹنگ کو ہمیشہ ایک سنجیدہ انجینئرنگ کام سمجھیں۔

موثر سسٹم پرامپٹ کے اجزاء

کردار (Role): AI کو واضح بتائیں کہ وہ کون ہے — "آپ پاکستان ٹیلی کام کے کسٹمر سروس اسسٹنٹ ہیں"
دائرہ کار (Scope): کیا کریں اور کیا نہ کریں — "صرف بلنگ اور کنکشن سے متعلق سوالات کے جواب دیں"
لہجہ (Tone): رسمی یا غیر رسمی، اردو یا انگریزی، مختصر یا تفصیلی
حدود (Guardrails): "اگر کوئی ذاتی مالی معلومات مانگے تو مت دیں"
ناکامی کا منصوبہ (Fallback): "اگر آپ نہ جانتے ہوں تو صارف کو 0311-XXXXXX پر بھیجیں"

عملی مثال

کمزور پرامپٹ: "تم ہمارے اسٹور کے لیے کام کرتے ہو، مدد کرو۔"
مضبوط پرامپٹ: "آپ لاہور کے فیصل بک ڈپو کے آنلائن اسسٹنٹ ہیں۔ صرف کتابوں کی دستیابی، قیمت اور ڈیلیوری کے بارے میں بتائیں۔ کوئی بھی ادائیگی کا لین دین نہ کریں۔ اگر کوئی بات اس دائرے سے باہر ہو تو کہیں کہ ہمارے اسٹور پر تشریف لائیں۔"

پرامپٹ ورژن کنٹرول

ایک پیشہ ور AI ڈویلپر اپنے پرامپٹس کو کوڈ کی طرح سنبھالتا ہے: ہر تبدیلی کو ریکارڈ کرتا ہے، تبدیلی کی وجہ لکھتا ہے، اور نتائج ناپتا ہے۔ پرامپٹ کو "صرف ٹیکسٹ" نہ سمجھیں — یہ آپ کے AI نظام کی بنیاد ہے۔

📝 کوئز · سبق ۲

ڈیزائن کے طور پر پرامپٹنگ

تین سوالات کے جوابات دیں

۱. ایئر کینیڈا کے AI بوٹ کے واقعے سے کیا سبق ملتا ہے؟

بالکل درست! عدالت نے فیصلہ دیا کہ AI کا وعدہ کمپنی کو لاگو ہوتا ہے — یہ پرامپٹ ڈیزائن کی سنجیدگی ثابت کرتا ہے۔

غلط۔ سبق AI کے استعمال کو ترک کرنا نہیں بلکہ پرامپٹ کو احتیاط سے ڈیزائن کرنا ہے۔

۲. ایک موثر سسٹم پرامپٹ میں "فال بیک" (Fallback) کا کیا مطلب ہے؟

درست! فال بیک وہ منصوبہ ہے جو AI کی حد کے وقت صارف کو صحیح انسانی مدد تک پہنچاتا ہے۔

غلط۔ فال بیک پرامپٹ ڈیزائن کا وہ حصہ ہے جو AI کی حدود کے لمحے کے لیے ہوتا ہے، نہ کہ تکنیکی بیک اپ۔

۳. پرامپٹ ورژن کنٹرول کیوں ضروری ہے؟

بالکل! پرامپٹ کو کوڈ کی طرح سنبھالنا پیشہ ورانہ AI ڈویلپمنٹ کی نشانی ہے۔

غلط۔ پرامپٹ ورژن کنٹرول رفتار کے لیے نہیں بلکہ احتساب اور بہتری کے لیے ہے۔

🧪 لیب · سبق ۲

پرامپٹ ڈیزائن ورکشاپ

اپنے AI نظام کے لیے ایک موثر سسٹم پرامپٹ تیار کریں

اس لیب میں آپ کیا کریں گے

AI کے ساتھ مل کر ایک مخصوص مقصد کے لیے سسٹم پرامپٹ تیار کریں۔ پانچوں عناصر (کردار، دائرہ کار، لہجہ، حدود، فال بیک) شامل ہوں۔

کوئی بھی پاکستانی سیاق و سباق کا انتخاب کریں — مثلاً: یونیورسٹی داخلہ اسسٹنٹ، ریلوے ٹکٹ سروس، یا میڈیکل کلینک بوٹ

AI کو اپنا منتخب کردہ سیاق و سباق بتائیں
AI آپ سے سوالات پوچھے گا
مل کر ایک مکمل سسٹم پرامپٹ تیار کریں

🧪 پرامپٹ ڈیزائن اسسٹنٹ AI گفتگو

🎯 ایڈوانسڈ · سبق ۳

AI آؤٹ پٹ کا جائزہ

AI کی پیداوار کو قبول کرنے سے پہلے اسے جانچنا سیکھنا ہر بنانے والے کی ذمہ داری ہے۔

کیا AI کا جواب "درست لگنا" اور "درست ہونا" ایک ہی چیز ہے؟

۲۰۲۳ء میں امریکی وکیل Steven Schwartz نے ChatGPT سے قانونی حوالہ جات مانگے اور انہیں بغیر تصدیق کے عدالت میں پیش کر دیا۔ چھ حوالہ جات مکمل طور پر جھوٹے تھے — ایسے مقدمات جو کبھی ہوئے ہی نہیں تھے۔ جج نے وکیل کو ۵,۰۰۰ ڈالر جرمانہ کیا اور انہیں عدالتی نگرانی میں رکھا۔ AI نے "ہیلوسینیشن" (hallucination — یعنی قابل اعتماد لگنے والی جھوٹی معلومات) پیدا کی تھی، اور وکیل نے اسے چیک نہیں کیا۔

AI آؤٹ پٹ جانچنے کا فریم ورک

Schwartz کا واقعہ AI کی ایک بنیادی حقیقت واضح کرتا ہے: یہ ماڈلز اعتماد کے ساتھ غلط جوابات دے سکتے ہیں۔ لہذا ہر AI نظام کے ساتھ ایک منظم جائزہ عمل (evaluation process) ضروری ہے۔

TRACE فریم ورک

T — Truth (صداقت): کیا یہ معلومات قابل تصدیق ذرائع سے ثابت ہو سکتی ہے؟
R — Relevance (مطابقت): کیا جواب اصل سوال کا ہے یا ادھر ادھر گیا؟
A — Accuracy (درستگی): اعداد، تاریخیں، نام — یہ سب درست ہیں؟
C — Completeness (مکمل ہونا): کیا کوئی اہم پہلو چھوٹ گیا؟
E — Ethics (اخلاقیات): کیا جواب کسی گروہ کو نقصان پہنچا سکتا ہے؟

تشخیصی میٹرکس کی حدود

ماڈل کی تکنیکی دقت (accuracy) اور حقیقی دنیا میں اس کی افادیت دو مختلف چیزیں ہیں۔ ایک ماڈل ۹۵٪ دقت کے ساتھ اسپام ای میل پکڑ سکتا ہے، لیکن اگر وہ ۵٪ اہم ای میلز کو اسپام سمجھے تو اس کی قیمت بہت زیادہ ہو سکتی ہے۔

اس لیے AI آؤٹ پٹ کا جائزہ لیتے وقت صرف تکنیکی میٹرکس پر نہ رکیں — استعمال کنندگان کے تجربے، غلطیوں کے اثرات، اور مختلف گروہوں پر اثرات کا بھی جائزہ لیں۔

ہیلوسینیشن کا انتظام

AI ہیلوسینیشن سے مکمل بچنا ممکن نہیں، لیکن اس کا انتظام کیا جا سکتا ہے:

اہم حوالہ جات کے لیے AI سے ماخذ بتانے کی درخواست کریں
حساس معاملات میں انسانی تصدیق کی تہہ شامل کریں
AI کو "مجھے نہیں معلوم" کہنے کی اجازت دینے والے پرامپٹس لکھیں
Retrieval-Augmented Generation (RAG) استعمال کریں جو AI کو قابل اعتماد دستاویزات تک محدود رکھتا ہے

📝 کوئز · سبق ۳

AI آؤٹ پٹ کا جائزہ

تین سوالات کے جوابات دیں

۱. وکیل Steven Schwartz کو جرمانہ کیوں ہوا؟

بالکل درست! AI نے ایسے مقدمات "بنائے" جو کبھی ہوئے ہی نہیں تھے — اور وکیل نے انہیں چیک نہیں کیا۔

غلط۔ مسئلہ AI کی ہیلوسینیشن نہیں پکڑنا تھا — AI کے جھوٹے حوالہ جات بغیر تصدیق عدالت میں چلے گئے۔

۲. TRACE فریم ورک میں "E" کس چیز کے لیے ہے؟

درست! TRACE کا آخری عنصر اخلاقی جائزہ ہے — کیا جواب کسی کو نقصان دہ طریقے سے متاثر کر سکتا ہے۔

غلط۔ TRACE فریم ورک میں E کا مطلب Ethics (اخلاقیات) ہے۔

۳. RAG (Retrieval-Augmented Generation) کا بنیادی فائدہ کیا ہے؟

بالکل! RAG AI کو "اپنے ذہن سے بنانے" کی بجائے قابل اعتماد ذرائع سے جواب دینے پر مجبور کرتا ہے۔

غلط۔ RAG کا بنیادی مقصد ہیلوسینیشن کم کرنا ہے، رفتار یا لاگت نہیں۔

🧪 لیب · سبق ۳

AI آؤٹ پٹ جانچنے کی مشق

TRACE فریم ورک کو عملی طور پر استعمال کریں

اس لیب میں آپ کیا کریں گے

AI آپ کو ایک AI-تیارکردہ متن دے گا اور آپ سے TRACE فریم ورک کے ذریعے اس کا جائزہ لینے کو کہے گا۔ یہ جائزہ عمل سیکھنا AI نظام بنانے والوں کے لیے بنیادی مہارت ہے۔

AI آپ سے پوچھے گا: "کس موضوع پر AI کا تیار کردہ متن جانچنا چاہیں گے؟" — کوئی بھی موضوع بتائیں

موضوع بتائیں
AI ایک نمونہ متن پیش کرے گا
TRACE کے ہر نقطے پر اپنا جائزہ شیئر کریں

🧪 آؤٹ پٹ جائزہ اسسٹنٹ AI گفتگو

🎯 ایڈوانسڈ · سبق ۴

انسان-AI ورک فلو ڈیزائن

AI کو پورے عمل میں شامل کرنا نہیں، بلکہ اسے صحیح جگہ پر درست کام سونپنا ہے۔

کیا ہر کام AI کو سونپنا دانشمندی ہے؟

۲۰۱۸ء میں Amazon نے اپنا AI بھرتی نظام بند کیا جو خود بخود CVs کا جائزہ لیتا تھا۔ نظام نے خواتین امیدواروں کے خلاف امتیاز کرنا شروع کر دیا — کیونکہ تربیتی ڈیٹا پچھلے دس سالوں کے مرد-اکثریتی بھرتی فیصلوں پر مبنی تھا۔ سب سے اہم بات: اس عمل میں انسانی جانچ کا کوئی مرحلہ شامل نہیں تھا۔ AI نے امیدواروں کو رد کیا اور کسی نے نہیں دیکھا کہ بنیاد کیا تھی۔

ورک فلو میں AI کا مقام

Amazon کی غلطی صرف متعصب ڈیٹا نہیں تھی — غلطی یہ تھی کہ AI کو ایک ایسے عمل میں حتمی فیصلہ ساز بنا دیا گیا جہاں انسانی نگرانی نہیں تھی۔ ایک اچھے ورک فلو ڈیزائن میں AI کا کردار واضح ہوتا ہے اور انسانی مداخلت کے مقامات متعین ہوتے ہیں۔

تین ورک فلو ماڈل

AI پہلے، انسان تصدیق کرے: AI ابتدائی مسودہ، فہرست یا تجزیہ کرتا ہے اور انسان جانچ کر فیصلہ کرتا ہے۔ طبی تشخیص، قانونی جائزہ۔
انسان پہلے، AI معاونت کرے: انسان کام کرتا ہے اور AI ریئل ٹائم تجاویز دیتا ہے۔ کوڈ لکھنا، تحریر نویسی۔
AI مکمل طور پر خودکار: صرف کم خطرے، زیادہ دہرائے جانے والے کام — ای میل فلٹرنگ، اسپام پکڑنا، بل ادائیگی یاد دہانی۔

فیصلے کا معیار

جتنا زیادہ خطرہ اور جتنی کم دہرائی جانے والی صورتحال، اتنی زیادہ انسانی نگرانی ضروری ہے۔ کسی شخص کے ملازمت یا قرض کے بارے میں فیصلے میں AI کو آخری لفظ نہیں ہونا چاہیے۔

Human-in-the-Loop ڈیزائن

Human-in-the-Loop (HITL) یعنی "انسان درمیان میں" وہ اصول ہے جس میں AI عمل کے اہم نقاط پر انسانی منظوری یا جانچ لازمی ہوتی ہے۔ یہ خاص طور پر ان کاموں کے لیے ضروری ہے جو بڑی تعداد میں لوگوں کو متاثر کریں، قانونی یا اخلاقی نتائج ہوں، یا جہاں AI کی غلطی ناقابل تلافی ہو۔

📝 کوئز · سبق ۴

انسان-AI ورک فلو ڈیزائن

تین سوالات کے جوابات دیں

۱. Amazon کے AI بھرتی نظام کی بنیادی ناکامی کیا تھی؟

درست! AI نے پرانے امتیازی بھرتی فیصلوں کا پیٹرن سیکھا اور کوئی انسانی جانچ نہ ہونے کی وجہ سے یہ جاری رہا۔

غلط۔ اصل مسئلہ یہ تھا کہ تربیتی ڈیٹا متعصب تھا اور ورک فلو میں کوئی انسانی نگرانی نہیں تھی۔

۲. Human-in-the-Loop ڈیزائن کا بنیادی اصول کیا ہے؟

بالکل! HITL کا مطلب ہے کہ اہم کاموں میں انسان کو فیصلہ کرنے کا موقع ملنا چاہیے۔

غلط۔ HITL یہ ہے کہ اہم نقاط پر انسانی نگرانی اور منظوری یقینی بنائی جائے۔

۳. کس قسم کے کام AI کو مکمل طور پر خودکار کرنے کے لیے موزوں ہیں؟

درست! مکمل خودکاری صرف ان کاموں کے لیے ہے جن میں غلطی کا خطرہ کم اور اثر محدود ہو۔

غلط۔ قرض یا طبی فیصلے اعلی خطرے والے ہیں اور ان میں لازماً انسانی نگرانی چاہیے۔

🧪 لیب · سبق ۴

ورک فلو ڈیزائن مشق

کسی حقیقی کام کے لیے بہترین ورک فلو ماڈل ڈیزائن کریں

اس لیب میں آپ کیا کریں گے

AI آپ کے ساتھ مل کر ایک پاکستانی سیاق و سباق میں AI ورک فلو ڈیزائن کرے گا۔ آپ کو فیصلہ کرنا ہوگا کہ کون سے مراحل AI خودکار کرے اور کہاں انسانی نگرانی ضروری ہے۔

کوئی بھی سیاق و سباق منتخب کریں: طلبہ داخلہ، بینک قرض، ہسپتال اپوائنٹمنٹ، یا کسٹمر شکایت نظام

اپنا منتخب کردہ عمل AI کو بتائیں
مل کر ہر مرحلے کا جائزہ لیں
فیصلہ کریں کہ کہاں AI اور کہاں انسان

🧪 ورک فلو ڈیزائن اسسٹنٹ AI گفتگو

🎯 ایڈوانسڈ · سبق ۵

ٹیسٹنگ اور ریڈ ٹیمنگ

AI نظام کو عوام تک پہنچانے سے پہلے اسے توڑنے کی کوشش کریں — تاکہ حقیقی دنیا میں نہ ٹوٹے۔

آپ AI کو کیسے جانچیں گے جب آپ نہیں جانتے کہ صارفین کیا کریں گے؟

۲۰۱۶ء میں Microsoft نے Twitter پر Tay نامی AI چیٹ بوٹ لانچ کیا۔ ۱۶ گھنٹوں میں Twitter صارفین نے Tay کو نسل پرستانہ اور توہین آمیز بیانات دینے پر آمادہ کر لیا۔ Microsoft نے بوٹ بند کر دیا۔ بعد از تجزیہ: کمپنی نے adversarial testing (یعنی جان بوجھ کر نظام کو غلط استعمال کرنے کی کوشش) نہیں کی تھی۔ Red team (وہ ٹیم جو نظام کی کمزوریاں ڈھونڈتی ہے) کا استعمال نہیں ہوا تھا۔

ریڈ ٹیمنگ کیا ہے؟

ریڈ ٹیمنگ (Red Teaming) وہ عمل ہے جس میں ایک مخصوص ٹیم — بعض اوقات خود ڈویلپرز، بعض اوقات بیرونی ماہرین — جان بوجھ کر AI نظام کو غلط استعمال کرنے، گمراہ کرنے، یا نقصاندہ نتائج پیدا کرنے کی کوشش کرتی ہے۔ مقصد: کمزوریاں عوامی اجرا سے پہلے ڈھونڈنا۔

Microsoft کا Tay واقعہ ریڈ ٹیمنگ کی غیر موجودگی کے نتائج کی واضح مثال ہے۔ آج بڑی AI کمپنیاں — Anthropic، OpenAI، Google — تمام نئے ماڈلز کو لانچ سے پہلے ریڈ ٹیمنگ سے گزارتی ہیں۔

ٹیسٹنگ کی اقسام

فنکشنل ٹیسٹنگ: کیا AI وہ کام کرتا ہے جو اسے کرنا چاہیے؟ عام سوالات پر درست جواب دینا
Edge Case ٹیسٹنگ: غیر معمولی یا انتہائی ان پٹ پر کیا ہوتا ہے؟ مثلاً خالی ان پٹ، بہت لمبا ان پٹ، یا جان بوجھ کر غلط ان پٹ
Adversarial ٹیسٹنگ: کوئی AI کو نقصاندہ کام پر مجبور کرنے کی کوشش کرے تو کیا ہوگا؟
Regression ٹیسٹنگ: نئی اپ ڈیٹ کے بعد پرانے کام اب بھی ٹھیک ہیں؟
Equity ٹیسٹنگ: مختلف گروہوں — مردوں، خواتین، بوڑھوں، نوجوانوں — کے لیے نتائج یکساں ہیں؟

جانچ کا اصول

"یہ کبھی نہیں ہوگا" — یہ الفاظ AI ڈیزائن میں خطرناک ہیں۔ Tay کے ڈویلپرز نے بھی شاید نہیں سوچا تھا کہ ۱۶ گھنٹوں میں ہوگا جو ہوا۔ ہر وہ صورتحال ٹیسٹ کریں جس کا آپ کو اندازہ نہ ہو۔

ٹیسٹنگ دستاویزات

ہر ٹیسٹنگ رن کی دستاویز بنانا ضروری ہے: کیا ٹیسٹ کیا، کیا نتیجہ آیا، کیا خامی ملی، اور کیا اصلاح کی گئی۔ یہ دستاویزات نہ صرف بہتری میں مدد کرتی ہیں بلکہ بعد میں جوابدہی کے لیے بھی ضروری ہیں۔

📝 کوئز · سبق ۵

ٹیسٹنگ اور ریڈ ٹیمنگ

تین سوالات کے جوابات دیں

۱. Microsoft Tay کی ناکامی سے AI ڈویلپرز نے کیا سیکھا؟

بالکل! Tay کے واقعے نے AI صنعت کو adversarial testing کی اہمیت سمجھائی۔

غلط۔ سبق پلیٹ فارم سے متعلق نہیں بلکہ لانچ سے پہلے مکمل ٹیسٹنگ کے بارے میں ہے۔

۲. Equity ٹیسٹنگ کا بنیادی مقصد کیا ہے؟

درست! Equity ٹیسٹنگ اس بات کو جانچتی ہے کہ کوئی گروہ AI سے متعصبانہ برتاؤ کا شکار تو نہیں۔

غلط۔ Equity ٹیسٹنگ رفتار یا لاگت کے لیے نہیں — یہ انصاف کے لیے ہے۔

۳. Regression ٹیسٹنگ کب ضروری ہوتی ہے؟

بالکل! اپ ڈیٹ کے بعد regression ٹیسٹنگ ضروری ہے — نئی چیز ٹھیک کرتے ہوئے پرانی چیز نہ بگڑ جائے۔

غلط۔ Regression ٹیسٹنگ کا مقصد ہے کہ اپ ڈیٹ کے بعد پہلے سے کام کرنے والی چیزیں ابھی بھی کام کریں۔

🧪 لیب · سبق ۵

ریڈ ٹیمنگ مشق

AI نظام کی کمزوریاں ڈھونڈنا سیکھیں

اس لیب میں آپ کیا کریں گے

AI آپ کے ساتھ ایک فرضی AI نظام پر ریڈ ٹیمنگ مشق کرے گا۔ آپ کا کام ہے کہ اس نظام میں خامیاں ڈھونڈیں — یعنی سوچیں کہ صارفین اسے کیسے غلط استعمال کر سکتے ہیں۔

AI پہلے پوچھے گا کہ آپ کس AI نظام کو ریڈ ٹیم کرنا چاہتے ہیں — مثلاً: اسکول کا AI ٹیوٹر، بینک کا چیٹ بوٹ، یا نیوز سمری ٹول

اپنا نظام منتخب کریں
AI آپ کے ساتھ مل کر کمزوریاں ڈھونڈے گا
ممکنہ اصلاحات تجویز کریں

🧪 ریڈ ٹیمنگ اسسٹنٹ AI گفتگو

🎯 ایڈوانسڈ · سبق ۶

ذمہ دارانہ تعیناتی

AI بنانا اور AI کو دنیا میں چھوڑنا — یہ دو الگ ذمہ داریاں ہیں۔

کیا AI لانچ کرنے کے بعد ذمہ داری ختم ہو جاتی ہے؟

۲۰۲۱ء میں Facebook کی اندرونی تحقیقات — جو Frances Haugen نے لیک کیں — سے معلوم ہوا کہ کمپنی کا الگوریتھم نوجوان لڑکیوں میں جسمانی تصویر کے حوالے سے ذہنی مسائل بڑھا رہا تھا۔ کمپنی کو یہ بات معلوم تھی لیکن مصروفیت (engagement) کی وجہ سے الگوریتھم نہیں بدلا۔ یہ واقعہ بتاتا ہے کہ تعیناتی کے بعد جاری نگرانی اور خطرات کے ظاہر ہونے پر فوری کارروائی ذمہ دارانہ AI کی شرط ہے۔

تعیناتی سے پہلے کا چیک لسٹ

دستاویزات: کیا نظام کیسے کام کرتا ہے، کس ڈیٹا پر تربیت ہوئی، اور کیا حدود ہیں — یہ سب لکھا ہوا ہے؟
رازداری کا جائزہ: کیا نظام کوئی ذاتی معلومات ذخیرہ کرتا ہے؟ کیا قانونی ضروریات پوری ہوتی ہیں؟
منصفانہ استعمال کی پالیسی: کیا واضح ہے کہ اسے کس لیے استعمال کیا جا سکتا ہے اور کیا نہیں؟
شکایت کا طریقہ: صارفین غلطی کی اطلاع کیسے دیں گے؟
بند کرنے کا منصوبہ: اگر نظام نقصاندہ ثابت ہو تو اسے فوری بند کرنے کا طریقہ کیا ہے؟

تعیناتی کے بعد کی نگرانی

Facebook کا معاملہ بتاتا ہے کہ تعیناتی کے بعد کی نگرانی نہ ہونا یا نتائج جان کر نظرانداز کرنا اخلاقی اور قانونی خطرہ ہے۔ ایک ذمہ دار ڈویلپر لانچ کے بعد:

باقاعدگی سے نظام کی کارکردگی مانیٹر کرتا ہے
صارفین کی شکایات اور فیڈ بیک کا باقاعدہ جائزہ لیتا ہے
غیر متوقع نتائج کے لیے خودکار الارم سیٹ کرتا ہے
مسائل ظاہر ہونے پر فوری مداخلت کرتا ہے

ماڈل کارڈ

Google اور Hugging Face نے "Model Cards" کا رواج شروع کیا — ہر AI ماڈل کے ساتھ ایک دستاویز جس میں نظام کی صلاحیتیں، حدود، تربیتی ڈیٹا کی تفصیل، اور کون سے استعمالات غیر موزوں ہیں — سب لکھا ہوتا ہے۔ یہ شفافیت ذمہ دارانہ تعیناتی کی بنیاد ہے۔

📝 کوئز · سبق ۶

ذمہ دارانہ تعیناتی

تین سوالات کے جوابات دیں

۱. Frances Haugen کے لیک کردہ دستاویزات نے Facebook کے بارے میں کیا ظاہر کیا؟

بالکل! یہ واقعہ جانتے بوجھتے نقصاندہ الگوریتھم جاری رکھنے کی مثال ہے — ذمہ دارانہ تعیناتی کی سنگین خلاف ورزی۔

غلط۔ اہم بات یہ ہے کہ Facebook کو نتائج معلوم تھے مگر کارروائی نہیں کی — یہ سب سے سنگین مسئلہ ہے۔

۲. "ماڈل کارڈ" (Model Card) کیا ہے؟

درست! ماڈل کارڈ شفافیت کا ذریعہ ہے — یہ دوسروں کو بتاتا ہے کہ ماڈل کیا کر سکتا ہے اور کیا نہیں۔

غلط۔ ماڈل کارڈ ایک شفافیت دستاویز ہے جو صلاحیتیں، حدود اور مناسب استعمال بیان کرتی ہے۔

۳. تعیناتی سے پہلے کے چیک لسٹ میں "بند کرنے کا منصوبہ" کیوں شامل ہے؟

بالکل! ذمہ دار ڈویلپر ہمیشہ تیار رہتا ہے کہ ضرورت پر نظام فوری بند کیا جا سکے۔

غلط۔ بند کرنے کا منصوبہ ہنگامی صورتحال کے لیے ہے — جب نظام نقصاندہ ہو جائے تو فوری کارروائی ممکن ہو۔

🧪 لیب · سبق ۶

تعیناتی منصوبہ بندی

ایک AI نظام کی ذمہ دارانہ تعیناتی کا منصوبہ تیار کریں

اس لیب میں آپ کیا کریں گے

AI آپ کے ساتھ مل کر ایک AI نظام کی تعیناتی کا منصوبہ بنائے گا — چیک لسٹ سے لے کر بعد از تعیناتی نگرانی تک۔

کوئی بھی AI نظام منتخب کریں جسے آپ لانچ کرنا چاہتے ہیں اور AI سے مدد لیں کہ ذمہ دارانہ تعیناتی کیسے ہو

اپنا AI نظام اور اس کا مقصد بتائیں
AI تعیناتی سے پہلے کے سوالات پوچھے گا
مل کر نگرانی کا منصوبہ تیار کریں

🧪 تعیناتی منصوبہ اسسٹنٹ AI گفتگو

🎯 ایڈوانسڈ · سبق ۷

مساوات کے لیے تعمیر

AI نظام وہی تعصبات جذب کر لیتا ہے جو ڈیٹا میں موجود ہوتے ہیں — جب تک کہ ڈویلپر جان بوجھ کر انہیں دور نہ کرے۔

کیا AI کا تعصب اتفاقی ہوتا ہے یا ڈیزائن کا نتیجہ؟

۲۰۱۵ء میں Joy Buolamwini — MIT کی طالبہ — نے دریافت کیا کہ چہرہ پہچانی (facial recognition) ٹیکنالوجی گوری جلد والے چہروں کو تقریباً ۱٪ غلطی سے پہچانتی تھی لیکن سیاہ فام خواتین کے چہروں پر ۳۵٪ تک غلطی کرتی تھی۔ اس تحقیق کے بعد — جسے "Gender Shades" کہا جاتا ہے — IBM، Microsoft اور Amazon نے اپنے چہرہ پہچانی نظاموں میں بہتری کی۔ وجہ: تربیتی ڈیٹا اکثریتاً گورے مردوں کی تصاویر پر مشتمل تھا۔

تعصب کہاں سے آتا ہے؟

AI کا تعصب (bias) تین جگہوں سے آ سکتا ہے:

ڈیٹا میں: اگر تربیتی ڈیٹا میں ایک گروہ کم نمائندہ ہو تو نظام اس کے لیے کم موثر ہوگا
لیبلنگ میں: اگر ڈیٹا پر لیبل لگانے والے انسانوں کے اپنے تعصبات ہوں تو وہ نظام میں منتقل ہوتے ہیں
ڈیزائن میں: اگر نظام کے مقاصد یا میٹرکس کسی گروہ کی ضروریات نظرانداز کریں

مساوات کے لیے عملی اقدامات

Joy Buolamwini کی تحقیق نے ثابت کیا کہ ایک طالبہ کی محنت بڑی کمپنیوں کو تبدیل کر سکتی ہے۔ لیکن ذمہ داری خود ڈویلپرز پر ہے کہ وہ پہلے سے جائزہ لیں:

تربیتی ڈیٹا میں متنوع گروہوں کی نمائندگی جانچیں
مختلف صنف، عمر، نسل، زبان کے صارفین پر نظام کا جائزہ لیں
ان گروہوں کو ڈیزائن عمل میں شامل کریں جو سب سے زیادہ متاثر ہوں گے
Fairness metrics (انصاف کی پیمائش) جیسے equalised odds کا استعمال کریں

پاکستانی سیاق

پاکستان میں AI نظام بناتے وقت یہ سوال ضروری ہے: کیا یہ اردو اور علاقائی زبانوں میں یکساں اچھا کام کرتا ہے؟ کیا دیہی علاقوں کے صارفین کا ڈیٹا شامل ہے؟ کیا خواتین، اقلیتیں، اور معذور افراد کی ضروریات سوچی گئی ہیں؟

📝 کوئز · سبق ۷

مساوات کے لیے تعمیر

تین سوالات کے جوابات دیں

۱. "Gender Shades" تحقیق نے کیا ثابت کیا؟

درست! یہ تحقیق AI کے ناہموار تعصب کی سب سے اہم دستاویزی مثالوں میں سے ایک ہے۔

غلط۔ Gender Shades نے مخصوص گروہوں کے لیے نظام کی کارکردگی میں بڑے فرق کو سامنے لایا۔

۲. AI میں "لیبلنگ بائس" (labeling bias) کیسے آتا ہے؟

بالکل! اگر انسانی لیبلرز تعصب رکھتے ہیں تو AI اسے "سچ" سمجھ کر سیکھتا ہے۔

غلط۔ لیبلنگ بائس اس وقت آتا ہے جب ڈیٹا پر کام کرنے والے انسانوں کے تعصبات AI میں آ جائیں۔

۳. پاکستان میں AI نظام بناتے وقت مساوات کے لیے کون سا سوال سب سے ضروری ہے؟

بالکل درست! مقامی سیاق میں مساوات کا مطلب ہے کہ تمام پاکستانی گروہوں کی نمائندگی اور ضروریات شامل ہوں۔

غلط۔ پاکستانی سیاق میں اولین سوال مقامی متنوع گروہوں کی نمائندگی کے بارے میں ہونا چاہیے۔

🧪 لیب · سبق ۷

مساوات کا جائزہ

کسی AI نظام میں ممکنہ تعصب کی نشاندہی کریں

اس لیب میں آپ کیا کریں گے

AI آپ سے ایک AI نظام کا انتخاب کروائے گا اور پھر آپ کے ساتھ مل کر اس کے ممکنہ تعصبات کا جائزہ لے گا — خاص طور پر پاکستانی سیاق میں۔

سوچیں: پاکستان میں کوئی AI نظام کس گروہ کو نقصان پہنچا سکتا ہے جسے کسی نے نہیں سوچا؟

کوئی AI نظام منتخب کریں جو پاکستان میں استعمال ہو رہا ہو یا ہونا چاہیے
AI آپ سے مختلف گروہوں کے بارے میں سوالات پوچھے گا
مل کر ممکنہ تعصبات اور اصلاحات تجویز کریں

🧪 مساوات جائزہ اسسٹنٹ AI گفتگو

🎯 ایڈوانسڈ · سبق ۸

جاری ذمہ داریاں

AI بنانا ایک واقعہ نہیں، ایک جاری تعلق ہے — نظام، صارفین، اور دنیا کے ساتھ۔

AI لانچ کے بعد ڈویلپر کی ذمہ داری کب ختم ہوتی ہے؟

۲۰۲۳ء میں OpenAI کے ChatGPT کی وسیع پیمانے پر تعیناتی کے بعد متعدد یونیورسٹیوں نے اس سے متعلق پالیسیاں بنائیں۔ لیکن OpenAI کے اپنے سابق کارکنوں نے — بشمول Ilya Sutskever — کمپنی پر حفاظتی تحقیق کو رفتار کے مقابلے میں پیچھے رکھنے کا الزام لگایا۔ ایک الگ تنظیم — "Anthropic" — بعض OpenAI ملازمین نے "AI safety" (AI کی محفوظیت) کو ترجیح دینے کے لیے قائم کی۔ یہ واقعہ دکھاتا ہے کہ AI تعیناتی کے بعد کی ذمہ داری صرف بگ ٹھیک کرنا نہیں — یہ ایک مسلسل اخلاقی عزم ہے۔

جاری ذمہ داریوں کے چار دائرے

تکنیکی جائزہ: ماڈل کی کارکردگی وقت کے ساتھ بدلتی ہے — نئے ڈیٹا پر دوبارہ تشخیص ضروری ہے
صارف کی آواز: فیڈ بیک سسٹم جو صارفین کو مسائل رپورٹ کرنے دے اور ان پر عمل ہو
قانونی اور ضابطہ کی پابندی: نئے قوانین جیسے EU AI Act کے تحت ذمہ داریاں بدلتی ہیں
اخلاقی احتساب: کیا نظام کے اثرات آج بھی اس کے اہداف کے مطابق ہیں؟

AI ماڈل کی عمر بڑھنے کا مسئلہ

AI ماڈلز ایک مخصوص وقت تک کے ڈیٹا پر تربیت پاتے ہیں۔ دنیا بدلتی رہتی ہے — نئے واقعات، نئے قوانین، نئے سماجی تناظر۔ ایک ماڈل جو ۲۰۲۲ء میں موزوں تھا، ۲۰۲۵ء میں ناقص یا نقصاندہ ہو سکتا ہے۔ اسے "model drift" یعنی "ماڈل کا بہاؤ" کہتے ہیں۔

ذمہ داری کا اصول

Anthropic، OpenAI، اور Google DeepMind تینوں نے "Responsible Scaling Policies" شائع کی ہیں — یعنی یہ وعدہ کہ وہ ماڈل کے نقصاندہ ہونے کی حد پار ہونے پر اسے مزید بڑھانے سے باز رہیں گے۔ یہ جاری ذمہ داری کی مثال ہے۔

ڈویلپر سے زیادہ

OpenAI/Anthropic تنازع یہ بھی بتاتا ہے کہ انفرادی ڈویلپر کے لیے جاری ذمہ داری کا مطلب ہے کہ اگر آپ کی کمپنی غلط راستے پر جائے تو آواز اٹھانا، متبادل تجویز کرنا، یا ضرورت پڑے تو مختلف فیصلہ کرنا بھی آپ کی ذمہ داری ہے۔ AI بنانا صرف تکنیکی کام نہیں — یہ ایک اخلاقی عہد ہے۔

📝 کوئز · سبق ۸

جاری ذمہ داریاں

تین سوالات کے جوابات دیں

۱. "Model Drift" (ماڈل کا بہاؤ) کیا ہے؟

بالکل! دنیا بدلتی رہتی ہے لیکن ماڈل کا علم اس کی تربیت تک محدود ہے — یہ خلا "drift" پیدا کرتا ہے۔

غلط۔ Model drift وہ مسئلہ ہے جب ماڈل کی تربیت کے بعد کی دنیا بدل جائے لیکن ماڈل پرانے تصورات پر چلتا رہے۔

۲. Anthropic کی تاسیس کی بنیادی وجہ کیا تھی؟

درست! Anthropic کے بانی OpenAI چھوڑ کر اس لیے آئے کیونکہ وہ AI محفوظیت کو پہلی ترجیح دینا چاہتے تھے۔

غلط۔ Anthropic کی بنیادی وجہ AI safety کو ترجیح دینا تھا، نہ مقابلہ یا منافع۔

۳. ایک AI ڈویلپر کی جاری ذمہ داری میں کیا شامل ہے؟

بالکل! ذمہ داری لانچ کے بعد بھی جاری رہتی ہے — چار دائروں میں۔

غلط۔ AI بنانا ایک مسلسل عہد ہے جس میں لانچ کے بعد بھی تمام دائرے فعال رہتے ہیں۔

🧪 لیب · سبق ۸

جاری ذمہ داری کا منصوبہ

اپنے AI نظام کی طویل مدتی ذمہ داری کا منصوبہ تیار کریں

اس لیب میں آپ کیا کریں گے

AI آپ کے ساتھ مل کر ایک فرضی یا حقیقی AI نظام کی جاری ذمہ داری کا خاکہ بنائے گا — چاروں دائروں میں: تکنیکی، صارف، قانونی، اور اخلاقی۔

یہ سوچیں: اگر آپ ایک سال بعد اپنے AI نظام کا جائزہ لیں تو آپ کیا دیکھنا چاہیں گے؟

اپنا AI نظام اور اس کے ممکنہ طویل مدتی خطرات بتائیں
AI آپ سے چاروں دائروں میں سوالات کرے گا
مل کر ایک جاری نگرانی کا منصوبہ بنائیں

🧪 جاری ذمہ داری اسسٹنٹ AI گفتگو

📋 ماڈیول ٹیسٹ · ماڈیول ۱۰

AI کے ساتھ تعمیر

۱۵ سوالات — تمام آٹھ اسباق کا احاطہ

۱. IBM واٹسن فار انکالوجی منصوبے کی بنیادی خامی کیا تھی جس کی وجہ سے وہ ناکام ہوا؟

بالکل! یہ مسئلے کی غلط فریمنگ کی مثال ہے — AI کا استعمال درست تھا لیکن مسئلے کی تعریف غلط۔

غلط۔ اصل مسئلہ مسئلے کی غلط فریمنگ تھی — فرضی ڈیٹا پر تربیت اور طبی حقیقت کو نظرانداز کرنا۔

۲. مسئلہ فریمنگ میں "کیا AI ضروری ہے؟" سوال کیوں پوچھا جاتا ہے؟

درست! "AI پہلے" کا رویہ نہیں ہونا چاہیے — پہلے سادہ حل آزمانا بہتر ہے۔

غلط۔ سوال اس لیے پوچھا جاتا ہے کہ سادہ حل زیادہ موثر ہو سکتے ہیں — ہر مسئلے کے لیے AI ضروری نہیں۔

۳. Chevrolet کے AI بوٹ نے ایک ڈالر میں گاڑی فروخت کرنے پر رضامندی کیوں ظاہر کی؟

بالکل! بغیر حدود کے پرامپٹ صارفین کو نظام کو غلط استعمال کرنے کی اجازت دیتا ہے۔

غلط۔ مسئلہ ڈیٹا نہیں — ناقص پرامپٹ ڈیزائن تھا جس میں کوئی حفاظتی حدود نہیں تھیں۔

۴. ایک موثر سسٹم پرامپٹ کے پانچ اجزاء میں سے کون سا سب سے اہم ہے جب AI عوامی استعمال کے لیے ہو؟

درست! عوامی تعیناتی میں حدود اور فال بیک سب سے اہم ہیں — ان کے بغیر نظام کو غلط استعمال کیا جا سکتا ہے۔

غلط۔ عوامی نظام کے لیے حدود اور فال بیک سب سے اہم ہیں — یہ نقصان سے بچاتے ہیں۔

۵. AI "ہیلوسینیشن" (Hallucination) کا کیا مطلب ہے؟

بالکل! ہیلوسینیشن خطرناک ہے کیونکہ غلط معلومات درست لگتی ہے — جیسے Schwartz کیس میں جھوٹے قانونی حوالہ جات۔

غلط۔ ہیلوسینیشن وہ ہے جب AI اعتماد کے ساتھ جھوٹی لیکن قابل یقین معلومات دے۔

۶. Amazon کے AI بھرتی نظام نے خواتین کے خلاف امتیاز کیوں کیا؟

درست! AI نے ماضی کے متعصبانہ فیصلوں کا پیٹرن سیکھا — اور انسانی نگرانی نہ ہونے کی وجہ سے یہ جاری رہا۔

غلط۔ یہ جان بوجھ کر نہیں تھا — AI نے ماضی کے متعصب ڈیٹا سے پیٹرن سیکھا جو تاریخی امتیاز کی عکاسی کرتا تھا۔

۷. Human-in-the-Loop (HITL) ڈیزائن کب سب سے زیادہ ضروری ہوتا ہے؟

بالکل! اعلی خطرے والے، بڑے اثر والے، یا ناقابل واپسی فیصلوں میں انسانی نگرانی لازمی ہے۔

غلط۔ HITL اعلی خطرے کے فیصلوں کے لیے ہے — کم خطرے کے دہرائے جانے والے کام تو AI خودکار کر سکتا ہے۔

۸. Microsoft Tay کی ناکامی کے بعد AI صنعت نے کیا معیار اپنایا؟

درست! Tay نے پوری صنعت کو یہ سبق دیا کہ adversarial testing ضروری ہے — آج یہ معیاری عمل ہے۔

غلط۔ صنعت نے AI کا استعمال ترک نہیں کیا — بلکہ ریڈ ٹیمنگ کو لازمی معیار بنا لیا۔

۹. TRACE فریم ورک میں "A" کس چیز کا احاطہ کرتا ہے؟

بالکل! Accuracy یعنی تمام مخصوص معلومات کی درستگی جانچنا TRACE کا تیسرا عنصر ہے۔

غلط۔ TRACE میں A کا مطلب Accuracy (درستگی) ہے — اعداد، تاریخیں اور نام چیک کرنا۔

۱۰. "Gender Shades" تحقیق کے نتیجے میں کیا عملی تبدیلی آئی؟

درست! ایک طالبہ کی تحقیق نے تین بڑی کمپنیوں کو اپنے نظاموں میں بہتری پر مجبور کیا — یہ accountability کی طاقت ہے۔

غلط۔ تحقیق کا براہ راست نتیجہ یہ تھا کہ بڑی کمپنیوں نے اپنے چہرہ پہچانی نظاموں کو بہتر بنایا۔

۱۱. "Responsible Scaling Policies" کیا ہیں؟

درست! یہ جاری ذمہ داری کی عملی مثال ہے — کمپنیاں اپنے آپ پر حدود عائد کرتی ہیں۔

غلط۔ Responsible Scaling Policies وہ عہدنامے ہیں جن میں AI کمپنیاں اپنی ماڈل توسیع پر حفاظتی حدود قبول کرتی ہیں۔

۱۲. Facebook کے الگوریتھم کا لیک معاملہ کس اخلاقی اصول کی خلاف ورزی کی مثال ہے؟

بالکل! کمپنی کو نقصانات معلوم تھے — یہ جان بوجھ کر نظرانداز کرنا ذمہ دارانہ تعیناتی کی سنگین خلاف ورزی ہے۔

غلط۔ یہ ڈیٹا چوری نہیں — بلکہ معلوم نقصانات کو engagement کی خاطر نظرانداز کرنا تھا۔

۱۳. پاکستانی AI نظام میں تعصب سے بچنے کے لیے سب سے پہلا عملی قدم کیا ہونا چاہیے؟

درست! مقامی تنوع کو ڈیٹا میں شامل کرنا پاکستانی سیاق میں مساوات کی بنیاد ہے۔

غلط۔ غیر ملکی یا انگریزی-اکثریتی ڈیٹا پاکستانی سیاق میں تعصب کا ذریعہ بنے گا۔

۱۴. Edge Case ٹیسٹنگ اور Adversarial ٹیسٹنگ میں کیا فرق ہے؟

بالکل! Edge Case انتہائی یا غیر معمولی صورتحال ہے؛ Adversarial وہ ہے جہاں کوئی نظام کو نقصاندہ طریقے سے استعمال کرنے کی کوشش کرے۔

غلط۔ یہ دونوں مختلف ہیں: Edge Case انتہائی ان پٹ؛ Adversarial جان بوجھ کر نظام کو توڑنے کی کوشش۔

۱۵. AI بنانے کے اس پورے ماڈیول کا مرکزی پیغام کیا ہے؟

بالکل! یہی اس ماڈیول کا جوہر ہے: تکنیکی مہارت کافی نہیں — ذمہ داری ہر مرحلے پر لازم ہے۔

غلط۔ اس ماڈیول کا مرکزی پیغام یہ ہے کہ AI بنانا صرف تکنیک نہیں بلکہ ایک مسلسل اخلاقی ذمہ داری ہے۔