مسئلہ پہلے متعین کریں
AI نظام بنانے سے پہلے یہ سمجھنا ضروری ہے کہ آپ اصل میں کیا حل کرنا چاہتے ہیں۔
کیا ٹیکنالوجی خود بخود کسی مسئلے کا حل ہو سکتی ہے؟
۲۰۱۸ء میں IBM نے واٹسن فار انکالوجی (Watson for Oncology) نامی AI نظام کو کینسر کے علاج کی سفارشات کے لیے متعدد ہسپتالوں میں نافذ کیا۔ تاہم STAT News کی تحقیقات سے معلوم ہوا کہ یہ نظام بعض اوقات ایسے علاج تجویز کرتا تھا جنہیں طبی ماہرین "غیر محفوظ اور غلط" قرار دیتے تھے۔ جانچ پڑتال سے پتہ چلا کہ نظام کو حقیقی مریضوں کے ڈیٹا پر نہیں بلکہ فرضی کیس سینیریوز پر تربیت دی گئی تھی۔ IBM نے بالآخر ۲۰۲۲ء میں یہ پروگرام بند کر دیا۔ بنیادی خرابی یہ تھی کہ مسئلے کی تعریف غلط تھی — نظام طبی فیصلہ سازی کی پیچیدگی کو سمجھے بغیر بنایا گیا۔
مسئلے کی واضح تعریف کیوں ضروری ہے؟
AI نظام بنانے کی سب سے عام غلطی یہ ہے کہ ٹیکنالوجی سے آغاز کیا جائے — "ہم ایک AI چیٹ بوٹ بنائیں گے" — بجائے اس کے کہ پہلے یہ پوچھا جائے: "اصل مسئلہ کیا ہے اور کیا AI اسے حل کرنے کا بہترین ذریعہ ہے؟"
IBM واٹسن کا معاملہ اس کی واضح مثال ہے۔ انجینئروں نے ایک طاقتور نظام بنایا لیکن انہوں نے طبی حقیقت کو نہیں سمجھا: کینسر کا علاج صرف ڈیٹا کا مسئلہ نہیں، بلکہ اس میں مریض کی ذاتی صورتحال، ڈاکٹر کا تجربہ، اور مقامی صحت نظام شامل ہوتے ہیں۔
مسئلہ فریمنگ کے چار سوال
کسی بھی AI منصوبے کے آغاز میں یہ چار سوال لازمی پوچھنے چاہئیں:
- مسئلہ کیا ہے؟ — اسے ممکنہ حد تک مخصوص الفاظ میں بیان کریں۔ "ہسپتال کی کارکردگی بہتر کرنا" بہت مبہم ہے؛ "داخلے کے وقت انتظار کو ۳۰ منٹ سے کم کرنا" قابل عمل ہے۔
- AI ضروری ہے؟ — کیا یہ مسئلہ ایک سادہ ڈیٹا بیس یا عمل کی بہتری سے حل نہیں ہو سکتا؟ سب سے پہلے سادہ حل آزمائیں۔
- ڈیٹا کہاں سے آئے گا؟ — کیا تربیتی ڈیٹا حقیقی صورتحال کی صحیح عکاسی کرتا ہے؟
- کامیابی کی پیمائش کیسے ہوگی؟ — تکنیکی میٹرکس (جیسے دقت/accuracy) اور حقیقی دنیا کے نتائج (جیسے مریض کی صحت) میں فرق کریں۔
گوگل فلو (Google Flu Trends) نے ۲۰۰۸ء میں انفلوئنزا کے پھیلاؤ کی پیش گوئی کا دعویٰ کیا لیکن ۲۰۱۳ء میں حقیقی اعداد و شمار سے دوگنا زیادہ کیسز ظاہر کیے۔ وجہ: ماڈل سرچ رویے پر منحصر تھا، اصل بیماری پر نہیں — مسئلے کی غلط تعریف کا نتیجہ۔
مسئلہ فریمنگ دستاویز
ایک موثر AI منصوبے کا آغاز ایک مختصر "مسئلہ فریمنگ دستاویز" سے ہوتا ہے جس میں درج ہو:
| عنصر | مثال |
|---|---|
| مسئلہ کا بیان | طلبہ کو ریاضی کے ہوم ورک میں فوری مدد نہیں ملتی |
| متاثرہ افراد | ثانوی سطح کے طلبہ، خاص طور پر دور دراز علاقوں کے |
| موجودہ حل اور ان کی کمی | ٹیوٹر مہنگے ہیں، یوٹیوب ویڈیوز غیر انٹرایکٹو ہیں |
| کیا AI صحیح ابزار ہے؟ | ہاں — قدرتی زبان میں سوالات کا فوری جواب دینا AI کی خاصیت ہے |
| کامیابی کا معیار | ۸۰٪ طلبہ اگلے سوال پر آگے بڑھ سکیں بغیر استاد کی مدد کے |
مسئلہ پہلے متعین کریں
تین سوالات کے جوابات دیں
مسئلہ فریمنگ مشق
AI کے ساتھ مل کر کسی حقیقی مسئلے کی فریمنگ کریں
اس لیب میں آپ کیا کریں گے
AI آپ سے ایک مسئلہ لے گا اور چار سوالوں کے ذریعے اسے واضح کرنے میں مدد کرے گا۔ پاکستان یا آپ کے اردگرد کسی حقیقی مسئلے کا انتخاب کریں جسے آپ AI سے حل کرنا چاہتے ہیں۔
- اپنا مسئلہ AI کو بتائیں
- AI کے سوالات کے جوابات دیں
- آخر میں دیکھیں کہ آپ کا مسئلہ کتنا واضح ہو گیا
ڈیزائن کے طور پر پرامپٹنگ
پرامپٹ (ہدایت نامہ) محض ایک جملہ نہیں — یہ ایک ڈیزائن فیصلہ ہے جو نظام کے رویے کو متعین کرتا ہے۔
کیا ایک پرامپٹ کی چھوٹی تبدیلی AI کے جواب کو مکمل بدل سکتی ہے؟
۲۰۲۳ء میں Chevrolet کی ڈیلرشپ نے اپنی ویب سائٹ پر ایک AI چیٹ بوٹ نصب کیا۔ ایک صارف نے ہوشیاری سے بوٹ کو اس طرح ہدایت دی کہ وہ گاڑی ایک ڈالر میں فروخت کرنے پر "رضامند" ہو گیا۔ وجہ: سسٹم پرامپٹ میں کوئی واضح حدود نہیں تھیں۔ اسی سال ایک اور مشہور واقعہ میں ایئر کینیڈا کے AI بوٹ نے مسافر کو غلط چھوٹ کا وعدہ کیا جسے بعد میں عدالت نے لاگو قرار دیا — کمپنی کو نقصان اٹھانا پڑا۔
پرامپٹ انجینئرنگ بطور ڈیزائن
جب آپ کسی AI نظام کو عوامی استعمال کے لیے تیار کرتے ہیں تو پرامپٹ دراصل ایک "سافٹ وئیر انٹرفیس" کا کام کرتا ہے۔ یہ متعین کرتا ہے کہ AI کیا کرے گا، کیا نہیں کرے گا، کس لہجے میں بات کرے گا، اور کہاں انسان کو بھیجے گا۔
Chevrolet اور Air Canada کے واقعات یہ ثابت کرتے ہیں کہ ناقص پرامپٹ ڈیزائن کے قانونی اور مالی نتائج ہو سکتے ہیں۔ پرامپٹنگ کو ہمیشہ ایک سنجیدہ انجینئرنگ کام سمجھیں۔
موثر سسٹم پرامپٹ کے اجزاء
- کردار (Role): AI کو واضح بتائیں کہ وہ کون ہے — "آپ پاکستان ٹیلی کام کے کسٹمر سروس اسسٹنٹ ہیں"
- دائرہ کار (Scope): کیا کریں اور کیا نہ کریں — "صرف بلنگ اور کنکشن سے متعلق سوالات کے جواب دیں"
- لہجہ (Tone): رسمی یا غیر رسمی، اردو یا انگریزی، مختصر یا تفصیلی
- حدود (Guardrails): "اگر کوئی ذاتی مالی معلومات مانگے تو مت دیں"
- ناکامی کا منصوبہ (Fallback): "اگر آپ نہ جانتے ہوں تو صارف کو 0311-XXXXXX پر بھیجیں"
کمزور پرامپٹ: "تم ہمارے اسٹور کے لیے کام کرتے ہو، مدد کرو۔"
مضبوط پرامپٹ: "آپ لاہور کے فیصل بک ڈپو کے آنلائن اسسٹنٹ ہیں۔ صرف کتابوں کی دستیابی، قیمت اور ڈیلیوری کے بارے میں بتائیں۔ کوئی بھی ادائیگی کا لین دین نہ کریں۔ اگر کوئی بات اس دائرے سے باہر ہو تو کہیں کہ ہمارے اسٹور پر تشریف لائیں۔"
پرامپٹ ورژن کنٹرول
ایک پیشہ ور AI ڈویلپر اپنے پرامپٹس کو کوڈ کی طرح سنبھالتا ہے: ہر تبدیلی کو ریکارڈ کرتا ہے، تبدیلی کی وجہ لکھتا ہے، اور نتائج ناپتا ہے۔ پرامپٹ کو "صرف ٹیکسٹ" نہ سمجھیں — یہ آپ کے AI نظام کی بنیاد ہے۔
ڈیزائن کے طور پر پرامپٹنگ
تین سوالات کے جوابات دیں
پرامپٹ ڈیزائن ورکشاپ
اپنے AI نظام کے لیے ایک موثر سسٹم پرامپٹ تیار کریں
اس لیب میں آپ کیا کریں گے
AI کے ساتھ مل کر ایک مخصوص مقصد کے لیے سسٹم پرامپٹ تیار کریں۔ پانچوں عناصر (کردار، دائرہ کار، لہجہ، حدود، فال بیک) شامل ہوں۔
- AI کو اپنا منتخب کردہ سیاق و سباق بتائیں
- AI آپ سے سوالات پوچھے گا
- مل کر ایک مکمل سسٹم پرامپٹ تیار کریں
AI آؤٹ پٹ کا جائزہ
AI کی پیداوار کو قبول کرنے سے پہلے اسے جانچنا سیکھنا ہر بنانے والے کی ذمہ داری ہے۔
کیا AI کا جواب "درست لگنا" اور "درست ہونا" ایک ہی چیز ہے؟
۲۰۲۳ء میں امریکی وکیل Steven Schwartz نے ChatGPT سے قانونی حوالہ جات مانگے اور انہیں بغیر تصدیق کے عدالت میں پیش کر دیا۔ چھ حوالہ جات مکمل طور پر جھوٹے تھے — ایسے مقدمات جو کبھی ہوئے ہی نہیں تھے۔ جج نے وکیل کو ۵,۰۰۰ ڈالر جرمانہ کیا اور انہیں عدالتی نگرانی میں رکھا۔ AI نے "ہیلوسینیشن" (hallucination — یعنی قابل اعتماد لگنے والی جھوٹی معلومات) پیدا کی تھی، اور وکیل نے اسے چیک نہیں کیا۔
AI آؤٹ پٹ جانچنے کا فریم ورک
Schwartz کا واقعہ AI کی ایک بنیادی حقیقت واضح کرتا ہے: یہ ماڈلز اعتماد کے ساتھ غلط جوابات دے سکتے ہیں۔ لہذا ہر AI نظام کے ساتھ ایک منظم جائزہ عمل (evaluation process) ضروری ہے۔
T — Truth (صداقت): کیا یہ معلومات قابل تصدیق ذرائع سے ثابت ہو سکتی ہے؟
R — Relevance (مطابقت): کیا جواب اصل سوال کا ہے یا ادھر ادھر گیا؟
A — Accuracy (درستگی): اعداد، تاریخیں، نام — یہ سب درست ہیں؟
C — Completeness (مکمل ہونا): کیا کوئی اہم پہلو چھوٹ گیا؟
E — Ethics (اخلاقیات): کیا جواب کسی گروہ کو نقصان پہنچا سکتا ہے؟
تشخیصی میٹرکس کی حدود
ماڈل کی تکنیکی دقت (accuracy) اور حقیقی دنیا میں اس کی افادیت دو مختلف چیزیں ہیں۔ ایک ماڈل ۹۵٪ دقت کے ساتھ اسپام ای میل پکڑ سکتا ہے، لیکن اگر وہ ۵٪ اہم ای میلز کو اسپام سمجھے تو اس کی قیمت بہت زیادہ ہو سکتی ہے۔
اس لیے AI آؤٹ پٹ کا جائزہ لیتے وقت صرف تکنیکی میٹرکس پر نہ رکیں — استعمال کنندگان کے تجربے، غلطیوں کے اثرات، اور مختلف گروہوں پر اثرات کا بھی جائزہ لیں۔
ہیلوسینیشن کا انتظام
AI ہیلوسینیشن سے مکمل بچنا ممکن نہیں، لیکن اس کا انتظام کیا جا سکتا ہے:
- اہم حوالہ جات کے لیے AI سے ماخذ بتانے کی درخواست کریں
- حساس معاملات میں انسانی تصدیق کی تہہ شامل کریں
- AI کو "مجھے نہیں معلوم" کہنے کی اجازت دینے والے پرامپٹس لکھیں
- Retrieval-Augmented Generation (RAG) استعمال کریں جو AI کو قابل اعتماد دستاویزات تک محدود رکھتا ہے
AI آؤٹ پٹ کا جائزہ
تین سوالات کے جوابات دیں
AI آؤٹ پٹ جانچنے کی مشق
TRACE فریم ورک کو عملی طور پر استعمال کریں
اس لیب میں آپ کیا کریں گے
AI آپ کو ایک AI-تیارکردہ متن دے گا اور آپ سے TRACE فریم ورک کے ذریعے اس کا جائزہ لینے کو کہے گا۔ یہ جائزہ عمل سیکھنا AI نظام بنانے والوں کے لیے بنیادی مہارت ہے۔
- موضوع بتائیں
- AI ایک نمونہ متن پیش کرے گا
- TRACE کے ہر نقطے پر اپنا جائزہ شیئر کریں
انسان-AI ورک فلو ڈیزائن
AI کو پورے عمل میں شامل کرنا نہیں، بلکہ اسے صحیح جگہ پر درست کام سونپنا ہے۔
کیا ہر کام AI کو سونپنا دانشمندی ہے؟
۲۰۱۸ء میں Amazon نے اپنا AI بھرتی نظام بند کیا جو خود بخود CVs کا جائزہ لیتا تھا۔ نظام نے خواتین امیدواروں کے خلاف امتیاز کرنا شروع کر دیا — کیونکہ تربیتی ڈیٹا پچھلے دس سالوں کے مرد-اکثریتی بھرتی فیصلوں پر مبنی تھا۔ سب سے اہم بات: اس عمل میں انسانی جانچ کا کوئی مرحلہ شامل نہیں تھا۔ AI نے امیدواروں کو رد کیا اور کسی نے نہیں دیکھا کہ بنیاد کیا تھی۔
ورک فلو میں AI کا مقام
Amazon کی غلطی صرف متعصب ڈیٹا نہیں تھی — غلطی یہ تھی کہ AI کو ایک ایسے عمل میں حتمی فیصلہ ساز بنا دیا گیا جہاں انسانی نگرانی نہیں تھی۔ ایک اچھے ورک فلو ڈیزائن میں AI کا کردار واضح ہوتا ہے اور انسانی مداخلت کے مقامات متعین ہوتے ہیں۔
تین ورک فلو ماڈل
- AI پہلے، انسان تصدیق کرے: AI ابتدائی مسودہ، فہرست یا تجزیہ کرتا ہے اور انسان جانچ کر فیصلہ کرتا ہے۔ طبی تشخیص، قانونی جائزہ۔
- انسان پہلے، AI معاونت کرے: انسان کام کرتا ہے اور AI ریئل ٹائم تجاویز دیتا ہے۔ کوڈ لکھنا، تحریر نویسی۔
- AI مکمل طور پر خودکار: صرف کم خطرے، زیادہ دہرائے جانے والے کام — ای میل فلٹرنگ، اسپام پکڑنا، بل ادائیگی یاد دہانی۔
جتنا زیادہ خطرہ اور جتنی کم دہرائی جانے والی صورتحال، اتنی زیادہ انسانی نگرانی ضروری ہے۔ کسی شخص کے ملازمت یا قرض کے بارے میں فیصلے میں AI کو آخری لفظ نہیں ہونا چاہیے۔
Human-in-the-Loop ڈیزائن
Human-in-the-Loop (HITL) یعنی "انسان درمیان میں" وہ اصول ہے جس میں AI عمل کے اہم نقاط پر انسانی منظوری یا جانچ لازمی ہوتی ہے۔ یہ خاص طور پر ان کاموں کے لیے ضروری ہے جو بڑی تعداد میں لوگوں کو متاثر کریں، قانونی یا اخلاقی نتائج ہوں، یا جہاں AI کی غلطی ناقابل تلافی ہو۔
انسان-AI ورک فلو ڈیزائن
تین سوالات کے جوابات دیں
ورک فلو ڈیزائن مشق
کسی حقیقی کام کے لیے بہترین ورک فلو ماڈل ڈیزائن کریں
اس لیب میں آپ کیا کریں گے
AI آپ کے ساتھ مل کر ایک پاکستانی سیاق و سباق میں AI ورک فلو ڈیزائن کرے گا۔ آپ کو فیصلہ کرنا ہوگا کہ کون سے مراحل AI خودکار کرے اور کہاں انسانی نگرانی ضروری ہے۔
- اپنا منتخب کردہ عمل AI کو بتائیں
- مل کر ہر مرحلے کا جائزہ لیں
- فیصلہ کریں کہ کہاں AI اور کہاں انسان
ٹیسٹنگ اور ریڈ ٹیمنگ
AI نظام کو عوام تک پہنچانے سے پہلے اسے توڑنے کی کوشش کریں — تاکہ حقیقی دنیا میں نہ ٹوٹے۔
آپ AI کو کیسے جانچیں گے جب آپ نہیں جانتے کہ صارفین کیا کریں گے؟
۲۰۱۶ء میں Microsoft نے Twitter پر Tay نامی AI چیٹ بوٹ لانچ کیا۔ ۱۶ گھنٹوں میں Twitter صارفین نے Tay کو نسل پرستانہ اور توہین آمیز بیانات دینے پر آمادہ کر لیا۔ Microsoft نے بوٹ بند کر دیا۔ بعد از تجزیہ: کمپنی نے adversarial testing (یعنی جان بوجھ کر نظام کو غلط استعمال کرنے کی کوشش) نہیں کی تھی۔ Red team (وہ ٹیم جو نظام کی کمزوریاں ڈھونڈتی ہے) کا استعمال نہیں ہوا تھا۔
ریڈ ٹیمنگ کیا ہے؟
ریڈ ٹیمنگ (Red Teaming) وہ عمل ہے جس میں ایک مخصوص ٹیم — بعض اوقات خود ڈویلپرز، بعض اوقات بیرونی ماہرین — جان بوجھ کر AI نظام کو غلط استعمال کرنے، گمراہ کرنے، یا نقصاندہ نتائج پیدا کرنے کی کوشش کرتی ہے۔ مقصد: کمزوریاں عوامی اجرا سے پہلے ڈھونڈنا۔
Microsoft کا Tay واقعہ ریڈ ٹیمنگ کی غیر موجودگی کے نتائج کی واضح مثال ہے۔ آج بڑی AI کمپنیاں — Anthropic، OpenAI، Google — تمام نئے ماڈلز کو لانچ سے پہلے ریڈ ٹیمنگ سے گزارتی ہیں۔
ٹیسٹنگ کی اقسام
- فنکشنل ٹیسٹنگ: کیا AI وہ کام کرتا ہے جو اسے کرنا چاہیے؟ عام سوالات پر درست جواب دینا
- Edge Case ٹیسٹنگ: غیر معمولی یا انتہائی ان پٹ پر کیا ہوتا ہے؟ مثلاً خالی ان پٹ، بہت لمبا ان پٹ، یا جان بوجھ کر غلط ان پٹ
- Adversarial ٹیسٹنگ: کوئی AI کو نقصاندہ کام پر مجبور کرنے کی کوشش کرے تو کیا ہوگا؟
- Regression ٹیسٹنگ: نئی اپ ڈیٹ کے بعد پرانے کام اب بھی ٹھیک ہیں؟
- Equity ٹیسٹنگ: مختلف گروہوں — مردوں، خواتین، بوڑھوں، نوجوانوں — کے لیے نتائج یکساں ہیں؟
"یہ کبھی نہیں ہوگا" — یہ الفاظ AI ڈیزائن میں خطرناک ہیں۔ Tay کے ڈویلپرز نے بھی شاید نہیں سوچا تھا کہ ۱۶ گھنٹوں میں ہوگا جو ہوا۔ ہر وہ صورتحال ٹیسٹ کریں جس کا آپ کو اندازہ نہ ہو۔
ٹیسٹنگ دستاویزات
ہر ٹیسٹنگ رن کی دستاویز بنانا ضروری ہے: کیا ٹیسٹ کیا، کیا نتیجہ آیا، کیا خامی ملی، اور کیا اصلاح کی گئی۔ یہ دستاویزات نہ صرف بہتری میں مدد کرتی ہیں بلکہ بعد میں جوابدہی کے لیے بھی ضروری ہیں۔
ٹیسٹنگ اور ریڈ ٹیمنگ
تین سوالات کے جوابات دیں
ریڈ ٹیمنگ مشق
AI نظام کی کمزوریاں ڈھونڈنا سیکھیں
اس لیب میں آپ کیا کریں گے
AI آپ کے ساتھ ایک فرضی AI نظام پر ریڈ ٹیمنگ مشق کرے گا۔ آپ کا کام ہے کہ اس نظام میں خامیاں ڈھونڈیں — یعنی سوچیں کہ صارفین اسے کیسے غلط استعمال کر سکتے ہیں۔
- اپنا نظام منتخب کریں
- AI آپ کے ساتھ مل کر کمزوریاں ڈھونڈے گا
- ممکنہ اصلاحات تجویز کریں
ذمہ دارانہ تعیناتی
AI بنانا اور AI کو دنیا میں چھوڑنا — یہ دو الگ ذمہ داریاں ہیں۔
کیا AI لانچ کرنے کے بعد ذمہ داری ختم ہو جاتی ہے؟
۲۰۲۱ء میں Facebook کی اندرونی تحقیقات — جو Frances Haugen نے لیک کیں — سے معلوم ہوا کہ کمپنی کا الگوریتھم نوجوان لڑکیوں میں جسمانی تصویر کے حوالے سے ذہنی مسائل بڑھا رہا تھا۔ کمپنی کو یہ بات معلوم تھی لیکن مصروفیت (engagement) کی وجہ سے الگوریتھم نہیں بدلا۔ یہ واقعہ بتاتا ہے کہ تعیناتی کے بعد جاری نگرانی اور خطرات کے ظاہر ہونے پر فوری کارروائی ذمہ دارانہ AI کی شرط ہے۔
تعیناتی سے پہلے کا چیک لسٹ
- دستاویزات: کیا نظام کیسے کام کرتا ہے، کس ڈیٹا پر تربیت ہوئی، اور کیا حدود ہیں — یہ سب لکھا ہوا ہے؟
- رازداری کا جائزہ: کیا نظام کوئی ذاتی معلومات ذخیرہ کرتا ہے؟ کیا قانونی ضروریات پوری ہوتی ہیں؟
- منصفانہ استعمال کی پالیسی: کیا واضح ہے کہ اسے کس لیے استعمال کیا جا سکتا ہے اور کیا نہیں؟
- شکایت کا طریقہ: صارفین غلطی کی اطلاع کیسے دیں گے؟
- بند کرنے کا منصوبہ: اگر نظام نقصاندہ ثابت ہو تو اسے فوری بند کرنے کا طریقہ کیا ہے؟
تعیناتی کے بعد کی نگرانی
Facebook کا معاملہ بتاتا ہے کہ تعیناتی کے بعد کی نگرانی نہ ہونا یا نتائج جان کر نظرانداز کرنا اخلاقی اور قانونی خطرہ ہے۔ ایک ذمہ دار ڈویلپر لانچ کے بعد:
- باقاعدگی سے نظام کی کارکردگی مانیٹر کرتا ہے
- صارفین کی شکایات اور فیڈ بیک کا باقاعدہ جائزہ لیتا ہے
- غیر متوقع نتائج کے لیے خودکار الارم سیٹ کرتا ہے
- مسائل ظاہر ہونے پر فوری مداخلت کرتا ہے
Google اور Hugging Face نے "Model Cards" کا رواج شروع کیا — ہر AI ماڈل کے ساتھ ایک دستاویز جس میں نظام کی صلاحیتیں، حدود، تربیتی ڈیٹا کی تفصیل، اور کون سے استعمالات غیر موزوں ہیں — سب لکھا ہوتا ہے۔ یہ شفافیت ذمہ دارانہ تعیناتی کی بنیاد ہے۔
ذمہ دارانہ تعیناتی
تین سوالات کے جوابات دیں
تعیناتی منصوبہ بندی
ایک AI نظام کی ذمہ دارانہ تعیناتی کا منصوبہ تیار کریں
اس لیب میں آپ کیا کریں گے
AI آپ کے ساتھ مل کر ایک AI نظام کی تعیناتی کا منصوبہ بنائے گا — چیک لسٹ سے لے کر بعد از تعیناتی نگرانی تک۔
- اپنا AI نظام اور اس کا مقصد بتائیں
- AI تعیناتی سے پہلے کے سوالات پوچھے گا
- مل کر نگرانی کا منصوبہ تیار کریں
مساوات کے لیے تعمیر
AI نظام وہی تعصبات جذب کر لیتا ہے جو ڈیٹا میں موجود ہوتے ہیں — جب تک کہ ڈویلپر جان بوجھ کر انہیں دور نہ کرے۔
کیا AI کا تعصب اتفاقی ہوتا ہے یا ڈیزائن کا نتیجہ؟
۲۰۱۵ء میں Joy Buolamwini — MIT کی طالبہ — نے دریافت کیا کہ چہرہ پہچانی (facial recognition) ٹیکنالوجی گوری جلد والے چہروں کو تقریباً ۱٪ غلطی سے پہچانتی تھی لیکن سیاہ فام خواتین کے چہروں پر ۳۵٪ تک غلطی کرتی تھی۔ اس تحقیق کے بعد — جسے "Gender Shades" کہا جاتا ہے — IBM، Microsoft اور Amazon نے اپنے چہرہ پہچانی نظاموں میں بہتری کی۔ وجہ: تربیتی ڈیٹا اکثریتاً گورے مردوں کی تصاویر پر مشتمل تھا۔
تعصب کہاں سے آتا ہے؟
AI کا تعصب (bias) تین جگہوں سے آ سکتا ہے:
- ڈیٹا میں: اگر تربیتی ڈیٹا میں ایک گروہ کم نمائندہ ہو تو نظام اس کے لیے کم موثر ہوگا
- لیبلنگ میں: اگر ڈیٹا پر لیبل لگانے والے انسانوں کے اپنے تعصبات ہوں تو وہ نظام میں منتقل ہوتے ہیں
- ڈیزائن میں: اگر نظام کے مقاصد یا میٹرکس کسی گروہ کی ضروریات نظرانداز کریں
مساوات کے لیے عملی اقدامات
Joy Buolamwini کی تحقیق نے ثابت کیا کہ ایک طالبہ کی محنت بڑی کمپنیوں کو تبدیل کر سکتی ہے۔ لیکن ذمہ داری خود ڈویلپرز پر ہے کہ وہ پہلے سے جائزہ لیں:
- تربیتی ڈیٹا میں متنوع گروہوں کی نمائندگی جانچیں
- مختلف صنف، عمر، نسل، زبان کے صارفین پر نظام کا جائزہ لیں
- ان گروہوں کو ڈیزائن عمل میں شامل کریں جو سب سے زیادہ متاثر ہوں گے
- Fairness metrics (انصاف کی پیمائش) جیسے equalised odds کا استعمال کریں
پاکستان میں AI نظام بناتے وقت یہ سوال ضروری ہے: کیا یہ اردو اور علاقائی زبانوں میں یکساں اچھا کام کرتا ہے؟ کیا دیہی علاقوں کے صارفین کا ڈیٹا شامل ہے؟ کیا خواتین، اقلیتیں، اور معذور افراد کی ضروریات سوچی گئی ہیں؟
مساوات کے لیے تعمیر
تین سوالات کے جوابات دیں
مساوات کا جائزہ
کسی AI نظام میں ممکنہ تعصب کی نشاندہی کریں
اس لیب میں آپ کیا کریں گے
AI آپ سے ایک AI نظام کا انتخاب کروائے گا اور پھر آپ کے ساتھ مل کر اس کے ممکنہ تعصبات کا جائزہ لے گا — خاص طور پر پاکستانی سیاق میں۔
- کوئی AI نظام منتخب کریں جو پاکستان میں استعمال ہو رہا ہو یا ہونا چاہیے
- AI آپ سے مختلف گروہوں کے بارے میں سوالات پوچھے گا
- مل کر ممکنہ تعصبات اور اصلاحات تجویز کریں
جاری ذمہ داریاں
AI بنانا ایک واقعہ نہیں، ایک جاری تعلق ہے — نظام، صارفین، اور دنیا کے ساتھ۔
AI لانچ کے بعد ڈویلپر کی ذمہ داری کب ختم ہوتی ہے؟
۲۰۲۳ء میں OpenAI کے ChatGPT کی وسیع پیمانے پر تعیناتی کے بعد متعدد یونیورسٹیوں نے اس سے متعلق پالیسیاں بنائیں۔ لیکن OpenAI کے اپنے سابق کارکنوں نے — بشمول Ilya Sutskever — کمپنی پر حفاظتی تحقیق کو رفتار کے مقابلے میں پیچھے رکھنے کا الزام لگایا۔ ایک الگ تنظیم — "Anthropic" — بعض OpenAI ملازمین نے "AI safety" (AI کی محفوظیت) کو ترجیح دینے کے لیے قائم کی۔ یہ واقعہ دکھاتا ہے کہ AI تعیناتی کے بعد کی ذمہ داری صرف بگ ٹھیک کرنا نہیں — یہ ایک مسلسل اخلاقی عزم ہے۔
جاری ذمہ داریوں کے چار دائرے
- تکنیکی جائزہ: ماڈل کی کارکردگی وقت کے ساتھ بدلتی ہے — نئے ڈیٹا پر دوبارہ تشخیص ضروری ہے
- صارف کی آواز: فیڈ بیک سسٹم جو صارفین کو مسائل رپورٹ کرنے دے اور ان پر عمل ہو
- قانونی اور ضابطہ کی پابندی: نئے قوانین جیسے EU AI Act کے تحت ذمہ داریاں بدلتی ہیں
- اخلاقی احتساب: کیا نظام کے اثرات آج بھی اس کے اہداف کے مطابق ہیں؟
AI ماڈل کی عمر بڑھنے کا مسئلہ
AI ماڈلز ایک مخصوص وقت تک کے ڈیٹا پر تربیت پاتے ہیں۔ دنیا بدلتی رہتی ہے — نئے واقعات، نئے قوانین، نئے سماجی تناظر۔ ایک ماڈل جو ۲۰۲۲ء میں موزوں تھا، ۲۰۲۵ء میں ناقص یا نقصاندہ ہو سکتا ہے۔ اسے "model drift" یعنی "ماڈل کا بہاؤ" کہتے ہیں۔
Anthropic، OpenAI، اور Google DeepMind تینوں نے "Responsible Scaling Policies" شائع کی ہیں — یعنی یہ وعدہ کہ وہ ماڈل کے نقصاندہ ہونے کی حد پار ہونے پر اسے مزید بڑھانے سے باز رہیں گے۔ یہ جاری ذمہ داری کی مثال ہے۔
ڈویلپر سے زیادہ
OpenAI/Anthropic تنازع یہ بھی بتاتا ہے کہ انفرادی ڈویلپر کے لیے جاری ذمہ داری کا مطلب ہے کہ اگر آپ کی کمپنی غلط راستے پر جائے تو آواز اٹھانا، متبادل تجویز کرنا، یا ضرورت پڑے تو مختلف فیصلہ کرنا بھی آپ کی ذمہ داری ہے۔ AI بنانا صرف تکنیکی کام نہیں — یہ ایک اخلاقی عہد ہے۔
جاری ذمہ داریاں
تین سوالات کے جوابات دیں
جاری ذمہ داری کا منصوبہ
اپنے AI نظام کی طویل مدتی ذمہ داری کا منصوبہ تیار کریں
اس لیب میں آپ کیا کریں گے
AI آپ کے ساتھ مل کر ایک فرضی یا حقیقی AI نظام کی جاری ذمہ داری کا خاکہ بنائے گا — چاروں دائروں میں: تکنیکی، صارف، قانونی، اور اخلاقی۔
- اپنا AI نظام اور اس کے ممکنہ طویل مدتی خطرات بتائیں
- AI آپ سے چاروں دائروں میں سوالات کرے گا
- مل کر ایک جاری نگرانی کا منصوبہ بنائیں
AI کے ساتھ تعمیر
۱۵ سوالات — تمام آٹھ اسباق کا احاطہ