```html Building with AI — Advanced | AESOP AI Academy Module 10
🎯 İleri Düzey · Ders 1

Önce Sorunu Tanımla

Çözüm aramadan önce neyi çözdüğünüzü bilmek, başarılı YZ sistemlerinin temel koşuludur.

Bir YZ sistemi ne zaman yanlış problemi çözer?

2018 yılında Amazon, dahili bir işe alım YZ aracının kadın adayları sistematik olarak dezavantajlı konuma düşürdüğünü tespit etti. Sistem, 2004–2014 yılları arasında şirkete gönderilen özgeçmişler üzerinde eğitilmişti; bu dönemdeki başvuranların büyük çoğunluğu erkekti. Sorun teknik değildi: model tam olarak öğrenmesi gerekeni öğrenmişti. Sorun, problem tanımının kendisindeydi. Ekip "geçmişteki başarılı çalışanlara benzeyen adayları bul" diye sormuştu; ancak geçmişin kendisi zaten eşitsizlik barındırıyordu. Amazon sistemi kullanıma sokmadı, fakat bu karar iki yıllık geliştirme sürecinin ardından geldi.

Problem Tanımı Neden Bu Kadar Önemlidir?

YZ sistemleri, kendilerine sorulan soruyu optimize eder — sormayı istediğiniz soruyu değil. Amazon vakası bu ayrımı açıkça ortaya koyar: ekip teknik açıdan başarılı bir sistem inşa etti, ancak yanlış bir hedefi optimize etti. Problem tanımı yanlış olduğunda, sistem ne kadar iyi çalışırsa o kadar fazla zarar verir.

Bu durum yazılım mühendisliğinde "hedef uyumsuzluğu" (specification misalignment) olarak adlandırılır. Optimizasyon hedefi ile gerçek dünya amacı birbirinden ayrışır. YZ'nin ayırt edici özelliği, bu uyumsuzluğu ölçekte ve hızla çalıştırabilmesidir.

İyi Bir Problem Tanımının Bileşenleri

Etkili YZ tasarımı, sistem mimarisinden önce dört temel soruyu yanıtlamayı gerektirir:

  • Gerçek hedef nedir? — Ölçtüğünüz şey gerçekten önemseyen şeyi yansıtıyor mu? Tıklama oranı kullanıcı memnuniyeti değildir; geçmiş işe alım kararları adil değerlendirme değildir.
  • Kimin için çözüyor? — Sistemin etkileyeceği tüm paydaş gruplarını ve bu grupların birbirinden farklı ihtiyaçlarını listeleyin.
  • Hangi kısıtlamalar geçerli? — Yasal sınırlar, etik çerçeveler, operasyonel limitleri önceden belirleyin.
  • Başarı nasıl ölçülecek? — Hem model performansı hem de gerçek dünya sonuçları için ayrı metrikler tanımlayın.
Temel Kavram

"Proxy metrik" (vekil ölçüt), gerçek hedefin yerine kullanılan ölçülebilir bir göstergedir. Proxy metrikleri genellikle kısayol sunar; ancak optimizasyon baskısı altında gerçek hedeften kopma eğilimi gösterirler. Amazon özgeçmiş sıralama skoru bir proxy metrikti; adayın gerçek potansiyeli değildi.

Problem Tanımını Belgeleme

Büyük teknoloji şirketlerinin YZ projeleri için model kartları ve sistem belgeleri oluşturması giderek yaygınlaşmaktadır. Google, 2018 yılında "Model Cards for Model Reporting" (Model Raporlama için Model Kartları) çerçevesini yayımladı. Bu belgeler; modelin amaçlanan kullanım alanlarını, değerlendirme koşullarını ve bilinen sınırlılıklarını kaydeder.

Belgeleme disiplini, ekipleri problem tanımını açıkça dile getirmeye zorlar. Belirsiz kalan hedefler bu süreçte görünür hale gelir. 2019'da yapılan bir Stanford araştırması, dağıtıma hazır tıbbi YZ modellerinin %92'sinin bu tür belgeleme standartlarını karşılamadığını ortaya koydu; bu durum, klinik ortamlarda ne optimize edildiğinin çoğunlukla bilinmediği anlamına geliyordu.

Ders 1 Sınavı

Önce Sorunu Tanımla

Amazon'un işe alım YZ aracındaki temel sorun neydi?
✓ Doğru. Sistem geçmişteki başarılı çalışanlara benzer adayları bulmaya programlanmıştı; ancak o geçmişin kendisi cinsiyete dayalı önyargı içeriyordu. Teknik açıdan iyi çalışan bir sistem, yanlış bir hedefe yönlendirilmişti.
✗ Yanlış. Amazon'un sistemi teknik açıdan işlevseldi. Asıl sorun, eğitim verisinin yansıttığı eşitsiz geçmişi yeniden üretmesi — yani problem tanımının kendisinin hatalı olmasıydı.
"Proxy metrik" kavramı ne anlama gelir?
✓ Doğru. Proxy metrikler pratik bir çözüm sunar; ancak optimizasyon baskısı altında gerçek hedeften kopabilirler. Örneğin tıklama oranı, gerçek kullanıcı değerinin proxy'sidir.
✗ Yanlış. Proxy metrik, ölçülmesi zor olan gerçek bir hedefin yerine kullanılan ölçülebilir göstergedir. Zaman içinde gerçek hedeften sapma riski taşır.
Model kartları (model cards) hangi amaca hizmet eder?
✓ Doğru. Model kartları, Google'ın 2018'de önerdiği bu çerçeve, ekipleri problem tanımlarını ve kısıtlamaları açıkça ifade etmeye zorlar; böylece belirsiz hedefler görünür hale gelir.
✗ Yanlış. Model kartları, bir modelin ne için tasarlandığını, nasıl test edildiğini ve nerede yetersiz kalabileceğini açıklayan belgeleme araçlarıdır.

Lab 1 — Problem Tanımı Çerçevesi

YZ sistemi tasarımı için problem tanımı geliştirme pratiği.

Pratik Görev

Bu laboratuvarda gerçek bir senaryo üzerinde çalışarak problem tanımı sürecini adım adım uygulayacaksınız. YZ danışmanı rolündeki asistan size yönlendirici sorular soracaktır.

  1. Asistanın açılış sorusunu dikkatlice okuyun.
  2. Bir eğitim kurumunun öğrenci başarı tahmini için YZ sistemi kurmak istediğini varsayın. Bu senaryoyu kullanarak yanıtlarınızı geliştirin.
  3. En az üç mesaj alışverişi gerçekleştirin; gerçek hedef, proxy metrikler ve kısıtlamalar konularını ele alın.
Örnek başlangıç: "Öğrenci başarısını tahmin etmek istiyoruz — başarı ne demektir ve nasıl ölçeriz?"
🤖 Problem Tanımı Danışmanı YZ Lab
🎯 İleri Düzey · Ders 2

Tasarım Olarak Prompt

Bir YZ sistemine ne söylediğiniz, sistemin nasıl davranacağını belirleyen mimari karardır.

Bir prompt'u değiştirmek, bir sistemi yeniden tasarlamak mıdır?

2023 yılında araştırmacılar, farklı dil modellerinin aynı tıbbi soruları farklı şekilde çerçevelendiğinde nasıl yanıt verdiğini inceledi. "Bu hastanın durumu ne?" yerine "Bu hastanın durumunu değerlendirin ve olası riskleri listeleyin" ifadesi kullanıldığında, modellerin klinik açıdan anlamlı ek bilgi ürettiği görüldü. Stanford Tıp Okulu araştırmacıları, prompt yapısının model çıktısının kalitesini kimi zaman %40'a kadar değiştirebildiğini raporladı. Bu bulgu, prompt yazmayı bireysel bir metin yazarlığı becerisi olmaktan çıkarıp mühendislik disiplini olarak konumlandırdı.

Neden Prompt Bir Tasarım Kararıdır?

Geleneksel yazılımda davranış koda yazılır; bir fonksiyonun ne yapacağı açıkça tanımlanır. Büyük dil modellerinde (LLM) davranışın önemli bir kısmı çalışma zamanında, prompt aracılığıyla şekillenir. Bu durum, prompt'u hem bir girdi hem de bir mimarı unsur haline getirir.

Sistem prompt'u (sistem yönergesi) ile kullanıcı prompt'u arasındaki ayrım kritiktir. Sistem prompt'u, modelin ne olduğunu ve neyi yapmaması gerektiğini tanımlar; kullanıcı prompt'u ise belirli bir görevi iletir. Bu iki katmanın her biri farklı tasarım kararları gerektirir.

Etkili Prompt Tasarımı İlkeleri

Araştırmalar ve endüstriyel uygulama birikimi, tutarlı biçimde işe yarayan bazı yapısal ilkeleri ortaya koymuştur:

  • Rol ve bağlam belirtin: Modelin kim olduğunu ve hangi ortamda çalıştığını tanımlayın. "Bir hukuk firmasında çalışan bir asistansın; Türk hukuku hakkında genel bilgi verir, ancak spesifik hukuki tavsiye vermezsin."
  • Çıktı formatını tanımlayın: İstenen yapıyı açıkça belirtin. Madde listesi mi, paragraf mı, JSON formatı mı? Belirsizlik, tutarsız çıktılara yol açar.
  • Kısıtlamaları önceden yazın: Modelin yapmaması gerekenleri, yapması gerekenlerin yanına ekleyin. "Kaynak vermeden iddia öne sürme" gibi negatif kısıtlamalar önemlidir.
  • Örnekler ekleyin (few-shot prompting): İstenen davranışın somut örneklerini sağlamak, açıklamadan çok daha etkilidir.
Dikkat Noktası

Prompt injection (prompt enjeksiyonu) saldırısı, kullanıcıların sistem prompt'unu geçersiz kılmak için crafted girdi kullanmasıdır. 2023'te araştırmacılar, pek çok ticari YZ uygulamasının bu saldırıya karşı savunmasız olduğunu gösterdi. Prompt tasarımı bu güvenlik boyutunu da kapsar.

Prompt Sürüm Kontrolü ve Test

Üretim ortamındaki YZ uygulamalarında prompt'lar zaman içinde değişir. Herhangi bir prompt değişikliği, kod değişikliğiyle eşdeğer sonuçlar doğurabilir. Bu nedenle endüstri pratiği, prompt'ları kod tabanında sürümlü belgeler olarak yönetmeye yönelmektedir.

Anthropic, OpenAI ve Google'ın yayımladığı geliştirici kılavuzlarının tamamı, üretim prompt'larının değişiklikler arasında sistemli biçimde test edilmesini önermektedir. Bir prompt'u değiştirmek, tüm değerlendirme setini yeniden çalıştırmayı gerektirir — tıpkı bir kütüphane güncellemesinin regresyon testini tetiklemesi gibi.

Ders 2 Sınavı

Tasarım Olarak Prompt

Stanford araştırmacılarının tıbbi prompt çalışmasında hangi bulguya ulaşıldı?
✓ Doğru. Araştırma, soruyu nasıl çerçevelediğinizin — yalnızca ne sorduğunuzun değil — çıktının klinik yararlılığını belirgin biçimde etkilediğini gösterdi.
✗ Yanlış. Stanford araştırmacıları, aynı modelin aynı konuda prompt yapısına göre çok farklı kalitede yanıtlar ürettiğini buldu; bu fark %40'a kadar ulaşabiliyordu.
"Few-shot prompting" (az örnekli yönlendirme) nedir?
✓ Doğru. Few-shot prompting, modele soyut talimat vermek yerine istenen giriş-çıkış çiftlerini örnek olarak gösterir. Genellikle saf talimatlamadan daha etkilidir.
✗ Yanlış. Few-shot prompting, modeli yeniden eğitmez; bunun yerine prompt içine birkaç örnek (few shots) yerleştirerek modelin istenen davranışı öğrenmesini sağlar.
"Prompt injection" (prompt enjeksiyonu) saldırısı nedir?
✓ Doğru. Prompt injection, kötü niyetli kullanıcıların sistem prompt'unda tanımlanan kuralları geçersiz kılmak için hazırlanmış girdiler kullanmasıdır. 2023'te pek çok ticari uygulama bu saldırıya karşı savunmasız bulundu.
✗ Yanlış. Prompt injection, sistem prompt güvenlik kısıtlamalarını aşmak için tasarlanmış kullanıcı girdileri içeren bir güvenlik açığıdır.

Lab 2 — Prompt Tasarım Atölyesi

Sistem ve kullanıcı prompt'larını tasarlarken tasarım kararlarını analiz etme.

Pratik Görev

Bu laboratuvarda bir müşteri destek YZ asistanı için sistem prompt'u tasarlayacaksınız. Asistan sizden senaryo hakkında sorular soracak ve tasarım kararlarınızı birlikte değerlendireceksiniz.

  1. Bir e-ticaret şirketi için müşteri destek YZ asistanı kurduğunuzu varsayın.
  2. Asistanın açılış sorusuna yanıt verin; rol, kısıtlamalar ve format tercihlerinizi paylaşın.
  3. Prompt injection riskini ve birden fazla dil desteğini de tartışmaya dahil edin.
Örnek başlangıç: "Sistem prompt'a rol tanımını nasıl yazmalıyım? İade politikası sorularına odaklanacak bir asistan için başlayalım."
🤖 Prompt Tasarım Danışmanı YZ Lab
🎯 İleri Düzey · Ders 3

YZ Çıktısını Değerlendirme

Bir YZ sisteminin iyi çalışıp çalışmadığını anlamak, sistemi inşa etmek kadar kritiktir.

Bir YZ çıktısının "doğru" olduğunu nasıl bilebiliriz?

2023 yılında New York'lu avukatlar Steven Schwartz ve Peter LoDuca, bir dava dilekçesinde ChatGPT'nin ürettiği yasal emsal kararlarını kaynak olarak sundu. Söz konusu kararların hiçbiri gerçekte mevcut değildi — model, gerçekmiş gibi görünen ama var olmayan içtihatlar üretti. Federal Yargıç P. Kevin Castel, avukatlara 5.000 dolar para cezası kesti. Avukatlar daha sonra çıktıları bağımsız bir hukuk veri tabanında doğrulamadıklarını itiraf etti. Hata, modelde değil değerlendirme sürecinin yokluğundaydı.

Değerlendirmenin Boyutları

YZ çıktısını değerlendirmek çok boyutludur. Avukat davası olgusal doğruluk sorununu gösterir; ancak değerlendirme yalnızca "bu doğru mu?" sorusunu kapsamaz. İyi bir değerlendirme çerçevesi dört soruyu birlikte sorar:

  • Olgusal doğruluk: İddialar bağımsız kaynaklarla doğrulanabilir mi? Hallüsinasyon (uydurma) var mı?
  • Görev uygunluğu: Çıktı, belirlenen problemi gerçekten çözüyor mu? Teknik olarak doğru ama pratik açıdan işe yaramaz bir yanıt, değersizdir.
  • Zararlılık kontrolü: Çıktı, kullanıcıya veya üçüncü taraflara zarar verebilecek içerik barındırıyor mu?
  • Tutarlılık: Benzer sorgular benzer ve tahmin edilebilir yanıtlar üretiyor mu?
Temel Kavram

"Hallüsinasyon" (halüsinasyon), dil modellerinin gerçek olmayan bilgileri güvenle sunmasıdır. Bu terim teknik bir arızayı değil, sistemin nasıl çalıştığını yansıtır: modeller olasılıksal sözdizim üretir, olgusal veritabanı sorgulamaz.

Değerlendirme Yöntemleri

Endüstri pratiğinde üç temel değerlendirme yöntemi kullanılır: otomatik metrikler, insan değerlendirmesi ve kıyaslama setleri (benchmark). Her birinin güçlü ve zayıf yanları vardır.

Otomatik metrikler (BLEU, ROUGE, doğruluk skoru) ölçeklenebilir ama kaba sonuçlar üretir. İnsan değerlendirmesi nüans yakalamada üstündür, ancak pahalı ve yavaştır. Kıyaslama setleri (MMLU, HellaSwag gibi standart test koleksiyonları) karşılaştırmalı analiz sağlar; ancak kıyaslamanın kendisi zamanla aşınır — modeller benchmark'ları "ezberleyebilir".

Meta'nın 2023 tarihli LLM değerlendirme raporu, hiçbir tek metriğin yeterli olmadığını; çoklu yöntemlerin birleştirilmesinin endüstri standardı haline gelmesi gerektiğini vurguladı.

İnsan Gözetimini Sistemleştirme

Avukat vakasının dersi açıktır: doğrulama sorumluluğunu bireysel dikkata bırakmak yeterli değildir. Yüksek riskli YZ uygulamaları için doğrulama adımları iş akışına inşa edilmelidir — isteğe bağlı değil, zorunlu adım olarak.

Tıbbi YZ girişimi Babylon Health, 2022'de dağıtım sonrası izleme mekanizmasının yetersizliği nedeniyle eleştiri aldı. Klinisyenlerin sistemi doğrulama yerine onaylama aracı olarak kullandığı görüldü; bu durum otomasyon önyargısı (automation bias) sorununu gündeme taşıdı.

Ders 3 Sınavı

YZ Çıktısını Değerlendirme

New York avukatları davasında temel hata neydi?
✓ Doğru. Avukatlar, modelin ürettiği emsal kararları resmi hukuk veri tabanlarında doğrulamadı. Hata modelde değil, değerlendirme sürecinin yokluğundaydı.
✗ Yanlış. Asıl sorun, YZ çıktısının bağımsız doğrulama yapılmadan mahkemeye sunulmasıydı. Model, güvenle var olmayan kararlar üretti ve avukatlar bunları kontrol etmedi.
"Otomasyon önyargısı" (automation bias) ne anlama gelir?
✓ Doğru. Otomasyon önyargısı, insanların sistemin hatalı olduğuna dair kanıt bulunsa bile otomatik öneriye güvenme eğilimidir. Babylon Health vakasında klinisyenler doğrulama yerine onaylama yaptı.
✗ Yanlış. Otomasyon önyargısı, kullanıcıların otomatik sistem çıktılarını — hatalı olabileceklerini bile bile — sorgusuz sualsiz kabul etme eğilimidir.
Kıyaslama setleri (benchmark) neden zamanla yetersiz kalabilir?
✓ Doğru. Modeller eğitim verisi içinde benchmark sorularına benzer örnekler gördüğünde, gerçek anlama kapasitesini değil kalıpları öğrenebilir. Bu "benchmark sızması" (data contamination) sorunu olarak bilinir.
✗ Yanlış. Kıyaslama setlerinin aşınması, modellerin benchmark sorularını ezberleme riskinden kaynaklanır — dil veya boyut sınırlamasından değil.

Lab 3 — Çıktı Değerlendirme Çerçevesi

Gerçek bir YZ çıktısını dört boyutlu değerlendirme kriterlerine göre analiz etme.

Pratik Görev

Bu laboratuvarda bir müşteri destek botunun ürettiği varsayımsal yanıtı değerlendireceksiniz. Asistan sizi değerlendirme süreci boyunca yönlendirecektir.

  1. Asistanın başlangıç sorusunu okuyun ve örnek bir YZ çıktısı için değerlendirme rubriği geliştirin.
  2. Olgusal doğruluk, görev uygunluğu, zararlılık ve tutarlılık boyutlarının her birini ele alın.
  3. Hangi boyutun sizin senaryonuzda en kritik olduğunu ve neden gerekçelendirin.
Örnek başlangıç: "Bir finans uygulamasının YZ asistanı yatırım önerileri sunuyor — bunu nasıl değerlendiririm?"
🤖 Değerlendirme Metodolojisi Danışmanı YZ Lab
🎯 İleri Düzey · Ders 4

İnsan-YZ İş Akışı Tasarımı

YZ'nin nerede devreye girdiği ve insanın nerede kontrol aldığı, sistemin güvenilirliğini belirler.

İş akışında YZ'ye ne kadar karar verme yetkisi verilmeli?

Uber'in 2018 Tempe kazasında otonom aracı, yolda yürüyen Elaine Herzberg'i tespit etti ancak kaza önleme sistemi devre dışı bırakılmıştı. Güvenlik sürücüsü o an ekrana bakıyordu. Soruşturma raporları, sistemin insan devreye girmesi için tasarlandığını ortaya koydu; ne var ki iş akışı tasarımı güvenlik sürücüsünün dikkatini sürdürmesini fiilen sağlayacak mekanizmaları içermiyordu. Bu, insan gözetimi gerektiren ancak insanı etkili biçimde dışlayan bir iş akışının trajik sonucuydu.

Gözetim Mimarisi: HITL ve HOTL

İnsan-YZ iş akışları iki temel yapısal modelle tanımlanır. "Human-in-the-loop" (HITL — döngüde insan): her karar veya her belirli sayıda karar için insan onayı gerekir. "Human-on-the-loop" (HOTL — döngü üzerinde insan): sistem otonom çalışır, insan sonuçları izler ve müdahale edebilir.

Bu seçim, yalnızca bir verimlilik tercihi değildir. Gözetim modelinin yanlış seçilmesi — Uber vakasında olduğu gibi — sistematik güvenlik açıkları yaratır. Hangi kararların yüksek riskli olduğu, hata maliyetinin ne kadar geri döndürülemez olduğu ve müdahale için ne kadar zaman olduğu bu seçimi belirler.

Görev Ayrımını Doğru Belirleme

Etkili insan-YZ iş akışı tasarımı, hangi görevlerin YZ'ye, hangilerinin insana ve hangilerinin ikisinin kombinasyonuna atandığını netleştirir. Bu ayrım şu ölçütlere dayanır:

  • Hata geri döndürülebilirliği: Yanlış bir YZ kararının sonuçları ne kadar kolay düzeltilebilir? Geri dönüşü olmayan kararlar için insan onayı şarttır.
  • Karar hızı: İnsan müdahalesi için gerçekçi zaman var mı? Milisaniyeler içinde karar gereken sistemlerde HITL pratikte uygulanamaz.
  • Bağlam zenginliği: YZ'nin erişemediği sosyal, duygusal veya etik bağlam gerektiren kararlar insana bırakılmalıdır.
  • Hesap verebilirlik: Kararın hukuki veya etik sorumluluğunu kimin üstlendiği, gözetim modelini doğrudan şekillendirir.
Endüstri Örneği

Gmail'in "Akıllı Yanıt" özelliği, öneriler sunar ancak göndermez. Bu HITL tasarımının bilinçli bir tercihidir: YZ verimliliği artırır, insan son kararı verir. Buna karşın otomatik randevu onaylama gibi özellikler HOTL mimarisini benimser — iptali mümkün olduğu için.

Dikkat Sürdürme Sorunu

Uber vakasının kritik bir dersi daha vardır: iş akışı tasarımı gözetim gerektiriyorsa, bu gözetimi güvenilir biçimde sürdürecek koşullar da tasarlanmalıdır. İnsanlar tekrarlayan, düşük uyarıcılı ortamlarda zamanla dikkatlerini kaybeder. Bu "dikkat yorgunluğu" (vigilance decrement) psikoloji literatüründe iyi belgelenmiştir.

Boeing 737 MAX otomasyonuyla ilgili araştırmalar da benzer bir sorunu ortaya koydu: pilotlara sistemi nadiren devre dışı bırakmaları gerektiği söylendi, ancak gerçekten gerektiğinde manuel müdahale yeteneği körelmişti. Sürdürülebilir bir gözetim mimarisi inşa etmek, yalnızca bir onay butonu eklemekten çok daha fazlasını gerektirir.

Ders 4 Sınavı

İnsan-YZ İş Akışı Tasarımı

Uber Tempe kazasında iş akışı tasarımındaki temel sorun neydi?
✓ Doğru. Sistem, güvenlik sürücüsünün her zaman hazır olduğunu varsayan bir HITL modeli uyguluyordu; ancak iş akışı güvenlik sürücüsünün dikkatini sürdürecek mekanizmaları içermiyordu.
✗ Yanlış. Araçta bir güvenlik sürücüsü bulunuyordu, dolayısıyla tamamen otonom değildi. Asıl sorun, "döngüde insan" tasarımının insanın dikkatini gerçekten sürdürmesini sağlamamasıydı.
"Human-on-the-loop" (HOTL) mimarisi ne anlama gelir?
✓ Doğru. HOTL'de insan müdahil olmak için "döngünün üzerinde" bekler; sistem kararları otomatik alır. Gmail'in otomatik randevu onayı bu modeli kullanır çünkü kararlar geri döndürülebilirdir.
✗ Yanlış. HOTL, insanın her kararı onaylamadığı, ancak sistemi izleyip müdahale edebildiği bir yapıdır. Tam otomasyon ile döngüde insan (HITL) arasında orta bir noktadır.
Hangi ölçüt, bir kararın HITL yerine otomatik olarak alınmasını destekler?
✓ Doğru. İnsan müdahalesi için gerçekçi zaman yoksa HITL uygulanamaz. Güvenlik sistemleri veya gerçek zamanlı fiyatlandırma gibi milisaniye düzeyinde kararlar bu kategoriye girer.
✗ Yanlış. Yüksek hukuki sorumluluk, geri döndürülemez hata riski ve güçlü etik boyut — bunların hepsi HITL'i destekler. Otomasyonu destekleyen ölçüt, gerçek zamanlı karar gerekliliğidir.

Lab 4 — İş Akışı Tasarımı Atölyesi

Belirli bir senaryo için HITL/HOTL kararını ve gözetim mekanizmalarını tasarlama.

Pratik Görev

Bir hastane, hastaların test sonuçlarını yorumlayan ve doktora öneri sunan bir YZ sistemi kurmak istiyor. Bu sistem için iş akışı mimarisini tasarlayacaksınız.

  1. Asistanın açılış sorusunu yanıtlayarak hangi kararların otomatik, hangilerinin insan onaylı olması gerektiğini belirleyin.
  2. Dikkat yorgunluğunu nasıl azaltacağınızı ve gözetim sürdürülebilirliğini nasıl sağlayacağınızı tartışın.
  3. Tasarımınızın zayıf noktalarını ve bu zayıflıkları gidermek için ne yapabileceğinizi belirleyin.
Örnek başlangıç: "Hangi tıbbi kararlar hiçbir zaman otomasyona bırakılmamalı ve bu sınırı nasıl çizebiliriz?"
🤖 İş Akışı Tasarımı Danışmanı YZ Lab
🎯 İleri Düzey · Ders 5

Test ve Kırmızı Takım

Sistemi bulmadan önce başkası buluyor — kasıtlı kırılma testleri bu riski minimize eder.

Bir YZ sistemi güvenli olduğunu nasıl kanıtlar?

2022 yılında Meta, LLaMA modelinin öncülü olan bir dil modelini araştırmacılarla paylaştı. Kısa süre içinde bağımsız araştırmacılar, modelin zararlı içerik üretmesi için oldukça basit yöntemler yeterli olduğunu keşfetti. Meta, dağıtımdan önce yeterli kırmızı takım (red team) testi yapılmadığını kabul etti. Bu durum, "güvenli olmadığını bilmeden dağıtma" ile "test edilmiş ancak sorunlar kabul edilen dağıtım" arasındaki farkın ne kadar önemli olduğunu somutlaştırdı.

Kırmızı Takım Testi Nedir?

Kırmızı takım (red teaming), orijinal olarak askeri stratejiden ödünç alınan bir kavramdır: bağımsız bir grup, rakip bakış açısından sistemi bozmaya çalışır. YZ bağlamında bu, bir sistemin güvenlik kısıtlamalarını atlatmayı, yanlış yönlendirici çıktılar üretmeyi veya beklenmedik biçimde davranmayı sistematik olarak denemek anlamına gelir.

OpenAI, GPT-4'ün dağıtımından önce 50'den fazla alanda uzman dış araştırmacıyı kırmızı takım testi için görevlendirdi. Bu araştırmacılar biyolojik silah üretimi bilgisi, seçim manipülasyonu ve kimlik doğrulama atlatma gibi belirli risk kategorilerini sistematik biçimde test etti. Bu yaklaşım endüstri standardı haline gelmektedir.

Test Kategorileri

Kapsamlı bir YZ test programı birden fazla katmanı kapsar:

  • Birim testi: Belirli girdilere verilen yanıtları izole biçimde test etme. "Bu prompt güvenli bir yanıt üretiyor mu?"
  • Entegrasyon testi: YZ bileşeninin daha geniş sistemle etkileşimini test etme. Veri tabanı yanıtları, API çağrıları ve kullanıcı arayüzü entegrasyonu.
  • Adversarial test (karşıt test): Sistemi bozmaya yönelik kasıtlı girdi tasarlama. Kırmızı takım bu kategoriye girer.
  • Dağıtım kayması (distribution shift) testi: Eğitim verisinden farklı gerçek dünya girdilerine karşı performansı ölçme.
Temel Kavram

"Jailbreaking" (kilit kırma), kullanıcıların bir YZ modelinin güvenlik kısıtlamalarını atlatmak için özel yöntemler kullanmasıdır. Bu daha geniş adversarial test kategorisinin bir alt kümesidir ve kırmızı takım sürecinde sistematik olarak araştırılması gereken bir alandır.

Test Sonuçlarıyla Ne Yapılır?

Test, sorunları bulmakla bitmez. Bulunan sorunların nasıl ele alındığı, organizasyonun güvenlik kültürü hakkında çok şey söyler. Anthropic'in 2023 yılında yayımladığı güvenlik politikası şunu belirtir: "Tespit ettiğimiz her güvenlik açığını kapatamıyoruz; ancak bunların hepsini belgeliyoruz ve hangi riskleri kabul ettiğimizi açıkça ifade ediyoruz."

Bu yaklaşım — sıfır risk iddiasında bulunmak yerine belgelenmiş risk kabulü — etik YZ dağıtımının işareti olarak giderek kabul görmektedir. Sıfır güvenlik açığını iddia eden sistemler, büyük olasılıkla yeterli test yapılmadığının göstergesidir.

Ders 5 Sınavı

Test ve Kırmızı Takım

GPT-4'ün dağıtım öncesinde OpenAI kırmızı takım testinde ne yapıldı?
✓ Doğru. OpenAI, GPT-4 için farklı uzmanlık alanlarından dış araştırmacıları sistematik risk kategorilerini test etmek üzere görevlendirdi. Bu yaklaşım endüstri standardı olma yolunda ilerlemektedir.
✗ Yanlış. OpenAI, GPT-4 için biyolojik silah, seçim manipülasyonu ve kimlik doğrulama atlatma gibi belirli risk alanlarına odaklanan dış uzman araştırmacılardan oluşan bir kırmızı takım kurdu.
"Dağıtım kayması" (distribution shift) testi ne ölçer?
✓ Doğru. Bir model, eğitim verisine iyi uyum sağlamış olsa da gerçek dünyada farklı dağılımlarla karşılaşabilir. Bu kayma performansı dramatik biçimde düşürebilir ve dağıtım öncesinde test edilmesi gerekir.
✗ Yanlış. Dağıtım kayması testi, modelin eğitildiği verilerden farklı olan gerçek dünya girdilerine nasıl tepki verdiğini ölçer — hız veya kapasite testi değildir.
Anthropic'in güvenlik açıklarına yaklaşımı nasıl tanımlanabilir?
✓ Doğru. Anthropic'in 2023 güvenlik politikası, her açığın kapatılamayacağını kabul eder; ancak tümünün belgelenmesi ve kabul edilen risklerin şeffaf biçimde ifade edilmesi gerektiğini vurgular.
✗ Yanlış. Anthropic'in yaklaşımı, sıfır risk iddiasında bulunmak yerine güvenlik açıklarını belgeleme ve kabul edilen riskleri şeffaf biçimde açıklama üzerine kuruludur.

Lab 5 — Kırmızı Takım Senaryosu

Bir YZ sistemi için adversarial test planı geliştirme ve risk kategorilerini belirleme.

Pratik Görev

Bir eğitim kurumu için öğrenci ödev geri bildirimi sağlayan bir YZ sistemi tasarlandığını varsayın. Bu sistem için kırmızı takım test planı oluşturacaksınız.

  1. Asistanın sorusunu yanıtlayarak bu sistemin hangi yollarla kötüye kullanılabileceğini düşünün.
  2. En az üç farklı risk kategorisi belirleyin ve her biri için somut test senaryosu önerin.
  3. Hangi bulguların dağıtımı durdurması, hangilerinin kabul edilebilir risk olarak belgelenmesi gerektiğini tartışın.
Örnek başlangıç: "Öğrenciler bu sistemi ödev yazmak için nasıl kötüye kullanabilir ve bunu test etmek için ne yapabiliriz?"
🤖 Kırmızı Takım Danışmanı YZ Lab
🎯 İleri Düzey · Ders 6

Sorumlu Dağıtım

Bir sistemi dağıtmak, onu oluşturmanın bir parçasıdır — dağıtım kararları etik kararlardır.

Dağıtım kararı ne zaman etik bir karar haline gelir?

2021 yılında Facebook'un (Meta) kendi iç araştırmacıları, Instagram'ın algoritmasının belirli genç kadın kullanıcılarda beden imajı sorunlarını kötüleştirdiğini gösterdi. Bu bulgular dağıtım kararını etkilemedi; sistem değiştirilmeden çalışmaya devam etti. 2021'deki Frances Haugen ifşaatları bu araştırmaları kamuoyuyla paylaştı. Şirket, zararlı etkiyi bilerek sistemi dağıtmaya devam etmekle suçlandı. Bu vaka, dağıtım kararının teknik bir onay değil, etik bir tercih olduğunu sert biçimde ortaya koydu.

Dağıtım Kararında Ne Sorulmalı?

Bir YZ sistemini canlıya almak, önceki tüm tasarım, test ve değerlendirme kararlarını gerçek dünyaya taşır. Dağıtım noktasında üç soru yanıtsız kalmamalıdır:

  • Kimi etkileyecek? — Kullanıcılar, etkilenenler ve dışlananlar kim? Instagram vakasında etkilenen grup, araştırmacıların önceden tespit ettiği savunmasız bir kullanıcı kitlesiydi.
  • Bilinen zararlar belgelendi mi? — Kırmızı takım ve değerlendirme sürecinde bulunan tüm riskler kayıt altına alınıp dağıtım kararına dahil edildi mi?
  • Geri dönüş planı var mı? — Sistem dağıtımdan sonra beklenmedik zarar üretirse geri alma veya hızlı müdahale mekanizması mevcut mu?
Endüstri Pratiği

Microsoft'un 2023 Responsible AI Impact Assessment (Sorumlu YZ Etki Değerlendirmesi) çerçevesi, dağıtım öncesinde belgelenmiş bir etki değerlendirmesi yapılmasını zorunlu kılar. Bu belge, potansiyel zararları, azaltma stratejilerini ve dağıtımı gerekçelendiren fayda analizini içerir.

Kademeli Dağıtım

Tam ölçekli anlık dağıtım yerine kademeli dağıtım (staged rollout veya phased deployment), beklenmedik sorunları sınırlı ölçekte tespit etmenin endüstri standardı yöntemidir. Google, Amazon ve Microsoft'un üretim YZ sistemleri genellikle şu aşamaları izler: %1 kullanıcı, %5, %20, %100.

Her aşama, önceki aşamada gözlemlenen metriklere bağlı bir ilerleme kriteriyle başlar. Metriklerin sınırın dışına çıkması otomatik olarak dağıtımı durdurabilir. Bu "özellik bayrağı" (feature flag) yaklaşımı, dağıtımı teknik bir açma düğmesi olmaktan çıkarıp gözlemlenebilir bir süreç haline getirir.

Şeffaflık ve Bildirim

Sorumlu dağıtım, kullanıcılara neyin dağıtıldığını bildirmeyi de kapsar. AB Yapay Zeka Yasası (2024) ve ABD'deki sektörel yönergeler, belirli yüksek riskli YZ sistemleri için kullanıcı bildirimini yasal olarak zorunlu kılmaktadır. Bu yalnızca bir uyum gerekliliği değil, kullanıcının neyle etkileşim kurduğunu anlamasını sağlayan temel bir bilgi hakkıdır.

Ders 6 Sınavı

Sorumlu Dağıtım

Frances Haugen ifşaatlarının ortaya koyduğu temel etik sorun neydi?
✓ Doğru. Haugen'ın paylaştığı belgeler, Meta'nın kendi iç araştırmacılarının algoritmik zararı tespit ettiğini ancak bu bulguların dağıtım kararını etkilemediğini gösterdi. Bilinen zararın üstü kapatıldı.
✗ Yanlış. Asıl sorun teknik bir arıza veya veri satışı değildi. Meta'nın kendi araştırmacılarının bulduğu zararı bilerek görmezden gelmesiydi — bu bir etik dağıtım kararı sorunudur.
Kademeli dağıtımın (staged rollout) temel avantajı nedir?
✓ Doğru. Kademeli dağıtım, yüksek riskli sorunların küçük bir kullanıcı grubunda görünür hale gelmesini ve tam ölçege geçmeden önce müdahale edilmesini sağlar.
✗ Yanlış. Kademeli dağıtım (%1, %5, %20, %100 gibi aşamalar) ölçeği kısıtlayarak sorunları erken tespit etmek içindir — hız veya maliyet optimizasyonu için değil.
AB Yapay Zeka Yasası dağıtım konusunda ne öngörüyor?
✓ Doğru. 2024 tarihli AB Yapay Zeka Yasası, belirli yüksek riskli uygulamalar için kullanıcıların bir YZ sistemiyle etkileşim kurduklarından haberdar edilmesini yasal bir yükümlülük olarak tanımladı.
✗ Yanlış. AB Yapay Zeka Yasası açık kaynak zorunluluğu getirmiyor. Yüksek riskli sistemler için kullanıcı bildirimini ve şeffaflık yükümlülüklerini yasal standart olarak tanımlıyor.

Lab 6 — Dağıtım Karar Çerçevesi

Gerçek bir senaryo için etik dağıtım kararını yapılandırma.

Pratik Görev

Bir fintech startup'ı, küçük esnaf kredisi başvurularını değerlendiren bir YZ sistemi geliştirdi. Sistemi dağıtmadan önce etik bir değerlendirme çerçevesi oluşturmanız gerekiyor.

  1. Asistanın açılış sorusunu yanıtlayarak bu sistemin dağıtılması için hangi koşulların karşılanması gerektiğini belirleyin.
  2. Bilinen risklerin nasıl belgeleneceğini ve kimin bu belgelere erişeceğini tartışın.
  3. Geri dönüş planınızı ve hangi olayların dağıtımın durdurulmasını gerektireceğini tanımlayın.
Örnek başlangıç: "Kredi kararı veren bir YZ sistemini dağıtmadan önce hangi etik kontrol noktaları zorunlu olmalı?"
🤖 Sorumlu Dağıtım Danışmanı YZ Lab
🎯 İleri Düzey · Ders 7

Eşitlik için İnşa

YZ sistemleri mevcut eşitsizlikleri yansıtır, pekiştirir veya azaltır — bu seçim tasarım aşamasında yapılır.

Bir YZ sistemi herkese eşit davranıyor olabilir ama eşitsizliği yeniden üretiyor olabilir mi?

ABD'nin pek çok eyaletinde kullanılan COMPAS sistemi, sanıkların yeniden suç işleme riskini tahmin ediyor ve hâkim kararlarına girdi sağlıyordu. 2016'da ProPublica'nın araştırması, sistemin Siyah sanıkları yeniden suç işleme konusunda yaklaşık iki kat daha yüksek olasılıkla hatalı biçimde işaretlediğini ortaya koydu. Northpointe (sistemin geliştiricisi) ise sistemin ırk grupları arasında kalibre edilmiş doğrulukta eşdeğer olduğunu savundu. Her iki iddia da matematiksel açıdan doğruydu. Bu, adalette iki farklı eşitlik tanımının aynı anda sağlanamayacağını gösteren gerçek bir vakadır.

Eşitlik Tanımları Çatışabilir

COMPAS vakası "eşitlik paradoksu"nu somutlaştırır: istatistiksel olarak tanımlanmış eşitlik ölçütlerinin tamamını aynı anda sağlamak matematiksel olarak imkânsızdır; bu durum 2016'da Chouldechova tarafından biçimsel olarak kanıtlanmıştır.

Yaygın kullanılan birkaç eşitlik tanımı şunlardır: demografik parite (gruplar eşit oranda seçilir), eşit fırsat (eşit gerçek pozitif oranı), ve kalibrasyonlu eşitlik (güven skorları tüm gruplarda eşit ön tahmin gücü taşır). Bunlar birbirini dışlayan tanımlardır — birini optimize etmek diğerini bozar.

Temel Kavram

Eşitlik ölçütü seçimi teknik değil, etik ve siyasi bir karardır. Hangi eşitlik tanımını benimsediniz sorusu, kimin ne tür hatalarına daha az tolerans göstermeye hazır olduğunuzu sormaktır. Bu seçimi şeffaf biçimde kayıt altına almak sorumlu tasarımın zorunlu parçasıdır.

Tasarım Sürecine Eşitliği Entegre Etme

Eşitliği sonradan "yama" olarak eklemek çalışmaz. Problem tanımı aşamasından başlayan sistematik bir yaklaşım gerekir:

  • Paydaş analizi: Sistemden etkilenecek tüm grupları, özellikle tarihsel olarak dezavantajlı konumdakileri, tasarım sürecine dahil edin.
  • Veri temsil denetimi: Eğitim verisi hangi grupları ne oranda temsil ediyor? Düşük temsil, düşük performans anlamına gelir.
  • Alt grup performans analizi: Model metriklerini yalnızca toplamda değil, demografik alt gruplar bazında ayrıştırın.
  • Eşitlik ölçütü seçimini belgeleyin: Hangi tanımı seçtiğinizi, neden seçtiğinizi ve hangi ödünleşmeleri kabul ettiğinizi kayıt altına alın.
Eşitlik Bir Sonuç, Tasarım Kararı Değil

MIT Media Lab araştırmacısı Joy Buolamwini'nin 2018'deki "Gender Shades" çalışması, ticari yüz tanıma sistemlerinin koyu tenli kadınları açık tenli erkeklerden 34 puana kadar daha düşük doğrulukla sınıflandırdığını gösterdi. Bu bulgular, etkilenen grupların temsil edilmediği eğitim veri setlerinin ürünüydü. IBM, Microsoft ve Face++ bu bulgular yayımlandıktan sonra sistemlerini iyileştirdi — ancak iyileştirmeler tasarım aşamasından değil, dış baskıdan geldi.

Bu örüntü tutarlıdır: eşitlik sorunları erken tasarım kararlarına gömülür ve görünür hale gelmesi için ya dış araştırma ya da gerçek zarar gerekmektedir. Proaktif tasarım bu döngüyü kırabilir.

Ders 7 Sınavı

Eşitlik için İnşa

ProPublica ve Northpointe'in COMPAS hakkındaki iddiaları nasıl değerlendirilebilir?
✓ Doğru. COMPAS vakası, farklı eşitlik ölçütlerinin aynı anda sağlanamayacağını gösterir. Her iki iddia da kendi benimsediği eşitlik tanımı çerçevesinde matematiksel olarak tutarlıydı.
✗ Yanlış. Chouldechova (2016) bunu biçimsel olarak kanıtladı: COMPAS vakasında her iki tarafın iddiaları da kendi eşitlik tanımları çerçevesinde matematiksel olarak doğruydu. Sorun, eşitlik tanımlarının seçiminin etik boyutundaydı.
"Gender Shades" araştırması ne ortaya koydu?
✓ Doğru. Joy Buolamwini'nin 2018 araştırması, eğitim verilerindeki temsil eksikliğinin belirli demografik gruplarda ciddi performans düşüşlerine yol açtığını somutlaştırdı.
✗ Yanlış. Gender Shades, koyu tenli kadınların açık tenli erkeklere kıyasla yüz tanıma sistemlerinde 34 puana kadar daha düşük doğrulukla sınıflandırıldığını gösterdi. Bu eğitim verisi temsil sorununundan kaynaklanıyordu.
Eşitlik ölçütü seçiminin neden teknik değil etik bir karar olduğu söylenir?
✓ Doğru. Eşitlik tanımı seçimi, hangi grup için hangi hata türünü daha az kabul edilebilir bulduğunuzu ortaya koyar. Bu değer yargısı içeren bir seçimdir ve şeffaf biçimde belgelenmesi gerekir.
✗ Yanlış. Eşitlik ölçütü seçimi etiksel bir karardır çünkü farklı tanımlar farklı gruplara farklı hata yükü bindirir. Hangi ölçütü seçtiğiniz, kimin çıkarlarına hangi ağırlığı verdiğinizi yansıtır.

Lab 7 — Eşitlik Analizi Çerçevesi

Gerçek bir YZ sistemi için eşitlik boyutlarını belirleme ve ölçüt seçimini gerekçelendirme.

Pratik Görev

Bir belediye, işsizlik yardımı başvurularını değerlendiren bir YZ sistemi devreye almak istiyor. Sistemin hangi demografik grupları nasıl etkileyebileceğini analiz edeceksiniz.

  1. Asistanın sorusunu yanıtlayarak sistemin hangi grupları dezavantajlı konuma düşürebileceğini belirleyin.
  2. Bu bağlamda kullanılabilecek üç farklı eşitlik tanımını tartışın ve aralarındaki ödünleşmeleri açıklayın.
  3. Hangi eşitlik ölçütünü seçeceğinizi ve bu seçimi nasıl belgeleyip kamuoyuyla paylaşacağınızı açıklayın.
Örnek başlangıç: "İşsizlik yardımı başvurularında demografik parite mi, yoksa eşit fırsat ölçütü mü kullanmalıyız?"
🤖 Eşitlik Tasarımı Danışmanı YZ Lab
🎯 İleri Düzey · Ders 8

Süregelen Sorumluluklar

Dağıtım, bitişi değil yeni bir aşamanın başlangıcıdır — izleme, güncelleme ve hesap verebilirlik süreç boyunca sürer.

Bir YZ sistemi ne zaman "tamam" sayılır?

2016 yılında Microsoft, Twitter'da Tay adlı bir chatbot dağıttı. Sistem kullanıcı etkileşimleriyle öğrenecek şekilde tasarlanmıştı. İlk 16 saatte koordineli kullanıcı grupları tarafından hedef alınan Tay, aşırı ayrımcı ve şiddet yüklü içerik üretir hale geldi ve 24 saatten kısa sürede devre dışı bırakıldı. Microsoft, dağıtım sonrası izleme mekanizmalarının sistematik kötüye kullanım senaryosu için tasarlanmadığını kabul etti. Bu vaka, dağıtım sonrası sorumluluğun gerçek zamanlı izleme ve hızlı müdahale kapasitesi gerektirdiğini açıkça gösterdi.

Dağıtım Sonrası İzleme

Tay vakası, dağıtım sonrası izlemenin reaktif değil proaktif olması gerektiğini gösterir. Sistemler gerçek kullanımda beklenmedik örüntüler geliştirir; bu örüntüleri tespit etmek için ne izleneceğinin önceden tanımlanması gerekir.

Etkili dağıtım sonrası izleme şu bileşenleri içerir: çıktı kalitesi dağılımının sürekli takibi, hata oranlarının alt grup bazında ayrıştırılması, kullanıcı geri bildirim kanallarının sistemli incelemesi ve anormal örüntüler için otomatik uyarı mekanizmaları.

Model Sapması ve Güncelleme

YZ sistemleri "statik" değildir — dağıtım sonrasında dünya değişir, kullanıcı davranışları değişir ve sistemin bağlamı değişir. Bu durum iki farklı sapma riski yaratır:

  • Veri kayması (data drift): Gerçek dünyadaki giriş dağılımı eğitim dağılımından uzaklaşır. COVID-19 salgını sırasında tüketici davranışı modellerinde bu sapma dramatik biçimde gerçekleşti.
  • Kavram kayması (concept drift): Tahmin edilmeye çalışılan şeyin anlamı değişir. Kredi riski modellerindeki "temerrüt" tanımı ekonomik krizlerle birlikte dönüşür.
Endüstri Pratiği

Google Cloud ve AWS, üretim YZ sistemleri için otomatik sapma tespiti araçları sunar. Ancak bu araçlar yalnızca teknik sapmayı ölçer; etik veya sosyal sapmayı tespit etmek insan değerlendirmesi gerektirir.

Uzun Vadeli Hesap Verebilirlik

Sistem hayat döngüsü boyunca hesap verebilirlik kimin sorumluluğundadır? Bu soru endüstride giderek daha fazla yanıt gerektirmektedir. AB Yapay Zeka Yasası ve benzer düzenlemeler, sistemin sahibinin dağıtım sonrası belirli izleme ve raporlama yükümlülüklerini sürdürmesini zorunlu kılar.

Öte yandan "organizasyonel hafıza" sorunu da göz ardı edilemez: bir sistemi inşa eden ekip dağılır, şirket el değiştirir veya ürün yeni bir bağlama taşınır. Bu durumlarda hesap verebilirliği kimin sürdüreceğini önceden tanımlamak, YZ yönetişiminin (AI governance) temel bir gerekliliğidir. 2023'te birçok şirketin eski YZ sistemlerini yeni bağlamlarda yeniden kullanması bu riski somutlaştırdı.

Modülün Özeti: İnşa Etmek Bir Süreçtir

Bu modül boyunca ele aldığımız sekiz ders, YZ sistemi inşasını doğrusal bir proje olarak değil, birbiriyle bağlantılı kararların oluşturduğu süregelen bir süreç olarak konumlandırdı. Problem tanımı, prompt tasarımı, değerlendirme, iş akışı mimarisi, test, dağıtım, eşitlik ve süregelen sorumluluk — bunların hiçbiri birbirinden bağımsız değildir.

Sorumlu YZ inşası; sıfır risk iddiasında bulunmak değil, alınan riskleri şeffaf biçimde belgelemek, izlemek ve hesap verebilmektir. Bu, teknik bir disiplin olduğu kadar etik bir taahhüttür.

Ders 8 Sınavı

Süregelen Sorumluluklar

Microsoft Tay chatbot vakasında dağıtım sonrası en kritik eksiklik neydi?
✓ Doğru. Microsoft, dağıtım sonrası izleme sisteminin sistematik kötüye kullanıma karşı yeterli olmadığını kabul etti. Gerçek zamanlı izleme ve hızlı müdahale kapasitesi yoktu.
✗ Yanlış. Tay vakasının dersi, dağıtım sonrası izleme mekanizmalarının koordineli kötüye kullanım gibi gerçek dünya senaryolarına hazır olmamasıydı — dil veya platform seçimi değil.
"Kavram kayması" (concept drift) nedir?
✓ Doğru. Kavram kayması, tahmin hedefinin gerçek dünya anlamının değişmesidir. Örneğin "kredi riski temerrüdü" ekonomik krizlerde farklı anlamlar taşır; bu durum modelin öğrendiği kalıpları geçersiz kılabilir.
✗ Yanlış. Kavram kayması, modelin eğitim zamanında öğrendiği hedef kavramın dünyada değişmesidir. Ekonomik kriz döneminde kredi riskinin yeniden tanımlanması buna örnektir.
AB Yapay Zeka Yasası, dağıtım sonrası hangi yükümlülüğü getiriyor?
✓ Doğru. AB Yapay Zeka Yasası, yüksek riskli sistemler için sistem sahibinin dağıtım sonrası izleme, kayıt tutma ve belirli durumlarda düzenleyiciye raporlama yükümlülüklerini sürdürmesini zorunlu kılar.
✗ Yanlış. AB Yapay Zeka Yasası kod paylaşımı veya sabit yeniden eğitim döngüsü öngörmez. Yüksek riskli YZ sistemlerinde sistem sahibinin dağıtım sonrası izleme ve raporlama yükümlülüğünü sürdürmesini gerektirir.

Lab 8 — Süregelen Sorumluluk Planı

Dağıtım sonrası izleme, sapma tespiti ve hesap verebilirlik mekanizmaları tasarlama.

Pratik Görev

Bir e-ticaret şirketinin öneri algoritması iki yıldır canlıda çalışıyor. Ekip, sistemin eskidiğini ancak ne zaman ve nasıl güncelleneceğini bilmediğini fark etti.

  1. Asistanın sorusunu yanıtlayarak hangi sinyallerin sistemin güncelleme zamanı geldiğini gösterdiğini belirleyin.
  2. Veri kayması ve kavram kaymasını izlemek için pratik bir izleme planı önerin.
  3. Sistemi tamamen devre dışı bırakma kararını kimin, hangi koşullarda vereceğini tartışın.
Örnek başlangıç: "İki yıl önce dağıtılan bir öneri algoritması hâlâ güvenilir mi ve bunu nasıl anlayabiliriz?"
🤖 YZ Yönetişim Danışmanı YZ Lab

MODÜL 10

Modül Testi

Yapay Zeka ile İnşa — 15 soru · Tüm dersler kapsanmaktadır

1. Amazon işe alım YZ vakasında "hedef uyumsuzluğu" ne anlama geliyordu?
✓ Doğru. Sistem geçmişteki çalışanlara benzemeyi optimize etti; bu geçmiş ise cinsiyete dayalı eşitsizlik içeriyordu.
✗ Yanlış. Asıl sorun, sistemin teknik performansından değil optimizasyon hedefinin hatalı tanımlanmasından kaynaklanıyordu.
2. Model kartları (model cards) hangi amaçla kullanılır?
✓ Doğru. Model kartları, Google'ın 2018'de önerdiği bu çerçeve, ekiplerin problem tanımlarını ve kısıtlamaları açıkça ifade etmesini sağlar.
✗ Yanlış. Model kartları belgeleme araçlarıdır; pazarlama veya güvenlik amacıyla kullanılmaz.
3. Sistem prompt'u ile kullanıcı prompt'u arasındaki temel fark nedir?
✓ Doğru. Bu iki katman farklı tasarım kararları gerektirir. Sistem prompt'u mimarı yapılandırmayı belirlerken kullanıcı prompt'u anlık görevi iletir.
✗ Yanlış. Sistem prompt'u modelin davranışını ve kısıtlamalarını çalışma ortamında tanımlarken kullanıcı prompt'u belirli bir isteği iletir.
4. "Hallüsinasyon" dil modellerinde ne anlama gelir?
✓ Doğru. Hallüsinasyon, modellerin olasılıksal sözdizim üretmesi nedeniyle gerçek olmayan içerikleri olgusal iddia olarak sunmasıdır. NY avukat davası bu riski somutlaştırdı.
✗ Yanlış. Hallüsinasyon, dil modellerinin olgusal veritabanına erişmek yerine olasılıksal metin üretmesi nedeniyle var olmayan bilgileri güvenle sunmasıdır.
5. HITL (Human-in-the-loop) modeli hangi durum için uygundur?
✓ Doğru. HITL, her karar için insan onayı gerektirir. Bu yaklaşım, hataların geri döndürülemez sonuçlar doğurduğu ve yeterli insan müdahale süresi olan sistemler için uygundur.
✗ Yanlış. HITL, yüksek riskli ve geri döndürülemez karar bağlamları için tasarlanmıştır. Milisaniye düzeyinde karar gerektiren sistemlerde HITL pratikte uygulanamaz.
6. OpenAI'ın GPT-4 kırmızı takım sürecindeki önemli özelliği neydi?
✓ Doğru. Farklı uzmanlık alanlarından dış araştırmacıların biyolojik silah, seçim manipülasyonu gibi belirli risk kategorilerini sistematik olarak test etmesi endüstri standardı haline gelmektedir.
✗ Yanlış. OpenAI, GPT-4 için 50'den fazla dış uzman araştırmacıyı, farklı risk kategorilerini dağıtımdan önce sistematik biçimde test etmek üzere görevlendirdi.
7. Meta (Facebook) Instagram vakasında hangi etik sorumluluk ihlali gerçekleşti?
✓ Doğru. Frances Haugen'ın paylaştığı belgeler, Meta'nın kendi iç araştırmalarının belgelediği zararı bilerek görmezden gelerek sistemi değiştirmeden sürdürdüğünü ortaya koydu.
✗ Yanlış. Asıl sorun, Meta'nın kendi araştırmacılarının tespit ettiği zararı dağıtım kararında dikkate almaması — bilinen zararı bilerek sürdürmesiydi.
8. COMPAS vakasının istatistiksel eşitlik açısından önemi nedir?
✓ Doğru. COMPAS vakasında hem ProPublica hem Northpointe kendi eşitlik tanımları açısından haklıydı. Bu, farklı eşitlik ölçütlerinin matematiksel olarak birbirini dışladığını gösterir.
✗ Yanlış. COMPAS, eşitlik paradoksunu somutlaştırdı: farklı eşitlik tanımları aynı anda sağlanamaz. Bu matematiksel gerçeklik, hangi tanımın seçileceğini etik bir karar haline getirir.
9. "Gender Shades" araştırmasının temel bulgusu neydi?
✓ Doğru. Joy Buolamwini'nin 2018 araştırması, eğitim verisindeki temsil eksikliğinin belirli demografik gruplarda ciddi performans farklılıklarına yol açtığını gösterdi.
✗ Yanlış. Gender Shades, ticari yüz tanıma sistemlerinin koyu tenli kadınları açık tenli erkeklere kıyasla 34 puana kadar daha düşük doğrulukla sınıflandırdığını ortaya koydu.
10. Microsoft Tay vakasının dağıtım sonrası izleme için temel dersi nedir?
✓ Doğru. Tay'ın 24 saat içinde devre dışı bırakılması, proaktif izleme mekanizmalarının koordineli kötüye kullanım senaryolarını da kapsaması gerektiğini gösterdi.
✗ Yanlış. Tay vakasının dersi platformla ilgili değil izleme mekanizmalarıyla ilgilidir: sistemler dağıtım sonrasında koordineli kötüye kullanım dahil gerçek dünya senaryolarına hazırlıklı olmalıdır.
11. Prompt injection saldırısı ne tür bir güvenlik riskidir?
✓ Doğru. Prompt injection, sistem prompt'undaki güvenlik kısıtlamalarını aşmak için hazırlanmış kullanıcı girdileri içerir. 2023'te pek çok ticari uygulama bu saldırıya karşı savunmasız bulundu.
✗ Yanlış. Prompt injection, sistem prompt'unu geçersiz kılmak için tasarlanmış kötü niyetli kullanıcı girdilerini kullanarak modelin kısıtlamalarını atlatma saldırısıdır.
12. Kademeli dağıtımda (%1, %5, %20, %100) her aşama geçişinin anahtarı nedir?
✓ Doğru. Kademeli dağıtımda her aşama, önceki aşamanın metrik sonuçlarına bağlı bir ilerleme kriterine bağlıdır. Metrikler sınırın dışına çıkarsa dağıtım otomatik durabilir.
✗ Yanlış. Kademeli dağıtımın güvenilirliği, zaman geçmesini değil, önceki aşamada gözlemlenen performans metriklerinin ilerleme kriterlerini karşılamasını gerektirir.
13. Babylon Health vakasında "otomasyon önyargısı" nasıl ortaya çıktı?
✓ Doğru. Babylon Health vakasında klinisyenler, sistem çıktısını eleştirel biçimde değerlendirmek yerine onaylamak için kullandı. Bu durum otomasyon önyargısının tipik bir örneğidir.
✗ Yanlış. Otomasyon önyargısı, klinisyenlerin sistemi bağımsız doğrulama yapmak yerine onay mekanizması olarak kullanmasında ortaya çıktı — sistemin yetersizliğinden değil.
14. "Veri kayması" (data drift) neden dağıtım sonrası izleme gerektiren bir risktir?
✓ Doğru. COVID-19 salgınında tüketici davranışı modellerinin dramatik biçimde başarısız olması, veri kaymasının gerçek dünya etkisini somutlaştırdı. Gerçek dağılım eğitim dağılımından uzaklaşınca model çöpe döner.
✗ Yanlış. Veri kayması, gerçek dünya giriş verilerinin eğitim verisinden farklılaşmasıdır. COVID-19 döneminde bu durum tüketici davranışı modellerini ciddi biçimde etkiledi.
15. Sorumlu YZ inşasının özet tanımı olarak hangisi en doğrudur?
✓ Doğru. Sorumlu YZ inşası sıfır risk iddiasında bulunmaz. Anthropic'in yaklaşımı dahil endüstri konsensüsü, belgelenmiş risk kabulü ve şeffaf hesap verebilirliği esas alır.
✗ Yanlış. Sıfır risk iddia eden sistemler büyük olasılıkla yetersiz test edilmiştir. Sorumlu YZ inşası, alınan riskleri şeffaf biçimde belgeleme ve hesap verme taahhüdünü içerir.

```