🎯 Gelişmiş · Ders 1

Örneklerle Öğretmek

Gözetimli öğrenme: etiketli veri, kayıp fonksiyonu ve gradyan inişinin temelleri.

Bir makine, yalnızca örneklere bakarak doğruyu öğrenebilir mi?

2012 yılında Geoffrey Hinton liderliğindeki Toronto Üniversitesi ekibi, ImageNet görüntü sınıflandırma yarışmasına AlexNet adlı derin sinir ağıyla katıldı. O güne kadar en iyi sistemler yaklaşık %26 hata oranıyla çalışıyordu; AlexNet bu oranı tek seferde %15,3'e indirdi. Model, 1,2 milyon etiketli fotoğraf üzerinde eğitilmişti: her görüntünün yanında "kedi", "köpek" veya "kamyon" gibi bir etiket bulunuyordu. Bu etiketler, ağın her yanlış tahminden ne kadar saptığını ölçen kayıp fonksiyonunu besliyor; gradyan inişi algoritması ise ağırlıkları yavaş yavaş doğru yönde güncelliyordu. AlexNet'in başarısı tesadüf değildi: milyonlarca etiketli örnek olmadan bu sıçrama gerçekleşemezdi. Yarışma sonuçları açıklandığında rakip ekiplerin tepkisi şoke olmuştu; gözetimli öğrenmenin ölçeklendiğinde ne yapabileceğini dünyaya ilk kez bu kadar net biçimde göstermişti.

Gözetimli Öğrenme Nedir?

Gözetimli öğrenme (supervised learning), her eğitim örneğinin bir girdi (input) ile o girdinin doğru çıktısını gösteren bir etiket (label) içerdiği makine öğrenimi yaklaşımıdır. Model, girdi-etiket çiftlerini defalarca işleyerek girdiden çıktıyı tahmin etmeyi öğrenir. "Gözetimli" ifadesi, öğretmenin rolünü üstlenen etiketlerin varlığına işaret eder.

Eğitim döngüsü üç adımdan oluşur: önce model bir tahmin üretir, ardından bu tahmin gerçek etiketle karşılaştırılır ve fark (kayıp — loss) hesaplanır; son olarak gradyan inişi (gradient descent) algoritması, kaybı azaltacak şekilde modelin iç ağırlıklarını günceller. Bu döngü binlerce, hatta milyonlarca kez tekrarlanır.

Temel Kavram

Kayıp fonksiyonu (loss function): Modelin tahmininin gerçek değerden ne kadar uzakta olduğunu sayısal olarak ifade eden ölçüt. Eğitimin amacı bu değeri en aza indirmektir.

Gözetimli öğrenme iki ana problem türünü kapsar: sınıflandırma (classification) — örneğin bir e-postanın spam olup olmadığına karar verme — ve regresyon (regression) — örneğin bir evin fiyatını tahmin etme. Her ikisinde de temel mantık aynıdır: etiketli örneklerden genelleme yapmak.

Etiketli Verinin Önemi

AlexNet örneği, etiketli verinin kritik rolünü somutlaştırır. ImageNet veri kümesini oluşturmak için Amazon Mechanical Turk platformu aracılığıyla binlerce insan, her görüntüyü manuel olarak sınıflandırdı. Bu etiketleme süreci yıllarca sürdü ve 14 milyondan fazla görüntüyü kapsadı. Etiketlerin kalitesi doğrudan modelin performansını belirler; yanlış veya tutarsız etiketler, modelin yanlış genellemeler öğrenmesine yol açar.

Etiket kalitesinin önemi 2019'da Google'ın tıbbi görüntü projelerinde de gün yüzüne çıktı. Farklı uzman hekimlerin aynı retina görüntüsüne farklı tanı koyduğu durumlarda, hangi etiketin "doğru" olduğuna karar vermek modelin güvenilirliğini doğrudan etkiliyordu. Bu nedenle etiketsiz ya da gürültülü (noisy) veriyle çalışmak, gözetimli öğrenmenin en büyük pratik zorluklarından biri olmaya devam etmektedir.

Aşırı Öğrenme ve Genelleme

Gözetimli öğrenmenin temel tehlikelerinden biri aşırı öğrenmedir (overfitting): model, eğitim verilerini ezberler ancak daha önce görmediği yeni verilerde başarısız olur. Bunu önlemek için araştırmacılar veriyi eğitim (training), doğrulama (validation) ve test kümelerine ayırır. Doğrulama kümesi, modelin genelleme yeteneğini eğitim sırasında izlemek için kullanılır; test kümesi ise modelin hiç görmediği nihai sınav verisidir.

Kritik Ayrım

İyi bir model, eğitim verisinde değil test verisinde iyi performans gösterir. Eğitim başarısı tek başına anlamsızdır.

Ders 1 Testi — Örneklerle Öğretmek

Her soruyu dikkatle okuyun ve en doğru yanıtı seçin.

1. Gözetimli öğrenmede "etiket" ne işlev görür?

✓ Doğru! Etiketler, modelin tahmininin ne kadar hatalı olduğunu ölçen kayıp fonksiyonunu besler. Bu olmadan gradyan inişi çalışamaz.

✗ Yanlış. Etiketler mimariye değil, öğrenme sinyaline katkıda bulunur: her örneğin doğru çıktısını gösterir ve kayıp hesaplamayı mümkün kılar.

2. AlexNet'in 2012'de ImageNet yarışmasında önceki sistemlere kıyasla yaklaşık yüzde kaç daha düşük hata oranına ulaşması neyin göstergesiydi?

✓ Doğru! AlexNet, mimarinin ve büyük ölçekli etiketli verinin birlikte ne kadar etkili olabileceğini kanıtladı.

✗ Yanlış. AlexNet'in başarısı, derin mimari ile büyük ölçekli etiketli verinin bir araya gelmesinin gücünü ortaya koydu.

3. Aşırı öğrenmeyi (overfitting) tespit etmek için hangi veri kümesi kullanılır?

✓ Doğru! Doğrulama kümesi, eğitim sırasında modelin genelleme yeteneğini izlemek için kullanılır. Test kümesi ise en sona saklanır.

✗ Yanlış. Eğitim kümesi, modelin ağırlıklarını güncellemek için kullanılır. Aşırı öğrenmeyi izlemek için doğrulama kümesi gerekir.

Lab 1 — Gözetimli Öğrenme Keşfi

Yapay zeka asistanıyla etiketli veri, kayıp fonksiyonu ve gradyan inişi üzerine sohbet edin.

Lab Talimatları

Bu laboratuvarda gözetimli öğrenmenin temel mekaniklerini bir yapay zeka asistanıyla tartışacaksınız.

Asistan size konu hakkında açılış sorusu yöneltecektir. Cevabınızı Türkçe yazın.
Kayıp fonksiyonu, gradyan inişi veya aşırı öğrenme hakkında kendi sorularınızı sorun.
AlexNet vakasını kendi sözlerinizle özetlemeyi deneyin; asistan geri bildirim verecektir.

Örnek soru: "Gradyan inişi tam olarak ne yapar? Bunu bir analogla açıklar mısınız?"

🤖 AI Asistan — Gözetimli Öğrenme Lab 1

🎯 Gelişmiş · Ders 2

Her Yerde Örüntüler

Yapay sinir ağları veriyi nasıl temsil eder: özellikler, katmanlar ve gizli uzaylar.

Bir sinir ağı "kedi" kavramını nasıl temsil eder?

2015 yılında Google'dan araştırmacılar, DeepDream adlı görselleştirme aracını kamuoyuyla paylaştı. Araç, ImageNet ile eğitilmiş bir sinir ağının iç katmanlarının hangi örüntüleri aradığını ortaya koyuyordu. Sonuçlar şaşırtıcıydı: ilk katmanlar yatay-dikey çizgiler ve renk geçişleri gibi basit kenar örüntülerini tespit ederken, orta katmanlar dokular ve nesne parçacıklarını, son katmanlar ise tam nesneleri temsil ediyordu. Bu hiyerarşik özellik öğrenimi (hierarchical feature learning), araştırmacıların el yapımı özelliklerle yıllarca uğraşarak başaramadığını otomatik gerçekleştiriyordu. DeepDream'in ürettiği psikedelik görüntüler viral oldu ve insanların sinir ağlarının içinde ne döndüğünü ilk kez sezgisel biçimde kavramasına katkı sağladı.

Özellik Hiyerarşisi

Derin sinir ağları (deep neural networks), verideki örüntüleri hiyerarşik olarak temsil eder. Birinci katman pikseller arasındaki ham ilişkileri işlerken; her sonraki katman bir öncekinin çıktısından daha soyut örüntüler türetir. Görüntü tanımada bu hiyerarşi kenarlar → dokular → nesne parçaları → tam nesneler biçiminde ilerler.

Bu özelliği el ile kodlamak yıllar alırdı. Derin öğrenme, bu özellikleri veriden otomatik öğrenir; bu nedenle "temsil öğrenimi" (representation learning) olarak da adlandırılır. Modelin öğrendiği temsillerin kalitesi, nihai başarımı doğrudan belirler.

Temsil Öğrenimi

Model, ham veriden anlamlı özellikler çıkarmayı otomatik öğrenir. Bu, insan mühendisinin özellikleri elle tanımlaması gereken klasik yaklaşımdan köklü biçimde farklıdır.

Gömme Uzayları (Embedding Spaces)

Modern yapay zeka modellerinin merkezinde gömme uzayları (embedding spaces) yatar. Bir gömme, ham veriyi (kelime, görüntü, ses) yüksek boyutlu bir sayı vektörüne dönüştürür. Bu uzayda benzer kavramlar birbirine yakın konumlanır. Word2Vec gibi erken modellerde "kral − erkek + kadın = kraliçe" vektör aritmetiğinin çalışması, anlamın bu uzayda geometrik biçimde kodlandığını gösteriyordu.

Bu ilke dil modellerinde de geçerlidir. GPT gibi büyük dil modelleri, her kelimeyi binlerce boyutlu bir uzayda konumlandırır; bağlam bu uzayda gömmeleri şekillendirir. "Banka" kelimesi "nehir" bağlamında farklı, "para" bağlamında farklı bir konuma taşınır.

Gömme uzayının boyutu büyüdükçe modelin daha nüanslı ilişkileri temsil etme kapasitesi artar.
Dikkat mekanizması (attention mechanism), hangi bağlam öğelerinin gömmeyi etkileyeceğini dinamik olarak belirler.
Uzaydaki mesafe, benzerliği ölçmek için doğrudan kullanılabilir (kosinüs benzerliği).

Ders 2 Testi — Her Yerde Örüntüler

Her soruyu dikkatle okuyun ve en doğru yanıtı seçin.

1. DeepDream araştırması, derin sinir ağlarının hangi özelliğini ortaya koydu?

✓ Doğru! DeepDream görselleştirmeleri, ilk katmanların basit kenarları, son katmanların ise tam nesneleri temsil ettiğini net biçimde gösterdi.

✗ Yanlış. DeepDream, katmanlar boyunca basit örüntülerden karmaşık nesnelere uzanan bir hiyerarşi ortaya koydu.

2. Word2Vec'te "kral − erkek + kadın = kraliçe" eşitliği neyi kanıtlar?

✓ Doğru! Bu vektör aritmetiği, semantik ilişkilerin sayısal uzayda doğrusal yapılar olarak temsil edildiğini gösterir.

✗ Yanlış. Bu örnek, anlamın gömme uzayında geometrik biçimde kodlandığını ve vektör aritmetiğiyle işlenebildiğini ortaya koyar.

3. Temsil öğrenimi (representation learning) klasik makine öğreniminden nasıl ayrışır?

✓ Doğru! Klasik yaklaşımlarda uzmanlar özellikleri elle kodlar; temsil öğreniminde model bu özellikleri veriden kendi türetir.

✗ Yanlış. Temsil öğreniminin ayırt edici özelliği, özelliklerin elle tanımlanması yerine veriden otomatik öğrenilmesidir.

Lab 2 — Örüntü Temsili Keşfi

Sinir ağlarının veriyi nasıl temsil ettiğini AI asistanıyla derinlemesine keşfedin.

Lab Talimatları

Bu laboratuvarda gömme uzayları ve özellik hiyerarşisi üzerine bir yapay zeka asistanıyla tartışacaksınız.

Asistanın açılış sorusunu yanıtlayın.
Kendi bir gömme uzayı analojisi üretmeyi deneyin ve asistanla tartışın.
"Banka" kelimesinin iki farklı bağlamdaki gömmesini karşılaştırmasını isteyin.

Örnek soru: "Yüksek boyutlu bir gömme uzayını sezgisel olarak nasıl hayal edebilirim?"

🤖 AI Asistan — Örüntü Temsili Lab 2

🎯 Gelişmiş · Ders 3

Model Nedir?

Ağırlıklar, parametreler ve eğitilmiş bir modelin gerçekte içerdiği şey.

Eğitilmiş bir model dosyasının içinde tam olarak ne vardır?

2023 yılında Meta, LLaMA adlı büyük dil modelini araştırma lisansıyla yayımladı. Ancak model ağırlıkları kısa sürede sızdırıldı ve 4chan üzerinden herkese açık hale geldi. Bu olay, "model" kavramının ne olduğunu çarpıcı biçimde gündeme taşıdı: Meta'nın milyonlarca dolarlık hesaplama kaynağıyla ürettiği şey, sonuç olarak onlarca gigabayt boyutunda bir ağırlık dosyasıydı. Bu dosya, 7 milyardan 65 milyara kadar sayısal parametre içeriyordu ve eğitim sürecinin tüm öğrenilebilir birikimini temsil ediyordu. Model sızdığında Meta'nın bu bilgiyi gizli tutmaya çalışması teknik olarak anlamsızlaştı; ağırlık dosyası internete bir kez yayıldıktan sonra geri almak imkânsızdı.

Modelin Anatomisi

Bir makine öğrenimi modeli, eğitim sürecinde öğrenilen sayısal ağırlıklar (weights) ve sabit mimari kararları (bias terimleri, katman sayısı, dikkat başlıkları gibi) içerir. Model mimarisi, hangi hesaplamaların yapılacağını tanımlayan bir çerçeve gibidir; ağırlıklar ise bu hesaplamaların içeriğini belirler. Eğitim tamamlandığında bu ağırlıklar dondurulur ve model dağıtıma hazır hale gelir.

GPT-4 gibi büyük bir modelin tahmin edilen parametre sayısı yüz milyarları aşar. Bu parametreler, temel olarak kayan noktalı (floating-point) sayılardır. Her parametre, aktivasyonları ne ölçüde iletip iletmeyeceğini belirler. Eğitim, tüm bu parametrelerin milyarlarca girdi üzerinde en düşük kaybı üretecek değerlere ayarlanması sürecidir.

Parametre Boyutu

GPT-2 (2019): ~1,5 milyar parametre. GPT-3 (2020): ~175 milyar. LLaMA-2 (2023): 7B ile 70B arası versiyonlar. Parametre sayısı kapasite için gerekli ama yeterli değildir; eğitim verisi ve prosedürü de kritiktir.

Mimari vs. Ağırlıklar

Aynı mimariyi kullanarak farklı verilerle eğitilmiş iki model, birbirinden çok farklı davranışlar sergileyebilir. Bu, ağırlıkların modelin gerçek "bilgi deposu" olduğunu ortaya koyar. Mimari, beynin yapısal şemasıyken ağırlıklar öğrenilmiş deneyimi temsil eder.

Transformatör mimarisi (transformer architecture), 2017'de Vaswani ve arkadaşlarının "Attention is All You Need" makalesiyle tanıtıldı. O tarihten bu yana BERT, GPT ailesi, T5 ve LLaMA dahil neredeyse tüm büyük dil modelleri bu mimariyi temel alır. Ancak her biri farklı ağırlıklara sahip olduğundan davranışları belirgin biçimde ayrışır.

Mimari: Katman sayısı, başlık sayısı, bağlam penceresi gibi sabit tasarım kararları.
Ağırlıklar: Eğitim boyunca optimize edilen, öğrenilmiş sayısal değerler.
Çıkarım (inference): Eğitilmiş ağırlıkları kullanarak yeni girdilere yanıt üretme süreci.

Ders 3 Testi — Model Nedir?

Her soruyu dikkatle okuyun ve en doğru yanıtı seçin.

1. LLaMA model ağırlıklarının sızdırılması hangi gerçeği gözler önüne serdi?

✓ Doğru! Model ağırlıkları bir kez yayıldığında geri almak teknik olarak imkânsızdır; bu, yapay zeka yönetişiminde önemli bir politika sorununa dönüşmüştür.

✗ Yanlış. LLaMA olayı, modelin özünün ağırlık dosyaları olduğunu ve bu dosyaların internete çıktığında geri alınamayacağını ortaya koydu.

2. Transformatör mimarisi ilk kez hangi makalede tanıtıldı?

✓ Doğru! 2017'de yayımlanan bu makale, günümüzdeki büyük dil modellerinin temelini oluşturan transformatör mimarisini dünyaya tanıttı.

✗ Yanlış. Transformatör mimarisi, Vaswani ve arkadaşlarının 2017'de yayımladığı "Attention is All You Need" makalesiyle tanıtıldı.

3. Mimari ve ağırlıklar arasındaki temel fark nedir?

✓ Doğru! Mimari, hesaplama çerçevesini belirler; ağırlıklar ise bu çerçeveyi dolduran, eğitimle elde edilen öğrenilmiş bilgidir.

✗ Yanlış. Mimari sabit bir çerçeve sağlarken, ağırlıklar eğitim boyunca güncellenen ve gerçek öğrenmeyi içeren parametrelerdir.

Lab 3 — Model İçyapısı Keşfi

Ağırlıklar, parametreler ve model mimarisi hakkında AI asistanıyla derinlemesine konuşun.

Lab Talimatları

Bu laboratuvarda model anatomisini — mimari, ağırlıklar ve çıkarım süreci — bir yapay zeka asistanıyla tartışacaksınız.

Asistanın açılış sorusunu yanıtlayın.
GPT-3'ün 175 milyar parametresinin ne anlama geldiğini kendi sözlerinizle ifade edin.
LLaMA sızıntısının yapay zeka yönetişimi açısından ne gibi sonuçlar doğurduğunu tartışın.

Örnek soru: "Aynı mimariyle eğitilmiş iki farklı model neden farklı davranır?"

🤖 AI Asistan — Model Anatomisi Lab 3

🎯 Gelişmiş · Ders 4

Gözetimsiz ve Pekiştirmeli Öğrenme

Etiket olmadan yapı bulmak; ödül sinyaliyle strateji geliştirmek.

Yapay zeka, kimse öğretmeden de öğrenebilir mi?

2016 yılında DeepMind'ın AlphaGo sistemi, Go oyununun dünya şampiyonu Lee Sedol'u 4-1 yendi. AlphaGo'nun eğitimi iki aşamalıydı: önce insan oyun kayıtlarından gözetimli öğrenme ile temel strateji öğrenildi, ardından sistemin kendisiyle oynadığı milyonlarca oyunda pekiştirmeli öğrenme (reinforcement learning) ile bu strateji çok ötesine taşındı. Kritik olan şu: pekiştirmeli öğrenme aşamasında AlphaGo, insan oyununda görülmemiş hamleler geliştirdi. 37. hamle — özellikle 2. maçta oynanan o hamle — uzmanları şaşkına çevirdi çünkü hiçbir insan oyunundan türetilemezdi. Ödül sinyali yalnızca "oyunu kazandın mı, kaybettin mi?" soruydu; içerik öğrenilmemişti, strateji keşfedilmişti.

Gözetimsiz Öğrenme

Gözetimsiz öğrenme (unsupervised learning), etiket içermeyen veri üzerinde gizli yapıları keşfetmeyi amaçlar. Model, hangi çıktının "doğru" olduğuna dair harici sinyal almadan verideki örüntüleri ve kümeleri bulmaya çalışır. K-means kümeleme, ana bileşen analizi (PCA) ve öz kodlayıcılar (autoencoders) bu yaklaşımın klasik örnekleridir.

Büyük dil modellerinin ön eğitimi teknik olarak gözetimsiz öğrenmenin bir formudur: model, milyarlarca metin belgesinde "bir sonraki kelimeyi tahmin et" göreviyle eğitilir. Bu görev için insan etiketi gerekmez; metnin kendisi doğal etiket görevi görür. Bu nedenle araştırmacılar bu yaklaşımı "öz denetimli öğrenme" (self-supervised learning) olarak adlandırır.

Öz Denetimli Öğrenme

Verinin kendi içindeki yapı, etiket görevi görür. GPT'nin "sonraki kelimeyi tahmin et" görevi bunun en büyük ölçekli örneğidir.

Pekiştirmeli Öğrenme

Pekiştirmeli öğrenme (reinforcement learning — RL), bir etmenin (agent) ortamla etkileşim kurarak deneme-yanılma yoluyla öğrendiği yaklaşımdır. Etmen, her eylem için bir ödül (reward) veya ceza (penalty) alır; hedef, toplam beklenen ödülü en üst düzeye çıkarmaktır. AlphaGo ve sonraki AlphaZero, bu yaklaşımın ne kadar güçlü olabileceğini somutlaştırdı.

Büyük dil modelleri bağlamında pekiştirmeli öğrenme, "İnsan Geri Bildiriminden Pekiştirmeli Öğrenme" (RLHF — Reinforcement Learning from Human Feedback) biçiminde uygulanır. ChatGPT ve Claude gibi modeller, insan değerlendiricilerin tercihlerinden öğrenen bir ödül modeli aracılığıyla ince ayar yapılmıştır. RLHF, modelin yalnızca doğru değil, tercih edilen yanıtlar üretmesini sağlar.

Etmen (Agent): Kararlar veren ve öğrenen sistem.
Ortam (Environment): Etmenin etkileşime girdiği bağlam.
Ödül (Reward): Eylemin ne kadar iyi olduğunu bildiren sinyal.
Politika (Policy): Durumdan eyleme eşleme — öğrenilen strateji.

Ders 4 Testi — Gözetimsiz ve Pekiştirmeli Öğrenme

Her soruyu dikkatle okuyun ve en doğru yanıtı seçin.

1. AlphaGo'nun insan oyununda görülmemiş hamleler üretmesi hangi öğrenme aşamasından kaynaklandı?

✓ Doğru! Pekiştirmeli öğrenme aşamasında AlphaGo, yalnızca kazanma/kaybetme sinyalini kullanarak insan stratejisinin ötesine geçti.

✗ Yanlış. İnsan oyununun ötesine geçen hamleler, pekiştirmeli öğrenme aşamasında kendisiyle oynanan milyonlarca oyundan ortaya çıktı.

2. RLHF (İnsan Geri Bildiriminden Pekiştirmeli Öğrenme) hangi sorunu çözmeyi hedefler?

✓ Doğru! RLHF, insan değerlendiricilerin tercihlerinden öğrenen bir ödül modeli aracılığıyla modeli hem yararlı hem tercih edilen yanıtlar üretmeye yönlendirir.

✗ Yanlış. RLHF'nin temel amacı, modeli insan tercihlerine uygun yanıtlar üretecek şekilde şekillendirmektir.

3. "Öz denetimli öğrenme" (self-supervised learning) gözetimli öğrenmeden nasıl ayrışır?

✓ Doğru! GPT'nin "sonraki kelimeyi tahmin et" görevi bunun en büyük ölçekli örneğidir: metin kendi etiketini üretir.

✗ Yanlış. Öz denetimli öğrenmede etiketler insan tarafından oluşturulmaz; veri kendi içindeki yapıdan otomatik türetilir.

Lab 4 — Pekiştirmeli Öğrenme Keşfi

AlphaGo vakası ve RLHF üzerine AI asistanıyla derinlemesine tartışın.

Lab Talimatları

Bu laboratuvarda gözetimsiz öğrenme ile pekiştirmeli öğrenmenin farkını ve pratikte nasıl uygulandığını bir yapay zeka asistanıyla keşfedeceksiniz.

Asistanın açılış sorusunu yanıtlayın.
AlphaZero'nun satranç ve Go'yu aynı anda nasıl öğrendiğini sorun.
RLHF'nin dil modellerinde nasıl çalıştığını kendi sözlerinizle açıklamaya çalışın.

Örnek soru: "Pekiştirmeli öğrenmede ödül tasarımı neden kritik bir sorun?"

🤖 AI Asistan — Pekiştirmeli Öğrenme Lab 4

🎯 Gelişmiş · Ders 5

Veri Sorunu

Önyargı, temsil eksikliği, veri zehirlenmesi ve veri kalitesinin kritik önemi.

Kötü veriyle iyi model inşa etmek mümkün mü?

2018 yılında Reuters, Amazon'un 2014'ten 2017'ye kadar kullandığı otomatik özgeçmiş eleme sisteminin kadın adaylara sistematik olarak düşük puan verdiğini haberleştirdi. Araştırma, sorunun modelin kendisinden değil eğitim verisinden kaynaklandığını ortaya koydu: sistem, son 10 yılda Amazon'a gönderilmiş ve çoğunluğu erkeklerden oluşan geçmiş özgeçmişler üzerinde eğitilmişti. Model bu veriyi "başarılı çalışan" olarak kodlamış; kadın kolejlerine yapılan atıfları veya "kadın" kelimesini içeren metinleri olumsuz sinyaller olarak öğrenmişti. Sonuç olarak Amazon sistemi kullanımdan kaldırdı. Bu vaka, veri önyargısının (data bias) modele nasıl aktarıldığını ve bu önyargının gerçek dünya kararlarına nasıl dönüştüğünü gösteren en belgelenmiş örneklerden biridir.

Veri Önyargısı

Makine öğrenimi modellerindeki önyargıların büyük çoğunluğu model mimarisinden değil, eğitim verisindeki sistematik temsil hatalarından kaynaklanır. Eğer geçmiş veride belirli gruplar eksik temsil ediliyorsa veya tarihsel ayrımcılık yansıtılıyorsa, model bu örüntüleri öğrenir ve yeni durumlara aktarır. Bu duruma dağılım kayması (distributional shift) veya önyargı aktarımı (bias transfer) denir.

Amazon vakasında kritik husus şudur: mühendisler modele "cinsiyete bakma" demişlerse de model, cinsiyetle istatistiksel olarak ilişkili olan diğer özellikleri (belirli üniversiteler, belirli kelimeler) proxy olarak kullandı. Önyargıyı veri temizliğiyle gidermek mümkündür, ancak tüm proxy değişkenlerin tespiti son derece güçtür.

Temel İlke

Model, eğitim verisindeki istatistiksel örüntüleri öğrenir — bu örüntüler tarihsel adaletsizlikleri yansıtıyorsa model de bu adaletsizlikleri yeniden üretir.

Veri Zehirlenmesi ve Kalite Sorunları

Eğitim verisi yalnızca önyargı değil, çeşitli kalite sorunlarıyla da karşı karşıyadır. Gürültülü etiketler (noisy labels), veri zehirlenmesi (data poisoning) ve dağılım kayması bunların başında gelir. 2021'de Stanford araştırmacıları, büyük web tarama verisi kümelerinin ciddi miktarda tehlikeli ve yanıltıcı içerik barındırdığını belgeledi; bu veriler üzerinde eğitilen modeller bu içerikleri öğreniyordu.

Veri zehirlenmesi, bir saldırganın modelin eğitim veri kümesine kasıtlı olarak belirli örnekler ekleyerek modelin davranışını manipüle etmesidir. Bu saldırı türü hem açık kaynak veri kümelerini hem de web'den toplanan verileri hedef alabilir. 2022'de araştırmacılar, LAION veri kümesinin yüzde bir kısmını bile değiştirmenin görüntü tanıma modellerinin belirli girdiler için davranışını anlamlı ölçüde etkileyebildiğini gösterdi.

Temsil eksikliği: Belirli grupların, dillerin veya bağlamların eğitim verinde yetersiz yer alması.
Geçmiş önyargısı: Tarihsel verinin sistematik ayrımcılığı yansıtması.
Veri zehirlenmesi: Kasıtlı olarak bozulmuş örneklerin eğitim kümesine eklenmesi.
Dağılım kayması: Eğitim ve kullanım ortamı arasındaki istatistiksel farklılık.

Ders 5 Testi — Veri Sorunu

Her soruyu dikkatle okuyun ve en doğru yanıtı seçin.

1. Amazon'un özgeçmiş eleme sisteminin kadın adaylara düşük puan vermesi hangi temel sorundan kaynaklandı?

✓ Doğru! Model, geçmiş verinin yansıttığı istatistiksel örüntüleri öğrendi. Bu örüntüler tarihsel cinsiyet dengesizliğini içeriyordu.

✗ Yanlış. Sorun modelin mimarisinde değil, eğitim verisinin çoğunlukla erkeklerden oluşması ve bu dengesizliğin modele aktarılmasında yatıyordu.

2. "Proxy değişken" sorunu neden önyargıyı gidermede bu kadar zordur?

✓ Doğru! Cinsiyet gibi bir değişkeni veri kümesinden çıkarsanız bile, o değişkenle ilişkili diğer özellikler (belirli okul adları, belirli kelimeler) proxy olarak işlev görebilir.

✗ Yanlış. Proxy sorunu, modelin korunan bir özelliği doğrudan kullanmasa da onunla ilişkili başka özellikleri öğrenmesinden kaynaklanır.

3. Veri zehirlenmesi (data poisoning) saldırısı nasıl gerçekleştirilir?

✓ Doğru! Veri zehirlenmesi, eğitim aşamasında gerçekleşir: saldırgan, belirli girdiler için modelin davranışını değiştirmek amacıyla seçilmiş örnekleri veri kümesine yerleştirir.

✗ Yanlış. Veri zehirlenmesi, eğitim veri kümesine kasıtlı manipülasyonlar eklenerek modelin belirli girdiler için istenen çıktıyı üretmesi sağlanır.

Lab 5 — Veri Önyargısı Analizi

Veri kalitesi, önyargı ve zehirlenme sorunlarını AI asistanıyla derinlemesine inceleyin.

Lab Talimatları

Bu laboratuvarda veri önyargısının gerçek dünya etkilerini ve olası çözümleri bir yapay zeka asistanıyla tartışacaksınız.

Asistanın açılış sorusunu yanıtlayın.
Amazon vakasındaki "proxy değişken" sorununu kendi sözlerinizle açıklamaya çalışın.
Türkiye'deki iş ilanları ya da üniversite sınav verileri gibi yerel bir bağlamda hangi önyargı sorunlarının ortaya çıkabileceğini tartışın.

Örnek soru: "Eğitim verisi önyargısını tamamen ortadan kaldırmak mümkün mü?"

🤖 AI Asistan — Veri Önyargısı Lab 5

🎯 Gelişmiş · Ders 6

Ön Eğitim ve İnce Ayar

Büyük ölçekli ön eğitimden göreve özgü uyarlamaya: transfer öğrenimi nasıl çalışır?

Genel amaçlı bir model, özel bir göreve nasıl uyarlanır?

2018 yılında Google, BERT (Bidirectional Encoder Representations from Transformers) modelini yayımladı. BERT, Wikipedia ve BookCorpus üzerinde iki görevle ön eğitim almıştı: kelime doldurma (masked language modeling) ve cümle ardışıklığı tahmini. Bu ön eğitim tamamlandıktan sonra aynı model, üzerine küçük bir sınıflandırıcı eklenerek duygu analizi, soru cevaplama ve doğal dil çıkarımı gibi on bir farklı görevde ince ayar yapıldı. Her görev için yalnızca birkaç bin etiketli örnek yeterliydi — çünkü genel dil anlayışı çoktan ön eğitimde yerleşmişti. BERT, yayımlandığı tarihte on bir NLP kıyaslama testinin tamamında yeni rekor kırdı. Bu, ön eğitim + ince ayar paradigmasının standart hale geldiği dönüm noktasıydı.

Transfer Öğrenimi Paradigması

Ön eğitim (pretraining), büyük ve genel bir veri kümesi üzerinde modelin temel yeteneklerini (dil anlama, görüntü tanıma vb.) kazanmasıdır. İnce ayar (fine-tuning) ise ön eğitimden gelen ağırlıkları başlangıç noktası alarak, çok daha küçük bir göreve özgü veri kümesi üzerinde ek eğitim yapmaktır. Bu iki aşamalı yaklaşım, büyük hesaplama kaynaklarına sahip organizasyonların (Google, OpenAI, Meta) küçük organizasyonların ve araştırmacıların kolayca kullanamayacağı modeller üretmesine ve bu modellerin topluluk tarafından uyarlanmasına imkân tanır.

Ekonomik Mantık

GPT-3'ün ön eğitimi tahminen 4–12 milyon dolar arası maliyetle gerçekleşti. Aynı modelin ince ayarı birkaç yüz dolara mal olabilir. Transfer öğrenimi bu asimetriyi mümkün kılar.

İnce Ayar Yöntemleri

Tam ince ayar (full fine-tuning), ön eğitimden gelen tüm ağırlıkların göreve özgü veriyle güncellenmesini içerir. Ancak bu yaklaşım hem pahalıdır hem de felaket unutma (catastrophic forgetting) riskini taşır: model yeni görevi öğrenirken önceki genel yeteneklerini kaybedebilir.

Bu sorunu aşmak için daha verimli yaklaşımlar geliştirilmiştir. LoRA (Low-Rank Adaptation), 2021'de Microsoft araştırmacıları tarafından tanıtıldı. LoRA, orijinal ağırlıkları dondurup yalnızca çok daha küçük ek ağırlık matrislerini günceller. Bu sayede bellek ve hesaplama maliyeti dramatik biçimde düşer; 175 milyar parametreli bir modeli birkaç milyon ek parametreyle uyarlamak mümkün hale gelir.

Tam ince ayar: Tüm ağırlıklar güncellenir; en güçlü ama en maliyetli yöntem.
LoRA: Düşük boyutlu ek matrisler eklenir; orijinal ağırlıklar değişmez.
Prefix tuning / Prompt tuning: Yalnızca girdi katmanındaki küçük vektörler optimize edilir.
Adapter katmanlar: Model içine küçük ek katmanlar eklenir; orijinal ağırlıklar korunur.

Ders 6 Testi — Ön Eğitim ve İnce Ayar

Her soruyu dikkatle okuyun ve en doğru yanıtı seçin.

1. BERT'in ön eğitim aşamasında kullanılan iki görev hangisiydi?

✓ Doğru! BERT, Wikipedia ve BookCorpus üzerinde maskeli dil modelleme ve cümle ardışıklığı tahmini görevleriyle ön eğitim aldı.

✗ Yanlış. BERT'in ön eğitim görevleri maskeli dil modelleme (kelime doldurma) ve cümle ardışıklığı tahminidir; bu görevler insan etiketi gerektirmez.

2. LoRA (Low-Rank Adaptation) tam ince ayara kıyasla hangi avantajı sağlar?

✓ Doğru! LoRA, orijinal ağırlıklara dokunmadan ekstra düşük boyutlu matrisler eğiterek büyük modelleri çok daha az kaynakla uyarlamayı mümkün kılar.

✗ Yanlış. LoRA'nın temel avantajı, orijinal ağırlıkları dondurarak yalnızca küçük ek parametreler eğitmesi ve bu sayede maliyeti dramatik biçimde düşürmesidir.

3. "Felaket unutma" (catastrophic forgetting) tam ince ayarda neden bir risk oluşturur?

✓ Doğru! Tüm ağırlıklar yeni görev için agresif biçimde güncellenirse, modelin ön eğitimde öğrendiği geniş dil anlayışı zarar görebilir.

✗ Yanlış. Felaket unutma, tüm ağırlıkların güncellenmesi sırasında modelin yeni görevi öğrenirken eski genel yeteneklerini kaybetmesi riskidir.

Lab 6 — Ön Eğitim ve İnce Ayar Keşfi

Transfer öğrenimi stratejilerini ve LoRA'yı AI asistanıyla derinlemesine tartışın.

Lab Talimatları

Bu laboratuvarda ön eğitim ve ince ayar paradigmasını gerçek dünya senaryolarına uygulayan bir yapay zeka asistanıyla çalışacaksınız.

Asistanın açılış sorusunu yanıtlayın.
Türkçe bir tıbbi rapor analizi uygulaması için hangi ön eğitim + ince ayar stratejisinin en uygun olacağını tartışın.
LoRA'nın tam ince ayara kıyasla ne zaman tercih edilmesi gerektiğini açıklamaya çalışın.

Örnek soru: "Sıfırdan eğitim ile ön eğitimli bir modeli ince ayar yapmak arasındaki maliyet farkı pratikte nasıl görünür?"

🤖 AI Asistan — Transfer Öğrenimi Lab 6

🎯 Gelişmiş · Ders 7

Değerlendirme ve Kıyaslamalar

Performans ölçümünün sınırları: kıyaslama kirliliği, test seti sızıntısı ve Goodhart Yasası.

Bir kıyaslama testinde yüksek puan almak gerçek zekâyı kanıtlar mı?

2022'de OpenAI GPT-4 teknik raporunu yayımladığında model, hukuk barosu sınavından üst dilimde geçti, tıp lisans sınavında başarılı oldu ve SAT matematik bölümünde yüksek puan aldı. Bu sonuçlar büyük yankı uyandırdı. Ancak araştırmacılar hemen kritik soruyu sordu: bu sınavların hazırlanma sorularının internet kaynaklarında bulunduğu göz önüne alındığında, GPT-4'ün ön eğitim verisi bu soruları veya çok benzerlerini içermiş olabilir miydi? Test seti sızıntısı (test set contamination) olarak bilinen bu sorun, modelin gerçekte öğrenip öğrenmediğini yoksa eğitim sırasında gördüğü verileri "hatırlayıp hatırlamadığını" ayırt etmeyi son derece güçleştirdi. Carnegie Mellon'dan araştırmacılar 2023'te gerçekten de büyük modellerin birçok bilinen kıyaslama testindeki performansını gizmiş olabileceğini gösteren kanıtlar sundu.

Kıyaslama Kirliliği

Kıyaslama (benchmark), yapay zeka modellerinin belirli bir görevdeki performansını standart bir test kümesi üzerinde ölçen değerlendirme çerçevesidir. GLUE, SuperGLUE, MMLU, HumanEval ve BIG-bench gibi kıyaslamalar alanın "ölçüm standartları" haline gelmiştir. Ancak bu kıyaslamalar kamuya açık olduğundan, çok büyük miktarda interneti tarayan modeller bu test sorularını ön eğitim sırasında görmüş olabilir.

Bu sorun, yapay zeka araştırmasında "kıyaslama kirliliği" (benchmark contamination) olarak anılır. Kirlenmiş kıyaslamalarda yüksek puan almak, gerçek genelleme yeteneğinin değil ezber kapasitesinin göstergesi olabilir. 2023'te açıklanan GPT-4 teknik raporunun bu meseleyi açıkça tartışması, alanın bu sorunun farkında olduğunu gösterir; ancak bağımsız doğrulama hâlâ güçtür.

Goodhart Yasası

"Bir ölçüt hedef haline geldiğinde, iyi bir ölçüt olmaktan çıkar." Kıyaslamalarda yüksek puana odaklanmak, modelin gerçek kapasitesini geliştirmek yerine o testi geçmeye optimize edilmesine yol açabilir.

Dürüst Değerlendirme Nasıl Yapılır?

Güvenilir değerlendirme, modelin hiç görmediği verileri kullanmayı, çok boyutlu ölçütler uygulamayı ve tek bir sayıya indirgeme tuzağından kaçınmayı gerektirir. Öne çıkan bazı yaklaşımlar şunlardır:

Dinamik kıyaslamalar: Test soruları periyodik olarak yenilenir; önceki sorular kamuya açılmaz. BIG-bench ve HELM bu yaklaşımı benimser.
İnsan değerlendirmesi: Chatbot Arena gibi platformlarda gerçek kullanıcılar modelleri karşılaştırarak tercih bildirir.
Açıklama isteme (chain-of-thought): Yalnızca nihai cevap değil, akıl yürütme süreci değerlendirilir.
Dağılım dışı test (out-of-distribution): Model, eğitim dağılımından belirgin biçimde farklı verilerle test edilir.

Ders 7 Testi — Değerlendirme ve Kıyaslamalar

Her soruyu dikkatle okuyun ve en doğru yanıtı seçin.

1. Test seti sızıntısı (test set contamination) modelin değerlendirmesini neden güvenilmez kılar?

✓ Doğru! Eğer model, ön eğitim sırasında test sorularını veya yanıtlarını görmüşse, yüksek puan öğrenmeyi değil hafızayı ölçüyor olabilir.

✗ Yanlış. Sızıntı, ön eğitim verisinin test sorularını içermesinden kaynaklanır; bu, yüksek puanın gerçek genelleme kapasitesinin mi yoksa ezberin mi yansıması olduğunu belirsiz kılar.

2. Goodhart Yasası yapay zeka değerlendirmesine nasıl uygulanır?

✓ Doğru! "Ölçüt hedef olduğunda ölçüt olarak değerini yitirir." Bu, kıyaslama puanının modelin gerçek yeteneğinden kopmaya başlamasına yol açar.

✗ Yanlış. Goodhart Yasası, bir ölçütün hedef haline gelmesiyle asıl değerini yitirmesi sürecini açıklar; bu kıyaslamalarda da geçerlidir.

3. "Dinamik kıyaslama" yaklaşımı klasik statik kıyaslamaya göre hangi sorunu azaltır?

✓ Doğru! Sorular periyodik olarak yenilendiğinde ve önceki sorular kamuya açılmadığında, modelin testi ezberlemesi yerine gerçekten genelleme yapıp yapmadığı daha doğru ölçülür.

✗ Yanlış. Dinamik kıyaslamanın temel faydası, test sorularını güncel tutarak ön eğitim sırasındaki ezber riskini azaltmaktır.

Lab 7 — Kıyaslama Güvenilirliği Analizi

Model değerlendirmesinin sınırlarını ve dürüst ölçüm yöntemlerini AI asistanıyla keşfedin.

Lab Talimatları

Bu laboratuvarda model değerlendirme yöntemlerinin güçlü ve zayıf yönlerini bir yapay zeka asistanıyla tartışacaksınız.

Asistanın açılış sorusunu yanıtlayın.
GPT-4'ün baro sınavından geçmesinin gerçek hukuki muhakeme yeteneğini kanıtlayıp kanıtlamadığını tartışın.
Goodhart Yasası'nı kendi sözlerinizle bir örnekle açıklayın.

Örnek soru: "Yapay zeka modellerini değerlendirmek için ideal bir yöntem nasıl tasarlanır?"

🤖 AI Asistan — Model Değerlendirme Lab 7

🎯 Gelişmiş · Ders 8

Sınır: Modeller Henüz Neyi Öğrenemez?

Gerçek dünya kausalite, sürekli öğrenme ve güncel araştırmaların açık soruları.

Mevcut dil modelleri nedenselliği anlıyor mu, yoksa korelasyonu mu?

2023 yılında UCLA'dan araştırmacı Judea Pearl — nedensellik (causality) teorisinin öncüsü ve Turing Ödülü sahibi — büyük dil modellerinin gerçek nedensel akıl yürütme yapmadığını, yalnızca istatistiksel korelasyonları takip ettiğini savundu. Pearl'ün argümanı somuttu: bir model "sigara içmek akciğer kanserine yol açar mı?" sorusunu doğru yanıtlayabilir, çünkü bu korelasyon eğitim verisinde sık geçer. Ancak "Tüm insanlar sigara içseydi, akciğer kanseri oranları nasıl değişirdi?" gibi müdahale (intervention) sorularında veya "Bu kişi sigara içmemiş olsaydı kanserden ölür müydü?" biçimindeki karşı-olgusal (counterfactual) sorularda modeller sistematik olarak başarısız olur. Bu ayrım kritiktir: tıp, politika ve güvenlik için yalnızca korelasyonu değil, nedenselliği anlamak şarttır.

Nedensellik Sorunu

Mevcut büyük dil modelleri, korelasyon örüntülerini öğrenmek konusunda son derece güçlüdür; ancak gerçek anlamda nedensel çıkarım yapma yeteneğinden yoksundur. Pearl'ün "nedensellik merdiveni" üç basamak tanımlar: birincisi gözlem (korelasyon görmek), ikincisi müdahale (bir değişkeni değiştirdiğimizde ne olur?), üçüncüsü karşı-olgusal (farklı davransaydı ne olurdu?). Mevcut transformatör modelleri birinci basamakta güçlüdür; ikinci ve üçüncüde sistematik olarak zayıftır.

Nedensellik Merdiveni (Pearl)

1. Gözlem: "X ve Y birlikte ne sıklıkla görülür?" — Modeller güçlüdür.
2. Müdahale: "X'i değiştirirsem Y ne olur?" — Modeller zayıftır.
3. Karşı-olgusal: "X olmasaydı Y olur muydu?" — Modeller sistematik olarak başarısız olur.

Diğer Açık Sınırlar

Nedensellik dışında, mevcut modellerin öğrenmekte zorlandığı birkaç temel alan daha vardır:

Sürekli öğrenme (continual learning): İnsan beyni yeni bilgileri edinirken eskileri koruyabilir. Mevcut modeller ise yeni verilerle güncellenmek istendiğinde felaket unutma sorunuyla karşı karşıya kalır.
Az örnekli akıl yürütme (few-shot compositional reasoning): Birkaç örnekten tamamen yeni kural bileşimleri türetme, modellerin tutarsız biçimde üstesinden geldiği bir görevdir.
Fiziksel sezgi: Dil modelleri, gerçek dünya fiziksel olayları hakkında sistematik hatalar yapar — çünkü eğitim verileri gözlemsel fizik deneyimi değil metin içerir.
Meta-öğrenme: Nasıl öğreneceğini öğrenme ve öğrenme stratejisini görev türüne göre uyarlama yeteneği henüz yetersizdir.

Bu sınırlar, mevcut yapay zekânın güçlü istatistiksel örüntü eşleştiriciler olduğunu ancak genel zekâya (AGI — Artificial General Intelligence) henüz uzak olduğunu gösterir. Alan bu açık soruları çözmeye çalışırken araştırmacılar nedensel temsiller, dünya modelleri ve çevrim içi öğrenme gibi yaklaşımlar geliştirmektedir.

Ders 8 Testi — Modellerin Sınırları

Her soruyu dikkatle okuyun ve en doğru yanıtı seçin.

1. Judea Pearl'ün nedensellik merdivenine göre büyük dil modelleri hangi basamakta en zayıftır?

✓ Doğru! Modeller korelasyonu iyi tespit eder; ancak müdahale ve karşı-olgusal sorular, eğitim verisinde mevcut olmayan nedensel akıl yürütme gerektirdiğinden sistematik olarak başarısız olur.

✗ Yanlış. Pearl'ün çerçevesinde modeller gözlem basamağında güçlü, müdahale ve karşı-olgusal basamaklarda ise sistematik olarak zayıftır.

2. "Sürekli öğrenme" (continual learning) sorunu mevcut modellerdi neden çözülmemiştir?

✓ Doğru! Tüm ağırlıkları güncellemek, yeni bilgiyi öğrenirken eski bilgilerin üzerine yazılması anlamına gelir; bu felaket unutmanın temel mekanizmasıdır.

✗ Yanlış. Sürekli öğrenme sorununun özü, yeni bilgiyle güncellemenin eski bilgilerin yok olmasına (felaket unutma) yol açmasıdır.

3. Mevcut büyük dil modellerinin fiziksel sezgide neden sistematik hatalar yaptığı en iyi nasıl açıklanır?

✓ Doğru! Dil modelleri metinden öğrenir; oysa fiziksel sezgi büyük ölçüde bedensel deneyim ve simülasyon gerektirir. Bu temel bir veri modalitesi sorunudur.

✗ Yanlış. Asıl sorun, eğitim verisinin metin olması ve gerçek fiziksel deneyimi yansıtmamasıdır; bu da fiziksel akıl yürütmede sistematik hatalara yol açar.

Lab 8 — Modellerin Sınırlarını Test Etmek

Nedensellik, sürekli öğrenme ve yapay zekanın açık sorunlarını AI asistanıyla keşfedin.

Lab Talimatları

Bu laboratuvarda mevcut yapay zeka modellerinin gerçek sınırlarını bir yapay zeka asistanıyla derinlemesine araştıracaksınız.

Asistanın açılış sorusunu yanıtlayın.
Karşı-olgusal bir soru sorun ve asistanın nasıl yanıt verdiğini gözlemleyin.
AGI (Genel Yapay Zeka) ile mevcut modeller arasındaki temel farkın ne olduğunu tartışın.

Örnek soru: "Bir dil modeline nedensel akıl yürütme öğretmek için ne tür bir eğitim verisi gerekir?"

🤖 AI Asistan — Model Sınırları Lab 8

Modül Testi — Yapay Zeka Nasıl Öğrenir

15 soru · Tüm dersleri kapsar · Yanıtlarınızı seçtikten sonra puanınızı görün.

1. Gözetimli öğrenmede gradyan inişinin temel işlevi nedir?

✓ Doğru!

✗ Yanlış. Gradyan inişi, kaybı en aza indirecek yönde ağırlıkları güncelleyen optimizasyon algoritmasıdır.

2. AlexNet'in 2012 ImageNet yarışmasındaki başarısının en doğrudan sonucu neydi?

✓ Doğru!

✗ Yanlış. AlexNet, derin mimari ile büyük etiketli verinin birleşiminin gücünü kanıtladı ve modern derin öğrenme dönemini başlattı.

3. DeepDream görselleştirmelerinin gösterdiği sinir ağı özelliği hangisidir?

✓ Doğru!

✗ Yanlış. DeepDream, katmanlar boyunca kenarlardan nesnelere uzanan hiyerarşik özellik öğrenimini görünür kıldı.

4. Gömme uzayında (embedding space) "kosinüs benzerliği" ne için kullanılır?

✓ Doğru!

✗ Yanlış. Kosinüs benzerliği, iki vektörün yönelimlerinin ne kadar örtüştüğünü ölçerek gömme uzayındaki anlamsal yakınlığı hesaplar.

5. Meta'nın LLaMA model ağırlıklarının sızdırılması hangi temel gerçeği gündeme taşıdı?

✓ Doğru!

✗ Yanlış. LLaMA olayı, model ağırlıklarının bir kez yayıldığında geri alınamayacağını ve yapay zeka yönetişimi için bu durumun ne gibi sonuçlar doğurduğunu ortaya koydu.

6. Pekiştirmeli öğrenmede "politika" (policy) nedir?

✓ Doğru!

✗ Yanlış. Politika, etmenin hangi durumda hangi eylemi seçeceğini tanımlayan öğrenilmiş karar fonksiyonudur.

7. Amazon'un özgeçmiş eleme sistemindeki önyargı sorununun köküne inildiğinde hangi faktör belirleyiciydi?

✓ Doğru!

✗ Yanlış. Sorun, eğitim verisindeki tarihsel dengesizliğin modele aktarılmasından kaynaklandı; model bu eğilimi yeni adaylara uyguladı.

8. BERT'in NLP alanındaki devrimsel etkisinin temeli neydi?

✓ Doğru!

✗ Yanlış. BERT'in etkisi, ön eğitim + ince ayar paradigmasını standart hale getirmesinden ve on bir kıyaslamada eş zamanlı rekor kırmasından geliyordu.

9. LoRA'nın (Low-Rank Adaptation) tam ince ayara kıyasla sunduğu temel teknik avantaj nedir?

✓ Doğru!

✗ Yanlış. LoRA, orijinal ağırlıkları koruyarak yalnızca ek düşük boyutlu matrisler eğitir; bu, büyük modellerin çok az kaynakla uyarlanmasını mümkün kılar.

10. Goodhart Yasası yapay zeka kıyaslamalarına uygulandığında hangi pratiği uyarır?

✓ Doğru!

✗ Yanlış. Goodhart Yasası, ölçütün hedef haline gelmesiyle gerçek kapasiteden kopmasını açıklar; bu, kıyaslama kirliliği sorunuyla doğrudan ilişkilidir.

11. Judea Pearl'ün nedensellik merdiveninde "karşı-olgusal" basamak hangi soruya karşılık gelir?

✓ Doğru!

✗ Yanlış. Karşı-olgusal basamak, gerçekleşmemiş alternatifleri — "olmasaydı ne olurdu?" — değerlendirmeyi içerir. Bu, mevcut modellerin en zayıf olduğu alandır.

12. "Veri zehirlenmesi" (data poisoning) hangi aşamada gerçekleşir?

✓ Doğru!

✗ Yanlış. Veri zehirlenmesi, eğitim kümesine saldırganın yerleştirdiği manipüle edilmiş örnekler aracılığıyla gerçekleşir.

13. "Öz denetimli öğrenme" (self-supervised learning) neden büyük dil modellerinin eğitiminde kritik öneme sahiptir?

✓ Doğru!

✗ Yanlış. Öz denetimli öğrenmede veri kendi etiketini üretir; "sonraki kelimeyi tahmin et" görevi insan emeğine gerek kalmadan milyarlarca eğitim örneği sağlar.

14. "Felaket unutma" (catastrophic forgetting) hangi öğrenme senaryosunda en kritik sorundur?

✓ Doğru!

✗ Yanlış. Felaket unutma özellikle tam ince ayarda görülür: yeni görevin ağırlıkları güncellerken önceki genel yetenekleri bozması riski doğar.

15. AlphaGo'nun Lee Sedol'a karşı oynadığı 2. maçtaki 37. hamle neden yapay zeka tarihinde önemlidir?

✓ Doğru!

✗ Yanlış. 37. hamle, hiçbir insan oyunundan türetilemeyeceği için uzmanları şoke etti; pekiştirmeli öğrenmenin insan sezgiisinin ötesinde stratejiler keşfedebildiğini kanıtladı.