Örneklerle Öğretmek
Gözetimli öğrenme: etiketli veri, kayıp fonksiyonu ve gradyan inişinin temelleri.
Bir makine, yalnızca örneklere bakarak doğruyu öğrenebilir mi?
2012 yılında Geoffrey Hinton liderliğindeki Toronto Üniversitesi ekibi, ImageNet görüntü sınıflandırma yarışmasına AlexNet adlı derin sinir ağıyla katıldı. O güne kadar en iyi sistemler yaklaşık %26 hata oranıyla çalışıyordu; AlexNet bu oranı tek seferde %15,3'e indirdi. Model, 1,2 milyon etiketli fotoğraf üzerinde eğitilmişti: her görüntünün yanında "kedi", "köpek" veya "kamyon" gibi bir etiket bulunuyordu. Bu etiketler, ağın her yanlış tahminden ne kadar saptığını ölçen kayıp fonksiyonunu besliyor; gradyan inişi algoritması ise ağırlıkları yavaş yavaş doğru yönde güncelliyordu. AlexNet'in başarısı tesadüf değildi: milyonlarca etiketli örnek olmadan bu sıçrama gerçekleşemezdi. Yarışma sonuçları açıklandığında rakip ekiplerin tepkisi şoke olmuştu; gözetimli öğrenmenin ölçeklendiğinde ne yapabileceğini dünyaya ilk kez bu kadar net biçimde göstermişti.
Gözetimli Öğrenme Nedir?
Gözetimli öğrenme (supervised learning), her eğitim örneğinin bir girdi (input) ile o girdinin doğru çıktısını gösteren bir etiket (label) içerdiği makine öğrenimi yaklaşımıdır. Model, girdi-etiket çiftlerini defalarca işleyerek girdiden çıktıyı tahmin etmeyi öğrenir. "Gözetimli" ifadesi, öğretmenin rolünü üstlenen etiketlerin varlığına işaret eder.
Eğitim döngüsü üç adımdan oluşur: önce model bir tahmin üretir, ardından bu tahmin gerçek etiketle karşılaştırılır ve fark (kayıp — loss) hesaplanır; son olarak gradyan inişi (gradient descent) algoritması, kaybı azaltacak şekilde modelin iç ağırlıklarını günceller. Bu döngü binlerce, hatta milyonlarca kez tekrarlanır.
Kayıp fonksiyonu (loss function): Modelin tahmininin gerçek değerden ne kadar uzakta olduğunu sayısal olarak ifade eden ölçüt. Eğitimin amacı bu değeri en aza indirmektir.
Gözetimli öğrenme iki ana problem türünü kapsar: sınıflandırma (classification) — örneğin bir e-postanın spam olup olmadığına karar verme — ve regresyon (regression) — örneğin bir evin fiyatını tahmin etme. Her ikisinde de temel mantık aynıdır: etiketli örneklerden genelleme yapmak.
Etiketli Verinin Önemi
AlexNet örneği, etiketli verinin kritik rolünü somutlaştırır. ImageNet veri kümesini oluşturmak için Amazon Mechanical Turk platformu aracılığıyla binlerce insan, her görüntüyü manuel olarak sınıflandırdı. Bu etiketleme süreci yıllarca sürdü ve 14 milyondan fazla görüntüyü kapsadı. Etiketlerin kalitesi doğrudan modelin performansını belirler; yanlış veya tutarsız etiketler, modelin yanlış genellemeler öğrenmesine yol açar.
Etiket kalitesinin önemi 2019'da Google'ın tıbbi görüntü projelerinde de gün yüzüne çıktı. Farklı uzman hekimlerin aynı retina görüntüsüne farklı tanı koyduğu durumlarda, hangi etiketin "doğru" olduğuna karar vermek modelin güvenilirliğini doğrudan etkiliyordu. Bu nedenle etiketsiz ya da gürültülü (noisy) veriyle çalışmak, gözetimli öğrenmenin en büyük pratik zorluklarından biri olmaya devam etmektedir.
Aşırı Öğrenme ve Genelleme
Gözetimli öğrenmenin temel tehlikelerinden biri aşırı öğrenmedir (overfitting): model, eğitim verilerini ezberler ancak daha önce görmediği yeni verilerde başarısız olur. Bunu önlemek için araştırmacılar veriyi eğitim (training), doğrulama (validation) ve test kümelerine ayırır. Doğrulama kümesi, modelin genelleme yeteneğini eğitim sırasında izlemek için kullanılır; test kümesi ise modelin hiç görmediği nihai sınav verisidir.
İyi bir model, eğitim verisinde değil test verisinde iyi performans gösterir. Eğitim başarısı tek başına anlamsızdır.
Ders 1 Testi — Örneklerle Öğretmek
Her soruyu dikkatle okuyun ve en doğru yanıtı seçin.
Lab 1 — Gözetimli Öğrenme Keşfi
Yapay zeka asistanıyla etiketli veri, kayıp fonksiyonu ve gradyan inişi üzerine sohbet edin.
Lab Talimatları
Bu laboratuvarda gözetimli öğrenmenin temel mekaniklerini bir yapay zeka asistanıyla tartışacaksınız.
- Asistan size konu hakkında açılış sorusu yöneltecektir. Cevabınızı Türkçe yazın.
- Kayıp fonksiyonu, gradyan inişi veya aşırı öğrenme hakkında kendi sorularınızı sorun.
- AlexNet vakasını kendi sözlerinizle özetlemeyi deneyin; asistan geri bildirim verecektir.
Her Yerde Örüntüler
Yapay sinir ağları veriyi nasıl temsil eder: özellikler, katmanlar ve gizli uzaylar.
Bir sinir ağı "kedi" kavramını nasıl temsil eder?
2015 yılında Google'dan araştırmacılar, DeepDream adlı görselleştirme aracını kamuoyuyla paylaştı. Araç, ImageNet ile eğitilmiş bir sinir ağının iç katmanlarının hangi örüntüleri aradığını ortaya koyuyordu. Sonuçlar şaşırtıcıydı: ilk katmanlar yatay-dikey çizgiler ve renk geçişleri gibi basit kenar örüntülerini tespit ederken, orta katmanlar dokular ve nesne parçacıklarını, son katmanlar ise tam nesneleri temsil ediyordu. Bu hiyerarşik özellik öğrenimi (hierarchical feature learning), araştırmacıların el yapımı özelliklerle yıllarca uğraşarak başaramadığını otomatik gerçekleştiriyordu. DeepDream'in ürettiği psikedelik görüntüler viral oldu ve insanların sinir ağlarının içinde ne döndüğünü ilk kez sezgisel biçimde kavramasına katkı sağladı.
Özellik Hiyerarşisi
Derin sinir ağları (deep neural networks), verideki örüntüleri hiyerarşik olarak temsil eder. Birinci katman pikseller arasındaki ham ilişkileri işlerken; her sonraki katman bir öncekinin çıktısından daha soyut örüntüler türetir. Görüntü tanımada bu hiyerarşi kenarlar → dokular → nesne parçaları → tam nesneler biçiminde ilerler.
Bu özelliği el ile kodlamak yıllar alırdı. Derin öğrenme, bu özellikleri veriden otomatik öğrenir; bu nedenle "temsil öğrenimi" (representation learning) olarak da adlandırılır. Modelin öğrendiği temsillerin kalitesi, nihai başarımı doğrudan belirler.
Model, ham veriden anlamlı özellikler çıkarmayı otomatik öğrenir. Bu, insan mühendisinin özellikleri elle tanımlaması gereken klasik yaklaşımdan köklü biçimde farklıdır.
Gömme Uzayları (Embedding Spaces)
Modern yapay zeka modellerinin merkezinde gömme uzayları (embedding spaces) yatar. Bir gömme, ham veriyi (kelime, görüntü, ses) yüksek boyutlu bir sayı vektörüne dönüştürür. Bu uzayda benzer kavramlar birbirine yakın konumlanır. Word2Vec gibi erken modellerde "kral − erkek + kadın = kraliçe" vektör aritmetiğinin çalışması, anlamın bu uzayda geometrik biçimde kodlandığını gösteriyordu.
Bu ilke dil modellerinde de geçerlidir. GPT gibi büyük dil modelleri, her kelimeyi binlerce boyutlu bir uzayda konumlandırır; bağlam bu uzayda gömmeleri şekillendirir. "Banka" kelimesi "nehir" bağlamında farklı, "para" bağlamında farklı bir konuma taşınır.
- Gömme uzayının boyutu büyüdükçe modelin daha nüanslı ilişkileri temsil etme kapasitesi artar.
- Dikkat mekanizması (attention mechanism), hangi bağlam öğelerinin gömmeyi etkileyeceğini dinamik olarak belirler.
- Uzaydaki mesafe, benzerliği ölçmek için doğrudan kullanılabilir (kosinüs benzerliği).
Ders 2 Testi — Her Yerde Örüntüler
Her soruyu dikkatle okuyun ve en doğru yanıtı seçin.
Lab 2 — Örüntü Temsili Keşfi
Sinir ağlarının veriyi nasıl temsil ettiğini AI asistanıyla derinlemesine keşfedin.
Lab Talimatları
Bu laboratuvarda gömme uzayları ve özellik hiyerarşisi üzerine bir yapay zeka asistanıyla tartışacaksınız.
- Asistanın açılış sorusunu yanıtlayın.
- Kendi bir gömme uzayı analojisi üretmeyi deneyin ve asistanla tartışın.
- "Banka" kelimesinin iki farklı bağlamdaki gömmesini karşılaştırmasını isteyin.
Model Nedir?
Ağırlıklar, parametreler ve eğitilmiş bir modelin gerçekte içerdiği şey.
Eğitilmiş bir model dosyasının içinde tam olarak ne vardır?
2023 yılında Meta, LLaMA adlı büyük dil modelini araştırma lisansıyla yayımladı. Ancak model ağırlıkları kısa sürede sızdırıldı ve 4chan üzerinden herkese açık hale geldi. Bu olay, "model" kavramının ne olduğunu çarpıcı biçimde gündeme taşıdı: Meta'nın milyonlarca dolarlık hesaplama kaynağıyla ürettiği şey, sonuç olarak onlarca gigabayt boyutunda bir ağırlık dosyasıydı. Bu dosya, 7 milyardan 65 milyara kadar sayısal parametre içeriyordu ve eğitim sürecinin tüm öğrenilebilir birikimini temsil ediyordu. Model sızdığında Meta'nın bu bilgiyi gizli tutmaya çalışması teknik olarak anlamsızlaştı; ağırlık dosyası internete bir kez yayıldıktan sonra geri almak imkânsızdı.
Modelin Anatomisi
Bir makine öğrenimi modeli, eğitim sürecinde öğrenilen sayısal ağırlıklar (weights) ve sabit mimari kararları (bias terimleri, katman sayısı, dikkat başlıkları gibi) içerir. Model mimarisi, hangi hesaplamaların yapılacağını tanımlayan bir çerçeve gibidir; ağırlıklar ise bu hesaplamaların içeriğini belirler. Eğitim tamamlandığında bu ağırlıklar dondurulur ve model dağıtıma hazır hale gelir.
GPT-4 gibi büyük bir modelin tahmin edilen parametre sayısı yüz milyarları aşar. Bu parametreler, temel olarak kayan noktalı (floating-point) sayılardır. Her parametre, aktivasyonları ne ölçüde iletip iletmeyeceğini belirler. Eğitim, tüm bu parametrelerin milyarlarca girdi üzerinde en düşük kaybı üretecek değerlere ayarlanması sürecidir.
GPT-2 (2019): ~1,5 milyar parametre. GPT-3 (2020): ~175 milyar. LLaMA-2 (2023): 7B ile 70B arası versiyonlar. Parametre sayısı kapasite için gerekli ama yeterli değildir; eğitim verisi ve prosedürü de kritiktir.
Mimari vs. Ağırlıklar
Aynı mimariyi kullanarak farklı verilerle eğitilmiş iki model, birbirinden çok farklı davranışlar sergileyebilir. Bu, ağırlıkların modelin gerçek "bilgi deposu" olduğunu ortaya koyar. Mimari, beynin yapısal şemasıyken ağırlıklar öğrenilmiş deneyimi temsil eder.
Transformatör mimarisi (transformer architecture), 2017'de Vaswani ve arkadaşlarının "Attention is All You Need" makalesiyle tanıtıldı. O tarihten bu yana BERT, GPT ailesi, T5 ve LLaMA dahil neredeyse tüm büyük dil modelleri bu mimariyi temel alır. Ancak her biri farklı ağırlıklara sahip olduğundan davranışları belirgin biçimde ayrışır.
- Mimari: Katman sayısı, başlık sayısı, bağlam penceresi gibi sabit tasarım kararları.
- Ağırlıklar: Eğitim boyunca optimize edilen, öğrenilmiş sayısal değerler.
- Çıkarım (inference): Eğitilmiş ağırlıkları kullanarak yeni girdilere yanıt üretme süreci.
Ders 3 Testi — Model Nedir?
Her soruyu dikkatle okuyun ve en doğru yanıtı seçin.
Lab 3 — Model İçyapısı Keşfi
Ağırlıklar, parametreler ve model mimarisi hakkında AI asistanıyla derinlemesine konuşun.
Lab Talimatları
Bu laboratuvarda model anatomisini — mimari, ağırlıklar ve çıkarım süreci — bir yapay zeka asistanıyla tartışacaksınız.
- Asistanın açılış sorusunu yanıtlayın.
- GPT-3'ün 175 milyar parametresinin ne anlama geldiğini kendi sözlerinizle ifade edin.
- LLaMA sızıntısının yapay zeka yönetişimi açısından ne gibi sonuçlar doğurduğunu tartışın.
Gözetimsiz ve Pekiştirmeli Öğrenme
Etiket olmadan yapı bulmak; ödül sinyaliyle strateji geliştirmek.
Yapay zeka, kimse öğretmeden de öğrenebilir mi?
2016 yılında DeepMind'ın AlphaGo sistemi, Go oyununun dünya şampiyonu Lee Sedol'u 4-1 yendi. AlphaGo'nun eğitimi iki aşamalıydı: önce insan oyun kayıtlarından gözetimli öğrenme ile temel strateji öğrenildi, ardından sistemin kendisiyle oynadığı milyonlarca oyunda pekiştirmeli öğrenme (reinforcement learning) ile bu strateji çok ötesine taşındı. Kritik olan şu: pekiştirmeli öğrenme aşamasında AlphaGo, insan oyununda görülmemiş hamleler geliştirdi. 37. hamle — özellikle 2. maçta oynanan o hamle — uzmanları şaşkına çevirdi çünkü hiçbir insan oyunundan türetilemezdi. Ödül sinyali yalnızca "oyunu kazandın mı, kaybettin mi?" soruydu; içerik öğrenilmemişti, strateji keşfedilmişti.
Gözetimsiz Öğrenme
Gözetimsiz öğrenme (unsupervised learning), etiket içermeyen veri üzerinde gizli yapıları keşfetmeyi amaçlar. Model, hangi çıktının "doğru" olduğuna dair harici sinyal almadan verideki örüntüleri ve kümeleri bulmaya çalışır. K-means kümeleme, ana bileşen analizi (PCA) ve öz kodlayıcılar (autoencoders) bu yaklaşımın klasik örnekleridir.
Büyük dil modellerinin ön eğitimi teknik olarak gözetimsiz öğrenmenin bir formudur: model, milyarlarca metin belgesinde "bir sonraki kelimeyi tahmin et" göreviyle eğitilir. Bu görev için insan etiketi gerekmez; metnin kendisi doğal etiket görevi görür. Bu nedenle araştırmacılar bu yaklaşımı "öz denetimli öğrenme" (self-supervised learning) olarak adlandırır.
Verinin kendi içindeki yapı, etiket görevi görür. GPT'nin "sonraki kelimeyi tahmin et" görevi bunun en büyük ölçekli örneğidir.
Pekiştirmeli Öğrenme
Pekiştirmeli öğrenme (reinforcement learning — RL), bir etmenin (agent) ortamla etkileşim kurarak deneme-yanılma yoluyla öğrendiği yaklaşımdır. Etmen, her eylem için bir ödül (reward) veya ceza (penalty) alır; hedef, toplam beklenen ödülü en üst düzeye çıkarmaktır. AlphaGo ve sonraki AlphaZero, bu yaklaşımın ne kadar güçlü olabileceğini somutlaştırdı.
Büyük dil modelleri bağlamında pekiştirmeli öğrenme, "İnsan Geri Bildiriminden Pekiştirmeli Öğrenme" (RLHF — Reinforcement Learning from Human Feedback) biçiminde uygulanır. ChatGPT ve Claude gibi modeller, insan değerlendiricilerin tercihlerinden öğrenen bir ödül modeli aracılığıyla ince ayar yapılmıştır. RLHF, modelin yalnızca doğru değil, tercih edilen yanıtlar üretmesini sağlar.
- Etmen (Agent): Kararlar veren ve öğrenen sistem.
- Ortam (Environment): Etmenin etkileşime girdiği bağlam.
- Ödül (Reward): Eylemin ne kadar iyi olduğunu bildiren sinyal.
- Politika (Policy): Durumdan eyleme eşleme — öğrenilen strateji.
Ders 4 Testi — Gözetimsiz ve Pekiştirmeli Öğrenme
Her soruyu dikkatle okuyun ve en doğru yanıtı seçin.
Lab 4 — Pekiştirmeli Öğrenme Keşfi
AlphaGo vakası ve RLHF üzerine AI asistanıyla derinlemesine tartışın.
Lab Talimatları
Bu laboratuvarda gözetimsiz öğrenme ile pekiştirmeli öğrenmenin farkını ve pratikte nasıl uygulandığını bir yapay zeka asistanıyla keşfedeceksiniz.
- Asistanın açılış sorusunu yanıtlayın.
- AlphaZero'nun satranç ve Go'yu aynı anda nasıl öğrendiğini sorun.
- RLHF'nin dil modellerinde nasıl çalıştığını kendi sözlerinizle açıklamaya çalışın.
Veri Sorunu
Önyargı, temsil eksikliği, veri zehirlenmesi ve veri kalitesinin kritik önemi.
Kötü veriyle iyi model inşa etmek mümkün mü?
2018 yılında Reuters, Amazon'un 2014'ten 2017'ye kadar kullandığı otomatik özgeçmiş eleme sisteminin kadın adaylara sistematik olarak düşük puan verdiğini haberleştirdi. Araştırma, sorunun modelin kendisinden değil eğitim verisinden kaynaklandığını ortaya koydu: sistem, son 10 yılda Amazon'a gönderilmiş ve çoğunluğu erkeklerden oluşan geçmiş özgeçmişler üzerinde eğitilmişti. Model bu veriyi "başarılı çalışan" olarak kodlamış; kadın kolejlerine yapılan atıfları veya "kadın" kelimesini içeren metinleri olumsuz sinyaller olarak öğrenmişti. Sonuç olarak Amazon sistemi kullanımdan kaldırdı. Bu vaka, veri önyargısının (data bias) modele nasıl aktarıldığını ve bu önyargının gerçek dünya kararlarına nasıl dönüştüğünü gösteren en belgelenmiş örneklerden biridir.
Veri Önyargısı
Makine öğrenimi modellerindeki önyargıların büyük çoğunluğu model mimarisinden değil, eğitim verisindeki sistematik temsil hatalarından kaynaklanır. Eğer geçmiş veride belirli gruplar eksik temsil ediliyorsa veya tarihsel ayrımcılık yansıtılıyorsa, model bu örüntüleri öğrenir ve yeni durumlara aktarır. Bu duruma dağılım kayması (distributional shift) veya önyargı aktarımı (bias transfer) denir.
Amazon vakasında kritik husus şudur: mühendisler modele "cinsiyete bakma" demişlerse de model, cinsiyetle istatistiksel olarak ilişkili olan diğer özellikleri (belirli üniversiteler, belirli kelimeler) proxy olarak kullandı. Önyargıyı veri temizliğiyle gidermek mümkündür, ancak tüm proxy değişkenlerin tespiti son derece güçtür.
Model, eğitim verisindeki istatistiksel örüntüleri öğrenir — bu örüntüler tarihsel adaletsizlikleri yansıtıyorsa model de bu adaletsizlikleri yeniden üretir.
Veri Zehirlenmesi ve Kalite Sorunları
Eğitim verisi yalnızca önyargı değil, çeşitli kalite sorunlarıyla da karşı karşıyadır. Gürültülü etiketler (noisy labels), veri zehirlenmesi (data poisoning) ve dağılım kayması bunların başında gelir. 2021'de Stanford araştırmacıları, büyük web tarama verisi kümelerinin ciddi miktarda tehlikeli ve yanıltıcı içerik barındırdığını belgeledi; bu veriler üzerinde eğitilen modeller bu içerikleri öğreniyordu.
Veri zehirlenmesi, bir saldırganın modelin eğitim veri kümesine kasıtlı olarak belirli örnekler ekleyerek modelin davranışını manipüle etmesidir. Bu saldırı türü hem açık kaynak veri kümelerini hem de web'den toplanan verileri hedef alabilir. 2022'de araştırmacılar, LAION veri kümesinin yüzde bir kısmını bile değiştirmenin görüntü tanıma modellerinin belirli girdiler için davranışını anlamlı ölçüde etkileyebildiğini gösterdi.
- Temsil eksikliği: Belirli grupların, dillerin veya bağlamların eğitim verinde yetersiz yer alması.
- Geçmiş önyargısı: Tarihsel verinin sistematik ayrımcılığı yansıtması.
- Veri zehirlenmesi: Kasıtlı olarak bozulmuş örneklerin eğitim kümesine eklenmesi.
- Dağılım kayması: Eğitim ve kullanım ortamı arasındaki istatistiksel farklılık.
Ders 5 Testi — Veri Sorunu
Her soruyu dikkatle okuyun ve en doğru yanıtı seçin.
Lab 5 — Veri Önyargısı Analizi
Veri kalitesi, önyargı ve zehirlenme sorunlarını AI asistanıyla derinlemesine inceleyin.
Lab Talimatları
Bu laboratuvarda veri önyargısının gerçek dünya etkilerini ve olası çözümleri bir yapay zeka asistanıyla tartışacaksınız.
- Asistanın açılış sorusunu yanıtlayın.
- Amazon vakasındaki "proxy değişken" sorununu kendi sözlerinizle açıklamaya çalışın.
- Türkiye'deki iş ilanları ya da üniversite sınav verileri gibi yerel bir bağlamda hangi önyargı sorunlarının ortaya çıkabileceğini tartışın.
Ön Eğitim ve İnce Ayar
Büyük ölçekli ön eğitimden göreve özgü uyarlamaya: transfer öğrenimi nasıl çalışır?
Genel amaçlı bir model, özel bir göreve nasıl uyarlanır?
2018 yılında Google, BERT (Bidirectional Encoder Representations from Transformers) modelini yayımladı. BERT, Wikipedia ve BookCorpus üzerinde iki görevle ön eğitim almıştı: kelime doldurma (masked language modeling) ve cümle ardışıklığı tahmini. Bu ön eğitim tamamlandıktan sonra aynı model, üzerine küçük bir sınıflandırıcı eklenerek duygu analizi, soru cevaplama ve doğal dil çıkarımı gibi on bir farklı görevde ince ayar yapıldı. Her görev için yalnızca birkaç bin etiketli örnek yeterliydi — çünkü genel dil anlayışı çoktan ön eğitimde yerleşmişti. BERT, yayımlandığı tarihte on bir NLP kıyaslama testinin tamamında yeni rekor kırdı. Bu, ön eğitim + ince ayar paradigmasının standart hale geldiği dönüm noktasıydı.
Transfer Öğrenimi Paradigması
Ön eğitim (pretraining), büyük ve genel bir veri kümesi üzerinde modelin temel yeteneklerini (dil anlama, görüntü tanıma vb.) kazanmasıdır. İnce ayar (fine-tuning) ise ön eğitimden gelen ağırlıkları başlangıç noktası alarak, çok daha küçük bir göreve özgü veri kümesi üzerinde ek eğitim yapmaktır. Bu iki aşamalı yaklaşım, büyük hesaplama kaynaklarına sahip organizasyonların (Google, OpenAI, Meta) küçük organizasyonların ve araştırmacıların kolayca kullanamayacağı modeller üretmesine ve bu modellerin topluluk tarafından uyarlanmasına imkân tanır.
GPT-3'ün ön eğitimi tahminen 4–12 milyon dolar arası maliyetle gerçekleşti. Aynı modelin ince ayarı birkaç yüz dolara mal olabilir. Transfer öğrenimi bu asimetriyi mümkün kılar.
İnce Ayar Yöntemleri
Tam ince ayar (full fine-tuning), ön eğitimden gelen tüm ağırlıkların göreve özgü veriyle güncellenmesini içerir. Ancak bu yaklaşım hem pahalıdır hem de felaket unutma (catastrophic forgetting) riskini taşır: model yeni görevi öğrenirken önceki genel yeteneklerini kaybedebilir.
Bu sorunu aşmak için daha verimli yaklaşımlar geliştirilmiştir. LoRA (Low-Rank Adaptation), 2021'de Microsoft araştırmacıları tarafından tanıtıldı. LoRA, orijinal ağırlıkları dondurup yalnızca çok daha küçük ek ağırlık matrislerini günceller. Bu sayede bellek ve hesaplama maliyeti dramatik biçimde düşer; 175 milyar parametreli bir modeli birkaç milyon ek parametreyle uyarlamak mümkün hale gelir.
- Tam ince ayar: Tüm ağırlıklar güncellenir; en güçlü ama en maliyetli yöntem.
- LoRA: Düşük boyutlu ek matrisler eklenir; orijinal ağırlıklar değişmez.
- Prefix tuning / Prompt tuning: Yalnızca girdi katmanındaki küçük vektörler optimize edilir.
- Adapter katmanlar: Model içine küçük ek katmanlar eklenir; orijinal ağırlıklar korunur.
Ders 6 Testi — Ön Eğitim ve İnce Ayar
Her soruyu dikkatle okuyun ve en doğru yanıtı seçin.
Lab 6 — Ön Eğitim ve İnce Ayar Keşfi
Transfer öğrenimi stratejilerini ve LoRA'yı AI asistanıyla derinlemesine tartışın.
Lab Talimatları
Bu laboratuvarda ön eğitim ve ince ayar paradigmasını gerçek dünya senaryolarına uygulayan bir yapay zeka asistanıyla çalışacaksınız.
- Asistanın açılış sorusunu yanıtlayın.
- Türkçe bir tıbbi rapor analizi uygulaması için hangi ön eğitim + ince ayar stratejisinin en uygun olacağını tartışın.
- LoRA'nın tam ince ayara kıyasla ne zaman tercih edilmesi gerektiğini açıklamaya çalışın.
Değerlendirme ve Kıyaslamalar
Performans ölçümünün sınırları: kıyaslama kirliliği, test seti sızıntısı ve Goodhart Yasası.
Bir kıyaslama testinde yüksek puan almak gerçek zekâyı kanıtlar mı?
2022'de OpenAI GPT-4 teknik raporunu yayımladığında model, hukuk barosu sınavından üst dilimde geçti, tıp lisans sınavında başarılı oldu ve SAT matematik bölümünde yüksek puan aldı. Bu sonuçlar büyük yankı uyandırdı. Ancak araştırmacılar hemen kritik soruyu sordu: bu sınavların hazırlanma sorularının internet kaynaklarında bulunduğu göz önüne alındığında, GPT-4'ün ön eğitim verisi bu soruları veya çok benzerlerini içermiş olabilir miydi? Test seti sızıntısı (test set contamination) olarak bilinen bu sorun, modelin gerçekte öğrenip öğrenmediğini yoksa eğitim sırasında gördüğü verileri "hatırlayıp hatırlamadığını" ayırt etmeyi son derece güçleştirdi. Carnegie Mellon'dan araştırmacılar 2023'te gerçekten de büyük modellerin birçok bilinen kıyaslama testindeki performansını gizmiş olabileceğini gösteren kanıtlar sundu.
Kıyaslama Kirliliği
Kıyaslama (benchmark), yapay zeka modellerinin belirli bir görevdeki performansını standart bir test kümesi üzerinde ölçen değerlendirme çerçevesidir. GLUE, SuperGLUE, MMLU, HumanEval ve BIG-bench gibi kıyaslamalar alanın "ölçüm standartları" haline gelmiştir. Ancak bu kıyaslamalar kamuya açık olduğundan, çok büyük miktarda interneti tarayan modeller bu test sorularını ön eğitim sırasında görmüş olabilir.
Bu sorun, yapay zeka araştırmasında "kıyaslama kirliliği" (benchmark contamination) olarak anılır. Kirlenmiş kıyaslamalarda yüksek puan almak, gerçek genelleme yeteneğinin değil ezber kapasitesinin göstergesi olabilir. 2023'te açıklanan GPT-4 teknik raporunun bu meseleyi açıkça tartışması, alanın bu sorunun farkında olduğunu gösterir; ancak bağımsız doğrulama hâlâ güçtür.
"Bir ölçüt hedef haline geldiğinde, iyi bir ölçüt olmaktan çıkar." Kıyaslamalarda yüksek puana odaklanmak, modelin gerçek kapasitesini geliştirmek yerine o testi geçmeye optimize edilmesine yol açabilir.
Dürüst Değerlendirme Nasıl Yapılır?
Güvenilir değerlendirme, modelin hiç görmediği verileri kullanmayı, çok boyutlu ölçütler uygulamayı ve tek bir sayıya indirgeme tuzağından kaçınmayı gerektirir. Öne çıkan bazı yaklaşımlar şunlardır:
- Dinamik kıyaslamalar: Test soruları periyodik olarak yenilenir; önceki sorular kamuya açılmaz. BIG-bench ve HELM bu yaklaşımı benimser.
- İnsan değerlendirmesi: Chatbot Arena gibi platformlarda gerçek kullanıcılar modelleri karşılaştırarak tercih bildirir.
- Açıklama isteme (chain-of-thought): Yalnızca nihai cevap değil, akıl yürütme süreci değerlendirilir.
- Dağılım dışı test (out-of-distribution): Model, eğitim dağılımından belirgin biçimde farklı verilerle test edilir.
Ders 7 Testi — Değerlendirme ve Kıyaslamalar
Her soruyu dikkatle okuyun ve en doğru yanıtı seçin.
Lab 7 — Kıyaslama Güvenilirliği Analizi
Model değerlendirmesinin sınırlarını ve dürüst ölçüm yöntemlerini AI asistanıyla keşfedin.
Lab Talimatları
Bu laboratuvarda model değerlendirme yöntemlerinin güçlü ve zayıf yönlerini bir yapay zeka asistanıyla tartışacaksınız.
- Asistanın açılış sorusunu yanıtlayın.
- GPT-4'ün baro sınavından geçmesinin gerçek hukuki muhakeme yeteneğini kanıtlayıp kanıtlamadığını tartışın.
- Goodhart Yasası'nı kendi sözlerinizle bir örnekle açıklayın.
Sınır: Modeller Henüz Neyi Öğrenemez?
Gerçek dünya kausalite, sürekli öğrenme ve güncel araştırmaların açık soruları.
Mevcut dil modelleri nedenselliği anlıyor mu, yoksa korelasyonu mu?
2023 yılında UCLA'dan araştırmacı Judea Pearl — nedensellik (causality) teorisinin öncüsü ve Turing Ödülü sahibi — büyük dil modellerinin gerçek nedensel akıl yürütme yapmadığını, yalnızca istatistiksel korelasyonları takip ettiğini savundu. Pearl'ün argümanı somuttu: bir model "sigara içmek akciğer kanserine yol açar mı?" sorusunu doğru yanıtlayabilir, çünkü bu korelasyon eğitim verisinde sık geçer. Ancak "Tüm insanlar sigara içseydi, akciğer kanseri oranları nasıl değişirdi?" gibi müdahale (intervention) sorularında veya "Bu kişi sigara içmemiş olsaydı kanserden ölür müydü?" biçimindeki karşı-olgusal (counterfactual) sorularda modeller sistematik olarak başarısız olur. Bu ayrım kritiktir: tıp, politika ve güvenlik için yalnızca korelasyonu değil, nedenselliği anlamak şarttır.
Nedensellik Sorunu
Mevcut büyük dil modelleri, korelasyon örüntülerini öğrenmek konusunda son derece güçlüdür; ancak gerçek anlamda nedensel çıkarım yapma yeteneğinden yoksundur. Pearl'ün "nedensellik merdiveni" üç basamak tanımlar: birincisi gözlem (korelasyon görmek), ikincisi müdahale (bir değişkeni değiştirdiğimizde ne olur?), üçüncüsü karşı-olgusal (farklı davransaydı ne olurdu?). Mevcut transformatör modelleri birinci basamakta güçlüdür; ikinci ve üçüncüde sistematik olarak zayıftır.
1. Gözlem: "X ve Y birlikte ne sıklıkla görülür?" — Modeller güçlüdür.
2. Müdahale: "X'i değiştirirsem Y ne olur?" — Modeller zayıftır.
3. Karşı-olgusal: "X olmasaydı Y olur muydu?" — Modeller sistematik olarak başarısız olur.
Diğer Açık Sınırlar
Nedensellik dışında, mevcut modellerin öğrenmekte zorlandığı birkaç temel alan daha vardır:
- Sürekli öğrenme (continual learning): İnsan beyni yeni bilgileri edinirken eskileri koruyabilir. Mevcut modeller ise yeni verilerle güncellenmek istendiğinde felaket unutma sorunuyla karşı karşıya kalır.
- Az örnekli akıl yürütme (few-shot compositional reasoning): Birkaç örnekten tamamen yeni kural bileşimleri türetme, modellerin tutarsız biçimde üstesinden geldiği bir görevdir.
- Fiziksel sezgi: Dil modelleri, gerçek dünya fiziksel olayları hakkında sistematik hatalar yapar — çünkü eğitim verileri gözlemsel fizik deneyimi değil metin içerir.
- Meta-öğrenme: Nasıl öğreneceğini öğrenme ve öğrenme stratejisini görev türüne göre uyarlama yeteneği henüz yetersizdir.
Bu sınırlar, mevcut yapay zekânın güçlü istatistiksel örüntü eşleştiriciler olduğunu ancak genel zekâya (AGI — Artificial General Intelligence) henüz uzak olduğunu gösterir. Alan bu açık soruları çözmeye çalışırken araştırmacılar nedensel temsiller, dünya modelleri ve çevrim içi öğrenme gibi yaklaşımlar geliştirmektedir.
Ders 8 Testi — Modellerin Sınırları
Her soruyu dikkatle okuyun ve en doğru yanıtı seçin.
Lab 8 — Modellerin Sınırlarını Test Etmek
Nedensellik, sürekli öğrenme ve yapay zekanın açık sorunlarını AI asistanıyla keşfedin.
Lab Talimatları
Bu laboratuvarda mevcut yapay zeka modellerinin gerçek sınırlarını bir yapay zeka asistanıyla derinlemesine araştıracaksınız.
- Asistanın açılış sorusunu yanıtlayın.
- Karşı-olgusal bir soru sorun ve asistanın nasıl yanıt verdiğini gözlemleyin.
- AGI (Genel Yapay Zeka) ile mevcut modeller arasındaki temel farkın ne olduğunu tartışın.
Modül Testi — Yapay Zeka Nasıl Öğrenir
15 soru · Tüm dersleri kapsar · Yanıtlarınızı seçtikten sonra puanınızı görün.