Bilgisayar Yardımcısı Nedir?
Temel kavramlar: Yapay zekayı tanımlamak, büyüden ve insan düşüncesinden ayırt etmek.
Bir makine ile bir program arasındaki gerçek fark nedir?
1997 yılında IBM'in Deep Blue bilgisayarı, satranç dünya şampiyonu Garry Kasparov'u altı oyunluk bir maçta 3,5–2,5 yenerek tarihe geçti. Kasparov, maç sonrası "makinenin insan gibi sezgiyle oynadığını" iddia etti. Ancak araştırmacılar, Deep Blue'nun herhangi bir "sezgi" kullanmadığını; saniyede 200 milyon pozisyonu değerlendiren kural tabanlı bir arama ağacı çalıştırdığını belgeledi. Satranç tahtasındaki büyü yoktu — yalnızca inanılmaz hızlı hesaplama vardı. Bu ayrım, yapay zekanın ne olduğunu anlamak için kritik öneme sahiptir.
Bilgisayar Programı ile Yapay Zeka Arasındaki Fark
Geleneksel bir bilgisayar programı, geliştiricinin önceden yazdığı kurallara göre çalışır. Bir kural varsa uygular; yoksa durur. Bu programlar son derece güvenilirdir çünkü her koşulda ne yapacakları bellidir. Ancak öğrenmezler: yeni bir durumla karşılaştıklarında eski kurallarını değiştiremezler.
Yapay zeka (YZ) ise farklı bir yaklaşımı benimser. Kural yazmak yerine, büyük miktarda veriden örüntüler (pattern) öğrenir. Bir spam filtresini düşünün: geleneksel program "şu kelimeler varsa spam say" kuralıyla çalışır; YZ tabanlı filtre ise milyonlarca e-postayı inceleyerek spam'in nasıl göründüğünü kendisi çıkarır ve yeni spam biçimlerine uyum sağlar.
Yapay Zeka Büyü Değildir
Deep Blue örneği bize önemli bir ders verir: bir makinenin olağanüstü performans sergilemesi, onun "düşündüğü" anlamına gelmez. YZ sistemleri, matematiksel işlemler gerçekleştiren yazılımlardır. Bu işlemler çok karmaşık olabilir, ancak temelde veriyi dönüştürmekten ibarettir.
Yapay zeka; deneyimden öğrenebilen, kalıpları tanıyabilen ve insan müdahalesi olmaksızın kararlar üretebilen yazılım sistemlerinin genel adıdır. Ancak bu öğrenme, biyolojik bir zihnin çalışmasından temelden farklıdır.
Bir YZ sistemi çıktı ürettiğinde, bu çıktı arka planda çalışan matematiksel fonksiyonların sonucudur. Sisteme "sihirli" görünen, onun büyük veriyi insanın aklının kavrayamayacağı hızda işleyebilmesidir — anlama kapasitesi değil.
İnsan Düşüncesiyle Farklar
İnsan beyninin öğrenmesi ile makine öğrenimi arasında köklü farklar vardır. İnsan, birkaç örnekten genelleme yapabilir: bir çocuk iki-üç köpek gördükten sonra köpeği tanımayı öğrenir. Bir YZ modeli ise aynı kalite düzeyine ulaşmak için on binlerce, hatta milyonlarca görüntüye ihtiyaç duyabilir.
- İnsanlar bağlamı ve anlamı kavrar; YZ sistemleri istatistiksel korelasyonlar (birlikte görülme örüntüleri) üretir.
- İnsanlar az veriyle yeni duruma uyum sağlar; çoğu YZ modeli dağılım kayması (distribution shift) karşısında bozulur.
- İnsanların bilinçli deneyimleri vardır; YZ sistemlerinin "içsel deneyim" sahibi olduğuna dair hiçbir bilimsel kanıt bulunmamaktadır.
- İnsanlar soru sorar, merak eder; YZ sistemleri yalnızca verilen girdiye yanıt üretir.
Ders 1 — Kısa Sınav
Bilgisayar yardımcısı ve yapay zeka tanımı üzerine 3 soru.
🧪 Lab 1: YZ mi, Program mı?
Bu laboratuvarda, yapay zeka ile geleneksel yazılım arasındaki farkı keşfedeceksiniz. Aşağıdaki YZ asistanı size bir soru soracak; yanıtlarınız üzerinden kavramı birlikte derinleştireceksiniz.
- Asistanın açılış sorusunu okuyun ve düşüncelerinizi paylaşın.
- En az 3 yanıt vererek tartışmayı ileri taşıyın.
- Deep Blue örneğini ya da farklı bir gerçek YZ uygulamasını analiz etmeye çalışın.
Dünyamızdaki YZ Araçları
Gerçek YZ uygulamaları: öneri sistemlerinden tıbbi görüntü analizine.
Hangi sektörde YZ en büyük dönüşümü yarattı?
2012 yılında Google'ın X Lab'ı, "Google Brain" projesi kapsamında 16.000 CPU kullanarak bir sinir ağını yalnızca YouTube videolarından eğitti. Ağa hiçbir etiket verilmedi. Sonuç çarpıcıydı: model, herhangi bir insan yönlendirmesi olmaksızın "kedi" kavramını keşfetti. Bu, YZ'nin büyük veriyi gözetimsiz olarak işleyebildiğinin ilk büyük ölçekli kanıtıydı ve derin öğrenme (deep learning) çağını fiilen başlattı. Google, bu araştırmayı 2012 yılında yayımladı; bugün YouTube'un içerik öneri motoru aynı mimarinin devamından türemektedir.
Öneri Sistemleri
Netflix, 2009 yılında "Netflix Prize" yarışmasını düzenledi: kullanıcı film önerilerini %10 iyileştirecek algoritmayı geliştiren ekibe 1 milyon dolar ödül verilecekti. BellKor's Pragmatic Chaos ekibi bu ödülü kazandı. Bugün Netflix'in öneri motoru, kullanıcı seyretme sürelerini, duraklatma noktalarını ve benzer profillerin tercihlerini bir arada değerlendirerek her kullanıcıya ayrı bir "kişisel katalog" sunar. Şirket, bu sistemin yıllık 1 milyar doların üzerinde kayıptan kurtardığını açıkladı.
Türkiye'den bir örnek: Trendyol'un ürün öneri motoru, kullanıcıların sepet geçmişi ve göz atma davranışları üzerinden gerçek zamanlı kişiselleştirme uygular. Bu sistem doğrudan satış dönüşüm oranlarını etkiler.
Tıbbi Görüntü Analizi
2017 yılında Stanford Üniversitesi'nden araştırmacılar, 129.450 klinik görüntü üzerinde eğittikleri bir derin öğrenme modelinin deri kanseri tespitinde dermatologlarla karşılaştırılabilir doğruluk elde ettiğini Nature dergisinde yayımladı. Model, 21 alanında uzman dermatologun katıldığı testlerde benzer hassasiyet (sensitivity) ve özgüllük (specificity) değerleri gösterdi. Ancak araştırmacılar bir sınırı da açıkça belirtti: model, fotoğrafta bulunmayan bağlamsal bilgiyi (hastanın yaşı, cilt altı doku yapısı) değerlendiremiyordu.
YZ araçlarının klinik ortamda kullanımı, etkinliklerinin bilimsel olarak doğrulanmasını gerektirir. Tek bir akademik sonuç, klinik dağıtım için yeterli değildir.
Dil, Ses ve Görüntü Uygulamaları
2016 yılında Google, makine çevirisi altyapısını kural tabanlı sistemden Sinir Ağı Makine Çevirisi'ne (Neural Machine Translation — NMT) geçirdi. Tek bir gecede çeviri kalitesindeki iyileşme, önceki on yıldaki tüm kümülatif iyileşmeden büyüktü. Benzer dönüşümler konuşma tanımada da yaşandı: Baidu'nun 2015'te yayımladığı Deep Speech 2 modeli, belli koşullarda gürültülü ortamlarda insanı geride bıraktı.
- Tıbbi görüntüleme: Google DeepMind'ın 2018 tarihli göz hastalığı tespiti (Moorfields Eye Hospital iş birliği)
- Tarımsal tahmin: Microsoft'un FarmBeats projesi, sensör ve YZ kombinasyonuyla mahsul verimini optimize eder
- İklim modelleme: DeepMind'ın GraphCast modeli, 10 günlük hava tahminini geleneksel modellerden daha hızlı üretir
Ders 2 — Kısa Sınav
Gerçek dünya YZ uygulamaları üzerine 3 soru.
🧪 Lab 2: YZ Nerede Kullanılıyor?
Bu laboratuvarda, günlük hayatınızda ya da çalıştığınız sektörde hangi YZ uygulamalarının mevcut olduğunu keşfedeceksiniz.
- Asistanın size yönelteceği soruyu yanıtlayın.
- Kendi deneyimlerinizden veya okuduklarınızdan somut örnekler verin.
- En az 3 mesaj alışverişi yaparak tartışmayı derinleştirin.
YZ Bazen Yanılır
Halüsinasyon, önyargı ve dağılım kayması: YZ hatalarının gerçek boyutları.
Bir YZ hatası ne zaman basit bir bug olmaktan çıkar?
2018 yılında Amazon, işe alım süreçlerini otomatize etmek amacıyla geliştirdiği YZ sistemini sessiz sedasız hizmetten çekti. Reuters'ın haberine göre sistem, son on yılda işe alınan çalışanların özgeçmişlerini analiz ederek öğrenmişti. Ancak bu veriler, teknoloji sektöründeki tarihi cinsiyet dengesizliğini yansıtıyordu. Sistem, "yönetmek" (managed) veya "yürütmek" (execute) gibi fiillerin kadın başvurularında daha az geçtiğini fark etmiş; iki yıllık bir eğitim boyunca kadın adaylara sistematik olarak daha düşük puan vermişti. Amazon sistemi kullanıma sokmadan iptal etti; ancak bu olay, eğitim verisindeki önyargının model çıktısına nasıl yansıyabileceğinin kritik örneği oldu.
Önyargı: Veriden Modele Geçen Hata
Amazon vakası, YZ hatalarının en tehlikeli biçimini gözler önüne serer: önyargı (bias). Model teknik olarak doğru çalışıyordu — geçmiş verideki örüntüyü mükemmel biçimde öğrendi. Sorun, geçmiş verinin kendisinin önyargılı olmasıydı. Model, "bu tür insanlar tarihte işe alındı" örüntüsünü, "bu tür insanları işe almalıyız" kuralına dönüştürdü.
Eğitim verisi toplumsal eşitsizlikleri, tarihi ayrımcılıkları veya örnekleme hatalarını içerdiğinde, model bu hataları bir "kural" olarak öğrenir ve yeni kararlarında uygular.
Halüsinasyon: Olgusal Olmayan Çıktılar
2023 yılında ABD'de görülen Mata v. Avianca davasında iki avukat, içtihat araştırması için ChatGPT kullandı. ChatGPT, hiç var olmayan mahkeme kararlarını — gerçekçi görünen case numaraları ve atıflarla birlikte — üretip sundu. Federal hâkim, avukatları 5.000 dolar ceza ile cezalandırdı. Bu olay, büyük dil modellerinin (LLM) "halüsinasyon" adı verilen davranışını kamuoyuna taşıdı: modeller, yüksek güvenle tamamen yanlış ya da uydurma bilgi üretebilir.
Halüsinasyon, bir yazılım hatası değil; dil modellerinin çalışma biçiminin doğasında bulunan bir özelliktir. Model, dil kalıplarını taklit ederek çıktı üretir — gerçek dünya doğrulaması yapmaz.
Dağılım Kayması ve Kapsam Dışı Durumlar
2020'de ABD genelinde kullanılan Optum'un hasta risk skorlama algoritması, ırksal ayrımcılık içerdiği gerekçesiyle incelemeye alındı. Science dergisinde yayımlanan araştırma, sistemin siyahi hastaları, aynı hastalık yüküne sahip beyaz hastalarla karşılaştırıldığında yaklaşık %36 daha az riskli olarak sınıflandırdığını ortaya koydu. Sorun, algoritmanın "gelecekteki sağlık harcaması" değişkenini kullandığıydı — bu değişken tarihi erişim eşitsizliklerini yansıtıyordu.
- Modeller, eğitildikleri veri dağılımından sapan durumlarda beklenmedik biçimde başarısız olur.
- Performans ölçütleri ortalama başarıyı gösterir; kenar vakaları (edge cases) gizlenebilir.
- Yüksek riskli alanlarda (tıp, hukuk, finans) YZ hatalarının insan denetiminden geçirilmesi zorunludur.
Ders 3 — Kısa Sınav
YZ hataları, önyargı ve halüsinasyon üzerine 3 soru.
🧪 Lab 3: Hatayı Tespit Et
Bu laboratuvarda YZ hatalarını kategorize etmeyi ve gerçek vakalar üzerinde analiz yapmayı öğreneceksiniz.
- Asistanın sorusunu yanıtlayın.
- Amazon, Optum veya Avianca vakalarından birini seçerek hatayı sınıflandırın: Önyargı mı? Halüsinasyon mu? Dağılım kayması mı?
- En az 3 yanıt vererek analizi derinleştirin.
YZ Nasıl Öğrenir?
Makine öğrenmesinin üç biçimi: gözetimli, gözetimsiz ve pekiştirmeli öğrenme.
Bir makine etiket olmadan kavram öğrenebilir mi?
2016 yılında DeepMind'ın AlphaGo sistemi, Go oyunu dünya şampiyonu Lee Sedol'u 4-1 yendi. AlphaGo'nun çekirdeğinde, ne bir insan tarafından kodlanmış strateji kitabı ne de kural seti bulunuyordu. Sistem, milyonlarca amatör oyun üzerinde eğitilerek sonra kendi kendine oynadı — pekiştirmeli öğrenme (reinforcement learning) ile her galibiyetten puan kazandı, her yenilgiden puan kaybetti. Özellikle 37. hamle: hiçbir insan ustanın yapmayacağı bu hamle, insan değerlendirmesine göre "hata" görünüyordu; ancak oyunun gidişatını sonunda AlphaGo lehine döndürdü. Sistem, insan eğitmenlerin öğretemeyeceği bir strateji geliştirmişti.
Gözetimli Öğrenme
Gözetimli öğrenmede (supervised learning) her eğitim örneği bir girdi-çıktı çiftiyle etiketlenmiştir. Model, girdi ile doğru etiket arasındaki ilişkiyi öğrenir. Eğitim süresince modelin çıktısı ile doğru etiket arasındaki fark (kayıp — loss) hesaplanır ve geri yayılım (backpropagation) algoritmasıyla model parametreleri güncellenir.
100.000 e-postanın her birine "spam" veya "spam değil" etiketi yapıştırılmış. Model bu çiftlerden öğrenerek yeni e-postaları sınıflandırır. Etiket kalitesi, model kalitesini doğrudan belirler.
Gözetimsiz Öğrenme
Gözetimsiz öğrenmede (unsupervised learning) etiket yoktur. Model, ham veriden yapıları kendisi keşfeder. Google Brain'in kedi deneyi buna örnektir: YouTube videolarından insan müdahalesi olmadan kavram kümesi oluştu. Bu yaklaşım, etiketlemenin pahalı ya da olanaksız olduğu büyük veri yığınları için idealdir.
Kümeleme (clustering), boyut indirgeme (dimensionality reduction) ve üretici modeller (generative models) bu kategoriye girer. GPT tarzı dil modellerinin ön eğitimi de temel olarak gözetimsiz bir süreçtir: model, sonraki kelimeyi tahmin etmeyi öğrenir.
Pekiştirmeli Öğrenme
Pekiştirmeli öğrenmede (reinforcement learning — RL) bir ajan, çevresiyle etkileşime girerek deneme-yanılma yoluyla öğrenir. Her adımda bir ödül (reward) sinyali alır. AlphaGo'nun 37. hamlesi, RL sistemlerin eğitim verisi dışında özgün stratejiler geliştirebileceğini gösterir.
- İnsan geri bildirimiyle pekiştirmeli öğrenme (RLHF — Reinforcement Learning from Human Feedback): ChatGPT gibi modellerin ince ayarında kullanılır
- Oyun ortamları: Atari oyunları, satranç, go
- Robotik kontrol: gerçek fiziksel ortamlarda hareket optimizasyonu
Ders 4 — Kısa Sınav
Makine öğrenmesi türleri üzerine 3 soru.
🧪 Lab 4: Öğrenme Türünü Seç
Bu laboratuvarda, belirli bir probleme hangi öğrenme türünün uygun olduğunu tartışacaksınız.
- Asistanın size sunacağı senaryoyu okuyun.
- Gözetimli, gözetimsiz veya pekiştirmeli öğrenmeden hangisinin daha uygun olduğunu gerekçelendirin.
- En az 3 mesaj alışverişi yaparak analizi tamamlayın.
YZ Nasıl "Düşünür"?
Yapay sinir ağları, katmanlar ve temsil öğrenimi — içeride neler olur?
Bir sinir ağı bir kavramı nasıl "görür"?
2013 yılında Google araştırmacıları, büyük bir metin külliyatı üzerinde eğitilen Word2Vec modelinde çarpıcı bir özellik keşfetti. Modelde vektör aritmetiği uygulandığında "kral − erkek + kadın ≈ kraliçe" denkliği ortaya çıkıyordu. Bu, modelin kelimeleri rastgele kod sayılarına değil, kavramsal ilişkileri yansıtan geometrik konumlara (vektörlere) dönüştürdüğünü gösterdi. Söz konusu "anlam uzayı", modelin hiçbir zaman "kral nedir" sorusu için öğretilmediği hâlde sistematik ilişkileri istatistiksel örüntüden çıkardığını ortaya koydu. Bu keşif, modern LLM'lerin altında yatan temsil öğreniminin (representation learning) temelini oluşturur.
Yapay Sinir Ağlarının Yapısı
Yapay sinir ağı (YSA — Artificial Neural Network), birbirine bağlı düğümlerden (nöronlardan) oluşan katmanlı bir yapıdır. Girdi katmanı ham veriyi alır; gizli katmanlar (hidden layers) bu veriyi kademeli dönüşümlerle işler; çıktı katmanı sonucu üretir. Her bağlantının bir ağırlığı (weight) vardır ve eğitim sürecinde bu ağırlıklar güncellenir.
Bir kedi fotoğrafını sınıflandıran ağda ilk katmanlar kenar ve köşeleri, orta katmanlar gözler ve kulakları, son katmanlar ise "kedi" kavramının bütününü temsil eden desenleri tanır. Her katman, bir öncekinin ürettiği özetler üzerine inşa eder.
Temsil Öğrenimi
Geleneksel makine öğrenmesinde mühendisler, veriyi elle tasarlanan özelliklerle (feature engineering) temsil ederdi. Derin öğrenme bu adımı otomatize eder: model, ham veriden en yararlı temsilleri kendisi çıkarır. Word2Vec bunun dil versiyonudur; evrişimli sinir ağları (CNN — Convolutional Neural Networks) ise görüntülerde bunu uygular.
Temsil öğrenimi, YZ'yi "büyülü" görünmesine yol açan unsurlardan biridir. Ancak temelde bu, yüksek boyutlu bir veri uzayında geometrik dönüşüm yapmaktan ibarettir.
Yorumlanabilirlik Sorunu
Derin sinir ağlarının milyonlarca hatta milyarlarca parametresi olabilir. Bu, modelin belirli bir kararı neden verdiğini tam olarak açıklamayı güçleştirir — bu soruna "kara kutu" (black box) problemi denir. 2016'dan bu yana büyüyen XAI (Explainable AI — Açıklanabilir Yapay Zeka) araştırma alanı, bu sorunu çözmeyi amaçlar.
- LIME (Local Interpretable Model-Agnostic Explanations): belirli bir tahmin için yerel açıklama üretir
- SHAP (SHapley Additive exPlanations): her özelliğin karara katkısını ölçer
- Dikkat haritaları (attention maps): transformer modellerinde hangi girdinin öne çıktığını görselleştirir
Ders 5 — Kısa Sınav
Sinir ağları ve temsil öğrenimi üzerine 3 soru.
🧪 Lab 5: Sinir Ağını Açıkla
Bu laboratuvarda, sinir ağlarının nasıl çalıştığını kendi sözlerinizle ifade etmeyi ve yorumlanabilirlik sorununu tartışmayı öğreneceksiniz.
- Asistanın sorusunu yanıtlayın.
- Temsil öğrenimi ya da kara kutu problemini kendi alanınızdan bir örnekle ilişkilendirin.
- En az 3 alışveriş yaparak tartışmayı ilerletin.
LLM, Transformer ve Ortaya Çıkış
Dikkat mekanizması, ölçek ve beklenmedik yetenekler: büyük dil modellerinin anatomisi.
Model büyüdükçe neden yeni yetenekler "kendiliğinden" ortaya çıkıyor?
2022 yılında Google Research ve Stanford araştırmacıları, "Büyük Dil Modellerinin Ortaya Çıkan Yetenekleri" başlıklı bir makale yayımladı. Çalışma, modellerin belirli bir parametre eşiğini aştığında — küçük modellerden tahmin edilemeyen — yeni görevleri ani bir sıçramayla yerine getirebildiğini ortaya koydu. Örneğin, GPT-3 benzeri modeller belirli ölçeğin altında çok basamaklı aritmetiği neredeyse rastgele çözüyordu; ölçek eşiğini geçtikten sonra doğruluk oranı aniden %30'dan %80'in üzerine fırladı. Bu "ortaya çıkış" (emergence) fenomeni, YZ topluluğunun hem heyecanını hem de endişesini tetikledi: hangi yeteneklerin ne zaman ortaya çıkacağı önceden tahmin edilemiyor.
Transformer Mimarisi
2017 yılında Google Brain ekibi "Attention Is All You Need" başlıklı makaleyi yayımladı. Bu makale, dil işlemede devrim yaratan Transformer mimarisini tanıttı. Transformer'ın özündeki yenilik, öz-dikkat (self-attention) mekanizmasıdır: model bir cümledeki her kelimenin diğer tüm kelimelerle ilişkisini paralel olarak hesaplar. Geleneksel tekrarlayan ağların (RNN) sıralı işleme kısıtlaması ortadan kalktı; bu da büyük ölçekli paralel eğitimi mümkün kıldı.
"Banka nehir kenarındaydı" cümlesinde model, "banka" kelimesinin "nehir" ile ilişkisini yüksek dikkat puanıyla kodlar ve "mali kurum" anlamını değil "kıyı" anlamını seçer. Bu bağlamsal ağırlıklandırma, Transformer'ın anlama gücünün temelidir.
Büyük Dil Modelleri (LLM)
Büyük Dil Modeli (Large Language Model — LLM), Transformer mimarisinin üzerine inşa edilmiş, milyarlarca parametre içeren ve internet ölçeğinde metin verisiyle eğitilmiş bir modeldir. GPT-4, Claude, Gemini bu kategoridedir. LLM'ler, temel olarak bir sonraki tokeni (en küçük metin birimi) tahmin etmeyi öğrenir; bu basit görev, ölçekle birlikte son derece karmaşık yeteneklere dönüşür.
GPT-3 (2020): 175 milyar parametre, 570 GB metin verisi. GPT-4 (2023): parametre sayısı açıklanmadı; tahminler 1 trilyon civarında.
Ortaya Çıkış ve Öngörülemeyen Yetenekler
Ortaya çıkış (emergence), fizik ve biyolojide uzun süredir bilinen bir kavramdır: bireysel bileşenlerden tahmin edilemeyen niteliklerin bütünte oluşması. YZ bağlamında bu, parametre sayısı ve veri miktarı artırıldığında yeni görevlerin doğrusal olmayan bir sıçramayla mümkün hale gelmesi anlamına gelir. Bu fenomenin kritik sonucu: mevcut modellerin yeteneklerine bakarak gelecek modellerin tüm yeteneklerini öngörmek olanaklı değildir.
- Çok basamaklı akıl yürütme: küçük modellerden beklenmedik biçimde ortaya çıkar
- Az örnekle öğrenme (few-shot learning): birkaç örnek gösterilerek yeni görevi çözmek
- Zincir düşünme (chain-of-thought): adım adım akıl yürütmeyi kendiliğinden üretmek
Ders 6 — Kısa Sınav
LLM, Transformer ve ortaya çıkış üzerine 3 soru.
🧪 Lab 6: Transformer'ı Keşfet
Bu laboratuvarda dikkat mekanizmasını ve ortaya çıkış kavramını somut örnekler üzerinde tartışacaksınız.
- Asistanın sorusunu yanıtlayın.
- "Banka" gibi çok anlamlı bir kelimeyi ele alarak dikkat mekanizmasının nasıl çalışabileceğini açıklayın.
- En az 3 alışveriş yaparak kavramı pekiştirin.
YZ Tarihi — Karar Anları
Yapay zekanın tarihi bir zaman çizelgesi değil, yapılan tercihler ve bunların sonuçlarıdır.
YZ tarihinde hangi karar bugünü en çok şekillendirdi?
2012 yılında Toronto Üniversitesi'nden Geoffrey Hinton, Ilya Sutskever ve Alex Krizhevsky'nin AlexNet modeli, ImageNet görüntü tanıma yarışmasında hata oranını bir önceki yılın kazananına kıyasla %26,2'den %15,3'e indirdi. Bu sadece bir iyileşme değil, alan tarihindeki en büyük tek yıllık sıçramaydı. Karar noktası şuydu: Hinton ve ekibi, GPU'ları sinir ağı eğitiminde kullanmayı seçmişti — o dönemde ana akım araştırmacılar bu yaklaşımı ciddiye almıyordu. Google, ertesi yıl Hinton'ın şirketini 44 milyon dolara satın aldı. Bu tercih, bugünkü tüm büyük dil modellerinin temelini attı.
1956: Yapay Zeka Alanının Kuruluşu
John McCarthy, Marvin Minsky, Claude Shannon ve diğer araştırmacılar 1956'da Dartmouth Konferansı'nı düzenledi. Bu toplantıda "yapay zeka" terimi resmileşti. Kritik karar: YZ'nin sembolik, kural tabanlı bir yaklaşımla inşa edileceği ön görüsü. Bu paradigma on yıl boyunca araştırma gündemini belirledi ve sonunda iki YZ kışı'na (fonların kesildiği dönemler) yol açtı. Öğrenen sistemlerin terk edilmesi, bugün yeniden fark ettiğimiz maliyeti gizledi.
1986: Geri Yayılımın Yeniden Keşfi
Rumelhart, Hinton ve Williams'ın 1986 tarihli makalesi, geri yayılım (backpropagation) algoritmasını çok katmanlı sinir ağlarına başarıyla uyguladı. Karar noktası: bu algoritmanın varlığına rağmen, araştırma topluluğunun büyük çoğunluğu sinir ağlarını pratik kabul etmedi. Destek Vektör Makineleri (SVM) 1990'larda ana akım oldu; sinir ağları marjinalde kaldı. Hinton ve ekibinin bu yola devam etme kararı, 2012'deki patlamayı mümkün kıldı.
Tarihte tercih edilen yaklaşımlar, gelecekteki olasılıkları kısıtlar. 1990'larda sinir ağlarından uzaklaşılması, on yıl boyunca derin öğrenme araştırmalarının finansmansız kalmasına yol açtı.
2015: OpenAI'nin Kuruluşu ve Musk'ın Ayrılışı
Elon Musk, Sam Altman ve diğerleri, YZ'yi tek bir şirketin tekelinden korumak amacıyla OpenAI'yi kâr amacı gütmeyen bir kuruluş olarak kurdu. 2018'de Musk, yönetim kurulundan ayrıldı; gerekçe olarak Tesla ile çıkar çatışmasını öne sürdü. Ancak ilerleyen dönemde OpenAI 2019'da "sınırlı kâr" modeline geçti ve Microsoft'tan 13 milyar dolar yatırım aldı. Kurucuların "güvenli ve açık YZ" vizyonu ile piyasa gerçekliği arasındaki bu gerilim, bugün YZ alanındaki açık kaynak ve ticari dağıtım tartışmalarında belirleyici olmaya devam ediyor.
Ders 7 — Kısa Sınav
YZ tarihi ve karar noktaları üzerine 3 soru.
🧪 Lab 7: Tarihsel Kararı Değerlendir
Bu laboratuvarda YZ tarihindeki kritik karar noktalarını analiz edeceksiniz.
- Asistanın sorusunu yanıtlayın.
- AlexNet, OpenAI'nin kuruluşu veya 1986 geri yayılımı kararlarından birini seçerek "farklı tercih edilseydi ne olurdu?" sorusunu tartışın.
- En az 3 mesaj alışverişi yapın.
Ölçekleme Yasaları, Hizalama ve AGI
Ölçekleme yasaları nereye işaret ediyor? Hizalama problemi neden çözülmesi gereken en zorlu görevdir?
Daha büyük model her zaman daha iyi mi demektir?
2020 yılında OpenAI araştırmacıları, "Büyük Dil Modelleri için Ölçekleme Yasaları" başlıklı bir makale yayımladı. Makale, model performansının parametre sayısı, veri miktarı ve hesaplama bütçesiyle öngörülebilir bir güç yasasına göre iyileştiğini gösterdi. Pratik sonuç: bir sonraki modeli eğitmeden önce performansı matematiksel olarak tahmin etmek mümkündü. Bu bulgu, 2022'de Hoffmann ve ekibinin "Chinchilla" makalesiyle genişletildi; söz konusu çalışma, optimal eğitim için parametre ve veri miktarının eşit oranlarda ölçeklenmesi gerektiğini ortaya koydu. Bu iki makale, bugün hangi modellerin nasıl eğitileceğine dair endüstri kararlarını doğrudan şekillendiriyor.
Ölçekleme Yasaları
Ölçekleme yasaları (scaling laws), model kaybının parametre sayısı, eğitim verisi miktarı ve hesaplama gücüyle güç yasası ilişkisi içinde olduğunu gösterir. Bu, YZ'nin "büyük" olmaya doğru sistematik baskı altında olduğu anlamına gelir: çünkü büyümek tahmin edilebilir biçimde işe yarar. Ancak bu baskının sınırları var: Chinchilla çalışması, çoğu büyük modelin orantısız biçimde veri az, parametre fazla eğitildiğini gösterdi.
Optimal eğitim için parametre sayısını iki katına çıkardığınızda, eğitim tokeni sayısını da iki katına çıkarmanız gerekir. Deepmind'ın 70 milyar parametreli Chinchilla modeli, 540 milyar parametreli Gopher'dan daha az parametreyle ama daha fazla veriyle benzer performans elde etti.
Hizalama Problemi
Hizalama (alignment), bir YZ sisteminin insan değerleri ve niyetleriyle tutarlı biçimde davranmasını sağlama problemidir. Bu sorun teorik değil pratiktir: RLHF ile ince ayar yapılmış modeller bile, eğitim dağılımından uzaklaştıkça zararlı, yanıltıcı veya öngörülemeyen çıktılar üretebilir. Anthropic, hizalama araştırmasını merkeze alan bir şirket olarak Claude modelini bu motivasyonla geliştirdi.
2023 yılında yayımlanan "Model Spesifikasyonu" yaklaşımı, modelin nasıl davranması gerektiğini açık belgelerle tanımlamayı önerdi. Ancak bu belgelerin modele fiilen nasıl "öğretileceği" aktif araştırma konusudur.
AGI: Tanım ve Tartışma
Genel Yapay Zeka (Artificial General Intelligence — AGI), herhangi bir entelektüel görevde insanla karşılaştırılabilir düzeyde performans gösterebilen bir sistem olarak tanımlanır. Ancak bu tanımın kendisi tartışmalı: OpenAI, Google DeepMind ve Anthropic farklı tanımlar kullanır. OpenAI'nin 2023 tarihli AGI tanımı "çoğu ekonomik olarak değerli görevi yapabilme" eşiğini kullanır; bu operasyonel bir tanımdır ve "anlama"yı içermez.
- AGI'nin ne zaman gerçekleşeceğine dair tahminler: 2030 ile "hiçbir zaman" arasında değişiyor
- Hizalanmamış bir AGI'nin riskleri: Stuart Russell'ın "insan uyumlu YZ" çerçevesi, bu riski temel araştırma sorusu olarak ele alıyor
- Yönetişim boşluğu: uluslararası AGI düzenlemesi için bağlayıcı bir çerçeve henüz mevcut değil
Ders 8 — Kısa Sınav
Ölçekleme yasaları, hizalama ve AGI üzerine 3 soru.
🧪 Lab 8: Hizalama ve AGI'yi Tartış
Bu laboratuvarda ölçekleme baskıları, hizalama riski ve AGI tanımlarını eleştirel bir perspektiften değerlendireceksiniz.
- Asistanın açılış sorusunu yanıtlayın.
- Ölçekleme yasaları, hizalama sorunu veya AGI tanımından birini seçerek kendi konumunuzu gerekçelendirin.
- En az 3 alışveriş yaparak tartışmayı ilerletin.
📋 Modül Testi
Modül 1 — Yapay Zeka Nedir: 15 soru. Tüm dersleri kapsayan kapsamlı bir değerlendirme.