React Flow mini map
📖 Tarih & İlhamorta8 dk

GPT Çağı: Büyük Dil Modellerinin Yükselişi

Ölçek yasaları, emergent yetenekler ve LLM devrimi

Önce bunlara göz at

🎯

30 saniyede özet · Ne öğreneceksin

  • GPT-1'den GPT-4'e evrimi ve ölçek yasalarını anlamak
  • Emergent (ortaya çıkan) yeteneklerin ne anlama geldiğini kavramak
  • LLM'lerin toplumsal etkisini ve etik sorularını tartışmak
8 dk okuma·orta

2018'de OpenAI'ın yayımladığı GPT-1 modeli, 'pre-training + fine-tuning' paradigmasını tanıttı. Onu izleyen her nesil — GPT-2, GPT-3, GPT-4 — ölçeği büyüterek yeteneklerin nasıl sıçrama yaptığını gösterdi. Bu, yapay zekanın üçüncü ve en çarpıcı döneminin başlangıcıydı.

Kaplan ve ekibi (2020) üç boyuttaki ölçeğin model performansını güç yasasıyla artırdığını …

Küçük modellerde hiç yokken büyük modellerde aniden beliren yetenekler. Örneğin chain-of-t…

GPT-3 (2020)

  • ·175 milyar parametre
  • ·Few-shot learning
  • ·API erişimi
  • ·İnsan seviyesi yazma

GPT-4 (2023)

  • ·Parametre sayısı açıklanmadı
  • ·Çok modal (görüntü + metin)
  • ·Bar sınavında %90. yüzdelik
  • ·Gelişmiş akıl yürütme

⚠️Büyük dil modelleri halüsinasyon yapar, önyargı taşır ve hataları güvenle ifade edebilir. Güçlü oldukları kadar dikkatli kullanılmaları gerekir. AI güvenliği, hizalama (alignment) ve yorumlanabilirlik araştırmaları bu nedenle kritik hale geldi.

Daha derinlemesine