React Flow mini map
📖 Tarih & İlhamorta8 dk

GPT Çağı: Büyük Dil Modellerinin Yükselişi

Ölçek yasaları, emergent yetenekler ve LLM devrimi

2018'de OpenAI'ın yayımladığı GPT-1 modeli, 'pre-training + fine-tuning' paradigmasını tanıttı. Onu izleyen her nesil — GPT-2, GPT-3, GPT-4 — ölçeği büyüterek yeteneklerin nasıl sıçrama yaptığını gösterdi. Bu, yapay zekanın üçüncü ve en çarpıcı döneminin başlangıcıydı.

Kaplan ve ekibi (2020) üç boyuttaki ölçeğin model performansını güç yasasıyla artırdığını …

Küçük modellerde hiç yokken büyük modellerde aniden beliren yetenekler. Örneğin chain-of-t…

GPT-3 (2020)

  • ·175 milyar parametre
  • ·Few-shot learning
  • ·API erişimi
  • ·İnsan seviyesi yazma

GPT-4 (2023)

  • ·Parametre sayısı açıklanmadı
  • ·Çok modal (görüntü + metin)
  • ·Bar sınavında %90. yüzdelik
  • ·Gelişmiş akıl yürütme

⚠️Büyük dil modelleri halüsinasyon yapar, önyargı taşır ve hataları güvenle ifade edebilir. Güçlü oldukları kadar dikkatli kullanılmaları gerekir. AI güvenliği, hizalama (alignment) ve yorumlanabilirlik araştırmaları bu nedenle kritik hale geldi.

Bağlantılı Konular