GPT Çağı: Büyük Dil Modellerinin Yükselişi

Ölçek yasaları, emergent yetenekler ve LLM devrimi

Kanal

Tarih & İlham

Süre

~8 dk

Önkoşul

1 konu

Diller

TR · EN

Öğrenci için: mekanizma, temel formül, kod ve quiz.· 6 / 6 bölüm

Önce bunlara göz at

🎯

30 saniyede özet · Ne öğreneceksin

→GPT-1'den GPT-4'e evrimi ve ölçek yasalarını anlamak
→Emergent (ortaya çıkan) yeteneklerin ne anlama geldiğini kavramak
→LLM'lerin toplumsal etkisini ve etik sorularını tartışmak

⏱ 8 dk okuma·orta

01 / GİRİŞobjective

2018'de OpenAI'ın yayımladığı GPT-1 modeli, 'pre-training + fine-tuning' paradigmasını tanıttı. Onu izleyen her nesil — GPT-2, GPT-3, GPT-4 — ölçeği büyüterek yeteneklerin nasıl sıçrama yaptığını gösterdi. Bu, yapay zekanın üçüncü ve en çarpıcı döneminin başlangıcıydı.

02 / KAVRAMdefinition

Kaplan ve ekibi (2020) üç boyuttaki ölçeğin model performansını güç yasasıyla artırdığını …

03 / KAVRAMdefinition

Küçük modellerde hiç yokken büyük modellerde aniden beliren yetenekler. Örneğin chain-of-t…

04 / KARŞILAŞTIRMAcontrast

GPT-3 (2020)

·175 milyar parametre
·Few-shot learning
·API erişimi
·İnsan seviyesi yazma

GPT-4 (2023)

·Parametre sayısı açıklanmadı
·Çok modal (görüntü + metin)
·Bar sınavında %90. yüzdelik
·Gelişmiş akıl yürütme

05 / NOTaside

Büyük dil modelleri halüsinasyon yapar, önyargı taşır ve hataları güvenle ifade edebilir. Güçlü oldukları kadar dikkatli kullanılmaları gerekir. AI güvenliği, hizalama (alignment) ve yorumlanabilirlik araştırmaları bu nedenle kritik hale geldi.

06 / KONTROLquiz

GPT modellerini önceki NLP yaklaşımlarından ayıran temel sıçrama neydi?

Daha derinlemesine