Ölçek yasaları, emergent yetenekler ve LLM devrimi
2018'de OpenAI'ın yayımladığı GPT-1 modeli, 'pre-training + fine-tuning' paradigmasını tanıttı. Onu izleyen her nesil — GPT-2, GPT-3, GPT-4 — ölçeği büyüterek yeteneklerin nasıl sıçrama yaptığını gösterdi. Bu, yapay zekanın üçüncü ve en çarpıcı döneminin başlangıcıydı.
Kaplan ve ekibi (2020) üç boyuttaki ölçeğin model performansını güç yasasıyla artırdığını …
Küçük modellerde hiç yokken büyük modellerde aniden beliren yetenekler. Örneğin chain-of-t…
GPT-3 (2020)
GPT-4 (2023)
⚠️Büyük dil modelleri halüsinasyon yapar, önyargı taşır ve hataları güvenle ifade edebilir. Güçlü oldukları kadar dikkatli kullanılmaları gerekir. AI güvenliği, hizalama (alignment) ve yorumlanabilirlik araştırmaları bu nedenle kritik hale geldi.
Bağlantılı Konular