CNN'in sınırlarını aşmaya çalışan alternatif mimari
Geoffrey Hinton, kendi yarattığı CNN devriminden yıllar sonra, bu mimarinin temel bir kusuruna isyan etti: havuzlama katmanları. 2017'de tanıttığı Capsule Networks, sinir ağlarına **uzamsal farkındalık** kazandırmayı vaat eden cesur bir deney oldu.
Max pooling, görüntüyü küçültürken **en güçlü aktivasyonu** tutar, gerisini atar. Bu verim…
🧩Puzzle Parçaları Metaforu
CNN, puzzle parçalarının **varlığını** kontrol eder: göz var mı, burun var mı? Ama parçaların birbirine göre konumunu sorgulamaz. Capsule Network ise hem parçaları hem de **nasıl bir araya geldiklerini** öğrenir — gerçek bir puzzle çözücü gibi.
Klasik nöron tek bir skaler üretir: 'burada göz var mı?' (0.9). Capsule ise **vektör** üre…
||vⱼ|| = P(varlık), v̂ⱼ = pose bilgisiCapsule çıktısı vⱼ bir vektördür. Uzunluğu 0-1 arasında olasılık, yönü ise nesnenin rotasyon, ölçek gibi özelliklerini taşır.
Alt seviye kapsüller, üst seviye kapsüllere **oy** gönderir. Eğer birçok alt kapsül aynı ü…
ℹ️Routing-by-agreement: Alt kapsüller tahminlerini yapar, tahminler uyuşuyorsa üst kapsül aktive olur. Bu, max pooling'in 'en güçlü kazanır' mantığının tam tersi.
2018'de Hinton, dynamic routing yerine **EM (Expectation-Maximization) algoritmasını** öne…
CNN + Pooling
Capsule Networks
Capsule Networks, **MNIST'te %99.75** ile kayda değer sonuçlar aldı ve rotasyonlu rakamlar…
⚠️Hinton'ın kendisi bile 2020'lerde Capsule yerine GLOM gibi yeni fikirlere yöneldi. Capsule Networks akademik bir ilham kaynağı olarak kaldı, endüstriyel standart olamadı.
✦ Quiz
CNN'lerdeki max pooling katmanının temel dezavantajı nedir?
✦ Quiz
Capsule çıktısının uzunluğu ve yönü neyi temsil eder?
💡Capsule Networks'ü anlamak için önce CNN ve backprop temellerine hakim olun. Hinton'ın 1986 backprop makalesi ve 2012 ImageNet zaferi, bu 'isyanın' arka planını oluşturur.
Bağlantılı Konular