CNN'in sınırlarını aşmaya çalışan alternatif mimari
Önce bunlara göz at
30 saniyede özet · Ne öğreneceksin
Geoffrey Hinton, kendi yarattığı CNN devriminden yıllar sonra, bu mimarinin temel bir kusuruna isyan etti: havuzlama katmanları. 2017'de tanıttığı Capsule Networks, sinir ağlarına uzamsal farkındalık kazandırmayı vaat eden cesur bir deney oldu.
Max pooling, görüntüyü küçültürken en güçlü aktivasyonu tutar, gerisini atar. Bu verimli a…
🧩Puzzle Parçaları Metaforu
CNN, puzzle parçalarının varlığını kontrol eder: göz var mı, burun var mı? Ama parçaların birbirine göre konumunu sorgulamaz. Capsule Network ise hem parçaları hem de nasıl bir araya geldiklerini öğrenir — gerçek bir puzzle çözücü gibi.
Klasik nöron tek bir skaler üretir: 'burada göz var mı?' (0.9). Capsule ise vektör üretir:…
||vⱼ|| = P(varlık), v̂ⱼ = pose bilgisiCapsule çıktısı vⱼ bir vektördür. Uzunluğu 0-1 arasında olasılık, yönü ise nesnenin rotasyon, ölçek gibi özelliklerini taşır.
Alt seviye kapsüller, üst seviye kapsüllere oy gönderir. Eğer birçok alt kapsül aynı üst k…
ℹ️Routing-by-agreement: Alt kapsüller tahminlerini yapar, tahminler uyuşuyorsa üst kapsül aktive olur. Bu, max pooling'in 'en güçlü kazanır' mantığının tam tersi.
2018'de Hinton, dynamic routing yerine EM (Expectation-Maximization) algoritmasını önerdi.…
CNN + Pooling
Capsule Networks
Capsule Networks, MNIST'te %99.75 ile kayda değer sonuçlar aldı ve rotasyonlu rakamlarda C…
⚠️Hinton'ın kendisi bile 2020'lerde Capsule yerine GLOM gibi yeni fikirlere yöneldi. Capsule Networks akademik bir ilham kaynağı olarak kaldı, endüstriyel standart olamadı.
✦ Quiz
CNN'lerdeki max pooling katmanının temel dezavantajı nedir?
✦ Quiz
Capsule çıktısının uzunluğu ve yönü neyi temsil eder?
💡Capsule Networks'ü anlamak için önce CNN ve backprop temellerine hakim olun. Hinton'ın 1986 backprop makalesi ve 2012 ImageNet zaferi, bu 'isyanın' arka planını oluşturur.
Daha derinlemesine