Belirsizliği ölçmek ve güncellemek
Bir doktor hastanın test sonucunu görünce "kesin hasta" demez — önceki bilgiyi yeni kanıtla günceller. Bayes teoremi, bu sezgisel düşünme biçimini matematiksel bir formüle dönüştürür ve makine öğrenmesinin belirsizlikle nasıl başa çıktığının temelini oluşturur.
**P(H|D) = P(D|H) × P(H) / P(D)**…
🔍Dedektif Analojisi
Bir cinayet soruşturmasında dedektifin ilk şüphelisi (prior) evin bahçıvanı. Yeni parmak izi kanıtı (likelihood) bulununca şüphe güncellenip (posterior) aşçıya yöneliyor. Bayes teoremi, dedektifin kafasındaki "şüphe güncellemesini" sayısallaştırır.
P(Spam|Kelimeler) ∝ P(Kelimeler|Spam) × P(Spam)E-postanın spam olma olasılığı, spam e-postalarda bu kelimelerin görülme sıklığı ile spam'in genel yaygınlığının çarpımıyla orantılıdır. Evidence tüm sınıflar için aynı olduğundan karşılaştırmalarda ihmal edilebilir.
**Naif varsayım**: Özellikler birbirinden **koşullu bağımsızdır**. Yani "bedava" ve "kazan…
Scikit-learn ile Naive Bayes spam sınıflandırıcı
| 1 | from sklearn.naive_bayes import MultinomialNB |
| 2 | from sklearn.feature_extraction.text import CountVectorizer |
| 3 | |
| 4 | # Örnek veri |
| 5 | emails = ["bedava kredi kazan", "toplantı yarın saat 10", "hemen tıkla kazan", "proje raporu hazır"] |
| 6 | labels = [1, 0, 1, 0] # 1: spam, 0: normal |
| 7 | |
| 8 | # Metin → sayısal özellik |
| 9 | vectorizer = CountVectorizer() |
| 10 | X = vectorizer.fit_transform(emails) |
| 11 | |
| 12 | # Model eğitimi |
| 13 | model = MultinomialNB() |
| 14 | model.fit(X, labels) |
| 15 | |
| 16 | # Tahmin |
| 17 | test = vectorizer.transform(["bedava hediye"]) |
| 18 | print(model.predict(test)) # [1] → spam |
| 19 | print(model.predict_proba(test)) # [[0.15, 0.85]] → %85 spam |
**Soru**: Hangi parametre değerleri bu veriyi en olası kılar?…
MLE (Frekansçı)
Bayesçi Yaklaşım
İyi bir model sadece "bu e-posta spam" demez, **"bu e-posta %87 olasılıkla spam"** der.…
💡Naive Bayes, veri az olduğunda bile çalışır ve eğitimi çok hızlıdır. Yeni bir metin sınıflandırma probleminde ilk deneyeceğiniz model olmalı — baseline olarak mükemmeldir.
⚠️Naive Bayes'in "naif" varsayımı (özellik bağımsızlığı) görüntü veya zaman serisi gibi yüksek korelasyonlu verilerde performansı düşürür. Bu durumlarda derin öğrenme modelleri tercih edilir.
✦ Quiz
Bayes teoreminde P(H) neyi temsil eder?
✦ Quiz
Naive Bayes'teki 'naif' varsayım nedir?
✦ Quiz
MLE ile Bayesçi yaklaşım arasındaki temel fark nedir?
Bağlantılı Konular