Dolandırıcılık tespiti ve arıza öngörüsü
Bir havalimanı güvenlik görevlisi düşün: binlerce normal yolcu arasında şüpheli olanı tespit etmeli. Anomali tespiti (anomaly detection), milyonlarca normal örnek arasındaki nadir ve beklenmedik kalıpları bulmayı amaçlar — dolandırıcılık, makine arızası veya siber saldırı olsun.
Çoğu gerçek dünya senaryosunda **etiketli anomali verisi yoktur** — dolandırıcılık vakalar…
🌳Isolation Forest: Yalnız Ağaç
Bir ormanda rastgele çizgiler çizerek alanı böldüğünü düşün. Normal noktalar kalabalık bölgelerde olduğu için birçok kesim gerekir. Anomaliler ise **tek başına** durur — bir-iki kesimde izole olurlar. Az kesim = yüksek anomali skoru.
Autoencoder, veriyi sıkıştırıp geri açan bir sinir ağıdır. **Normal veriyle eğitildiğinde*…
anomali_skoru = ||x - decoder(encoder(x))||²Girdi x ile yeniden oluşturulan x arasındaki kare hata. Normal veriler düşük, anomaliler yüksek skor alır.
Tüm normal veri noktalarını saran **en sıkı hiperdüzlemi** bul. Bu sınırın dışında kalan h…
Isolation Forest
Autoencoder
Kredi kartı işlemlerinde Isolation Forest ile anomali tespiti
| 1 | from sklearn.ensemble import IsolationForest |
| 2 | import numpy as np |
| 3 | |
| 4 | # Örnek veri: [işlem tutarı, saat, konum_skoru] |
| 5 | X_normal = np.random.randn(1000, 3) # Normal işlemler |
| 6 | X_fraud = np.array([[10.5, 3.2, -2.1], [8.7, 2.8, -1.9]]) # Şüpheli |
| 7 | |
| 8 | # Model: %1 kontaminasyon beklentisi |
| 9 | model = IsolationForest(contamination=0.01, random_state=42) |
| 10 | model.fit(X_normal) |
| 11 | |
| 12 | # Tahmin: -1 = anomali, 1 = normal |
| 13 | print(model.predict(X_fraud)) # [-1, -1] |
| 14 | print(model.score_samples(X_fraud)) # Düşük skor = anomali |
⚠️Anomali tespitinde contamination parametresi kritiktir. Gerçek anomali oranını bilmeden yüksek değer vermek false positive patlamasına yol açar.
**Kredi kartı dolandırıcılığı**: Milisaniyeler içinde karar ver, müşteriyi rahatsız etme.…
💡Anomali tespiti değerlendirmesinde precision-recall dengesi kritiktir. Dolandırıcılık tespitinde yüksek recall (kaçırma), endüstriyel sistemlerde yüksek precision (yanlış alarm maliyeti) öncelikli olabilir.
✦ Quiz
Isolation Forest algoritmasında bir nokta neden anomali olarak işaretlenir?
✦ Quiz
Autoencoder tabanlı anomali tespitinde model hangi veriyle eğitilmelidir?
ℹ️VAE-GAN konusunda öğrendiğin autoencoder yapısı burada pratik bir uygulama bulur. Kümeleme algoritmalarındaki 'dışarda kalan' kavramı da anomali tespitiyle doğrudan bağlantılıdır.
Bağlantılı Konular