Dolandırıcılık tespiti ve arıza öngörüsü
Önce bunlara göz at
30 saniyede özet · Ne öğreneceksin
Bir havalimanı güvenlik görevlisi düşün: binlerce normal yolcu arasında şüpheli olanı tespit etmeli. Anomali tespiti (anomaly detection), milyonlarca normal örnek arasındaki nadir ve beklenmedik kalıpları bulmayı amaçlar — dolandırıcılık, makine arızası veya siber saldırı olsun.
Çoğu gerçek dünya senaryosunda etiketli anomali verisi yoktur — dolandırıcılık vakaları na…
🌳Isolation Forest: Yalnız Ağaç
Bir ormanda rastgele çizgiler çizerek alanı böldüğünü düşün. Normal noktalar kalabalık bölgelerde olduğu için birçok kesim gerekir. Anomaliler ise tek başına durur — bir-iki kesimde izole olurlar. Az kesim = yüksek anomali skoru.
Autoencoder, veriyi sıkıştırıp geri açan bir sinir ağıdır. Normal veriyle eğitildiğinde no…
anomali_skoru = ||x - decoder(encoder(x))||²Girdi x ile yeniden oluşturulan x arasındaki kare hata. Normal veriler düşük, anomaliler yüksek skor alır.
Tüm normal veri noktalarını saran en sıkı hiperdüzlemi bul. Bu sınırın dışında kalan her ş…
Isolation Forest
Autoencoder
Kredi kartı işlemlerinde Isolation Forest ile anomali tespiti
| 1 | from sklearn.ensemble import IsolationForest |
| 2 | import numpy as np |
| 3 | |
| 4 | # Örnek veri: [işlem tutarı, saat, konum_skoru] |
| 5 | X_normal = np.random.randn(1000, 3) # Normal işlemler |
| 6 | X_fraud = np.array([[10.5, 3.2, -2.1], [8.7, 2.8, -1.9]]) # Şüpheli |
| 7 | |
| 8 | # Model: %1 kontaminasyon beklentisi |
| 9 | model = IsolationForest(contamination=0.01, random_state=42) |
| 10 | model.fit(X_normal) |
| 11 | |
| 12 | # Tahmin: -1 = anomali, 1 = normal |
| 13 | print(model.predict(X_fraud)) # [-1, -1] |
| 14 | print(model.score_samples(X_fraud)) # Düşük skor = anomali |
⚠️Anomali tespitinde contamination parametresi kritiktir. Gerçek anomali oranını bilmeden yüksek değer vermek false positive patlamasına yol açar.
Kredi kartı dolandırıcılığı: Milisaniyeler içinde karar ver, müşteriyi rahatsız etme.
💡Anomali tespiti değerlendirmesinde precision-recall dengesi kritiktir. Dolandırıcılık tespitinde yüksek recall (kaçırma), endüstriyel sistemlerde yüksek precision (yanlış alarm maliyeti) öncelikli olabilir.
✦ Quiz
Isolation Forest algoritmasında bir nokta neden anomali olarak işaretlenir?
✦ Quiz
Autoencoder tabanlı anomali tespitinde model hangi veriyle eğitilmelidir?
ℹ️VAE-GAN konusunda öğrendiğin autoencoder yapısı burada pratik bir uygulama bulur. Kümeleme algoritmalarındaki 'dışarda kalan' kavramı da anomali tespitiyle doğrudan bağlantılıdır.