Lojistik regresyona benzeterek anlayabiliriz: 😋
Lojistik regresyonun 0 ile 1,0 arasında bir ondalıklı sayı ürettiğini hatırla, Örneğin, bir e-posta sınıflandırıcısından 0,8'lik bir lojistik regresyon çıktısı, bir e-postanın% 80'i spam olma olasılığını ve% 20'sinin spam olmadığını gösterir. Yani, bir e-postanın spam olma ve spam olmama ihtimalinin toplamı 1.0'dir.
Softmax bu fikri ÇOKLU-SINIF dünyasına genişletiyor. Yani, Softmax, her sınıfa çok sınıflı bir problemde ondalık olasılıklar verir. Bu olasılıkların toplamı 1.0'e eşittir.
- Onun diğer ismi Maximum Entropy (MaxEnt) Classifier
Softmax regresyonunun lojistik regresyonun genelleştirdiğini söyleyebiliriz.
Lojistik regresyon, C = 2 olan softmax'ın özel bir durumudur 🤔
C = sınıf sayısı = çıkış katmanının birim sayısı
Yani,
Softmax, çıktı katmanından hemen önce bir sinir ağı katmanı vasıtasıyla uygulanır. Softmax katmanı, çıkış katmanı ile aynı sayıda düğüme sahip olmalıdır.
Softmax katmanının çıktısını alır ve 1 vs 0 vector (adlandırdığıma göre 🤭) vektörüne dönüştürür, o da bizim ŷ'iz olacak
Örenğin:
t = 0.13 ==> ̂y = 0
0.75 1
0.01 0
0.11 0
Ve bunun gibi 🐾
Y ve ŷ (C,m) boyutunda matrislerdir 👩🔧