İşlev sınıflandırması big PK: Sırasıyla Sigmoid ve Softmax nasıl kullanılır?

Tam metin 3019 Kelimeler, tahmini öğrenme süresi 7 dakika

Resim kaynağı: unsplash.com/@harlsta

Sınıflandırma görevlerini gerçekleştirmek için bir model tasarlarken (örneğin, göğüs röntgeni üzerinde hastalıkları veya elle yazılmış sayıları sınıflandırmak gibi), bazen aynı anda birden fazla yanıt seçmek (aynı anda pnömoni ve apse gibi) ve bazen de yalnızca bir yanıt ("8 sayısı gibi) "). Bu makale, sınıflandırıcının orijinal çıktı değerini işlemek için Sigmoid işlevinin veya Softmax işlevinin nasıl uygulanacağını tartışacaktır.

Sinir ağı sınıflandırıcı

Birçok sınıflandırma algoritması vardır, ancak bu makalede tartışılan içerik, sinir ağı sınıflandırıcılarıyla sınırlıdır. Sınıflandırma problemleri ileri beslemeli sinir ağları ve evrişimli sinir ağları gibi farklı sinir ağları tarafından çözülebilir.

Sigmoid işlevini veya Softmax işlevini uygulayın

Sinir ağı sınıflandırıcısının nihai sonucu, belirli bir vektör, yani "ham çıktı değeri" dir Örneğin, bu dört çıktı değeri, göğüs röntgeni incelemesinden sonra bulunan pnömoni, kardiyak hipertrofi, tümör ve apseye karşılık gelir. Peki bu ham çıktı değerleri ne anlama geliyor?

Çıktı değerini olasılığa dönüştürmek, anlaşılması daha kolay olabilir. Görünüşte rastgele "2.4" ile karşılaştırıldığında, diyabet hastalığına yakalanma olasılığı% 91'dir ve bu, hastaların anlaması daha kolaydır.

Sigmoid işlevi veya Softmax işlevi, sınıflandırıcının orijinal çıktı değerini olasılıkla eşleyebilir.

Aşağıdaki şekil, Sigmoid işlevi aracılığıyla ileri beslemeli sinir ağının orijinal çıktı değerini (mavi) olasılığa (kırmızı) eşleme işlemini göstermektedir:

Ardından, yukarıdaki işlemi tekrarlamak için Softmax işlevini kullanın:

Şekilde gösterildiği gibi, Sigmoid işlevi ve Softmax işlevi farklı sonuçlar verir.

Bunun nedeni, Sigmoid işlevinin her orijinal çıktı değerini ayrı ayrı işlemesidir, bu nedenle sonuçları birbirinden bağımsızdır ve toplam olasılık, şekil 0.37 + 0.77 + 0.48 + 0.91 = 2.53'te gösterildiği gibi mutlaka 1 olmak zorunda değildir.

Aksine, Softmax fonksiyonunun çıktı değerleri birbiriyle ilişkilidir ve olasılıklarının toplamı 0,04 + 0,21 + 0,05 + 0,70 = 1,00 şeklinde gösterildiği gibi her zaman 1'dir. Bu nedenle, Softmax fonksiyonunda, belirli bir kategorinin olasılığını artırmak için, diğer kategorilerin olasılığının da buna göre azaltılması gerekir.

Sigmoid fonksiyon uygulaması:
Örnek olarak göğüs röntgeni ve kabulü alın

Göğüs röntgeni : Bir göğüs röntgeni aynı anda birden fazla hastalığı gösterebilir, bu nedenle göğüs röntgeni sınıflandırıcısının aynı anda birden fazla semptom göstermesi gerekir. Aşağıdaki resim, pnömoni ve apseyi gösteren bir göğüs röntgeni. Sağdaki etiket sütununda iki "1" var:

Kabul : Amaç, hastanın sağlık dosyası temelinde hastanın ileride hastaneye yatma olasılığını değerlendirmektir. Bu nedenle, sınıflandırma problemi, hastanın mevcut sağlık dosyasını, hastanın ileride hastaneye yatırılmasına yol açabilecek tanıya (varsa) göre sınıflandırmak için tasarlanabilir. Bir hastanın hastaneye yatırılmasına neden olan birçok hastalık olabilir, bu yüzden birden fazla cevap olabilir.

grafik : Aşağıdaki iki ileri beslemeli sinir ağı, sırasıyla yukarıdaki sorunlara karşılık gelir. Nihai hesaplamada, orijinal çıktı değeri Sigmoid işlevi tarafından işlenir ve karşılık gelen olasılığı elde eder ve birden fazla olasılığın bir arada bulunmasına izin verir - çünkü göğüs röntgeni çeşitli anormal koşulları yansıtabilir, hasta birden fazla nedenden dolayı hastaneye kabul edilebilir.

Softmax işlevi uygulaması:
El yazısı sayıları ve Iris'i örnek olarak alın

El yazısı rakamlar: El yazısı rakamları ayırt ederken sınıflandırıcı, rakamların hangi tipe ait olduğunu netleştirmek için Softmax fonksiyonunu kullanmalıdır. Sonuçta, 8 rakamı aynı anda 7 değil, sadece 8 rakamı olabilir.

İris: Iris veri kümesi 1936'da kullanıma sunulmuştur ve üç kategoriye ayrılmış toplam 150 veri kümesi içerir: Iris iris, Iris versicolor ve Iris Virginia. Her kategori için 50 veri kümesi vardır ve her veri kaliksin uzunluğunu ve genişliğini içerir. , Petal uzunluğu, petal genişliği 4 nitelik.

Aşağıdaki 9 örnek Iris veri setinden alınmıştır:

Veri setinde hiç görüntü yok, ancak aşağıda gösterilen alacalı iris, keyfini çıkarmanız için:

Iris veri kümesinin sinir ağı sınıflandırıcısı, orijinal çıktı değerini işlemek için Softmax işlevini kullanır, çünkü bir iris yalnızca belirli bir tür olabilir - onu birkaç türe bölmek anlamsızdır.

"E" ile ilgili notlar

Sigmoid ve Softmax fonksiyonlarını anlamak için önce e tanıtılmalıdır. Bu makalede, e'nin yaklaşık olarak 2.71828'e eşit bir matematiksel sabit olduğunu anlamamız yeterlidir.

İşte e ile ilgili diğer bilgiler:

e'nin ondalık temsili her zaman mevcuttur ve sayılar tamamen rastgele görünür pi'ye benzer.

e genellikle bileşik faiz, kumar ve belirli olasılık dağılımları çalışmasında kullanılır.

Aşağıdaki, e için bir formüldür:

Ancak e için birden fazla formül var. Birçok hesaplama yöntemi vardır.

2004 yılında, Google'ın halka arz edilen ilk halka arzı 2.718.281.828 ABD Doları'na veya "e milyon ABD Doları" na ulaştı.

Wikipedia'da (https://en.wikipedia.org/wiki/E_%28mathematical_constant%29#Bernoulli_trials) insanlık tarihindeki ünlü ondalık sayının 1690'da başlayıp 1978'e kadar devam eden evrimi 116.000 basamak:

Sigmoid işlevi ve Softmax işlevi

Sigmoid = çok etiketli sınıflandırma problemi = çoklu doğru cevaplar = münhasır olmayan çıktı (örneğin göğüs röntgeni, hastaneye yatış)

Birden çok doğru cevabı olan bir problemi çözmek için bir sınıflandırıcı oluştururken, her orijinal çıktı değerini ayrı ayrı işlemek için Sigmoid işlevini kullanın.

Sigmoid işlevi aşağıdaki gibidir (not e):

Bu formülde, Sigmoid fonksiyonunu temsil eder ve (zj) Sigmoid fonksiyonunun Zj sayısına uygulanmasını temsil eder. "Zj", -0,5 gibi tek bir orijinal çıktı değerini temsil eder. j, mevcut işlemin çıkış değerini temsil eder. Dört ham çıktı değeri varsa, j = 1, 2, 3 veya 4. Önceki örnekte, orijinal çıktı değeri Z1 = -0.5, Z2 = 1.2, Z3 = -0.1, Z4 = 2.4'tür.

ve bu yüzden,

Z2, Z3, Z4'ün hesaplama süreci yukarıdaki ile aynıdır.

Sigmoid işlevi her orijinal çıktı değerine ayrı ayrı uygulandığından, olası çıktı durumları şunları içerir: tüm kategoriler çok düşük olasılıklara sahiptir ("bu göğüs röntgeni muayenesi anormal değildir" gibi), bir kategorinin olasılığı yüksek, ancak diğer kategoriler Olasılık düşüktür ("göğüs röntgeni sadece bulunan pnömoni" gibi) ve çoklu veya tüm kategorilerin olasılığı yüksektir ("göğüs röntgeni bulunan pnömoni ve apse" gibi).

Aşağıdaki şekil Sigmoid fonksiyon eğrisini göstermektedir:

Softmax = çok kategorili sınıflandırma problemi = yalnızca bir doğru cevap = karşılıklı olarak dışlayıcı çıktı (el yazısı sayılar, iris gibi)

Bir sorunu tek bir doğru cevapla çözmek için bir sınıflandırıcı oluştururken, her orijinal çıktı değerini işlemek için Softmax işlevini kullanın.

Softmax işlevinin paydası, orijinal çıktı değerinin tüm faktörlerini birleştirir; bu, Softmax işlevi tarafından elde edilen farklı olasılıkların birbiriyle ilişkili olduğu anlamına gelir.

Softmax işlevi aşağıdaki şekilde ifade edilir:

Payda haricinde, tüm faktörleri entegre etmek için, orijinal çıktı değerine e ^ şey ekleyin.Softmax işlevi ile Sigmoid işlevi arasında çok az fark vardır. Başka bir deyişle, tek bir orijinal çıktı değerini hesaplamak için Softmax işlevini kullanırken (Z1 gibi), yalnızca Z1'i hesaplayamazsınız. Paydadaki Z1, Z2, Z3 ve Z4 de aşağıda gösterildiği gibi hesaplanmalıdır:

Softmax fonksiyonunun avantajı, tüm çıkış olasılıklarının toplamının 1 olmasıdır:

El yazısı sayıları ayırt ederken, orijinal çıktı değerini işlemek için Softmax işlevini kullanın. Bir örneğin "8" e bölünme olasılığını artırmak istiyorsanız, örneğin sınıflandırmasını diğer sayılara indirmelisiniz (0,1,2,3,4,5) , 6, 7 ve / veya 9) olasılık.

Sigmoid ve Softmax'ın diğer örnekleri

sonuç olarak

Model çıktısı birbirini dışlayan bir kategoriyse ve aynı anda birden fazla kategori seçilebiliyorsa, ağın orijinal çıktı değerini hesaplamak için Sigmoid işlevi kullanılır.

Model çıktısı birbirini dışlayan bir kategori ise ve yalnızca bir kategori seçilebiliyorsa, Softmax işlevi ağın orijinal çıktı değerini hesaplamak için kullanılır.

Yorum Beğen Takip Et

AI öğrenme ve geliştirmenin kuru mallarını paylaşalım

Tam platform yapay zeka dikey öz medya "temel okuma" yı takip etmeye hoş geldiniz

Derin öğrenme kavun ve sebzeleri kesebilir mi? Minimum kod elde edilebilir
önceki
Sincan turizmi o zamanlar "petrol şehri" Karamay yeşil
Sonraki
"GOT7" "Paylaş" 190623 Önümüzdeki anne sevgisinin yükselen değerinin erken uyarısı! Benimle çocukları çalmak için Güney Kore'ye kim gidecek?
AI depremleri tahmin ediyor: yol hala uzun, ancak gelecek beklenebilir
Zhu Zhengting'in kotlu beyaz T'si ferahlatıcı ve yakışıklı, siyah çerçeveli gözlükler lise son sınıf öğrencisi gibi görünüyor
Bugün Xinsheng | Analistler Apple'ın 2020'de 5G iPhone'u piyasaya sürmesini bekliyor
"EXO" "Paylaş" 190623 Baek Hyun'un ölümcül geri dönüş çekiciliğini tamamlayın, gözleri sihirli bir dokunuş
Bir yaz yüzmesi için en iyi çözüm! Red Devils 3, Wanmo kulaklıklarla birlikte 500 yuan'a kadar düştü
Hijyenle uğraşan çocuklar nasıl eğitilir? Dyson V11 kablosuz el süpürgesi uygulamalı deneyim
Teknoloji: Hua Milan, Huawei'nin logosunu nasıl destekliyorsunuz?
Çin'in sigorta aracısı teknik raporu yayınlandı, sigorta aracısı 3.0 dönemi geliyor
"NCT" "Paylaş" 190623 Kim Doyoung şahsen NCT 127 tezahürat çubuğunun doğru kullanıldığını gösteriyor
Bugünkü Çekirdek Ses | Dünyanın ilk beyin benzeri süper bilgisayarının 2022'de doğması bekleniyor
190623 Seul Belediye Binası'ndan Sam Kwang Adası'na BTS fm anısına mor ışıklar yerleştirildi
To Top