Görüntü Tanıma'nın Gıda Zorluğu : İki sınıflandırmadan çoklu sınıflandırmalara, biraz karmaşıklıktan fazlasını ekler ...

Leifeng.com AI geliştiricisinin notu: Sadece birkaç ay önce, AI Araştırma Enstitüsü gıda tanıma konusundaki ilk mücadeleyi başlattı (https://www.leiphone.com/news/201912/flrnkIxJGI4bw3TE.html). Yarışma, katılımcıların tanınacak resimlerden tofu ve patatesleri doğru bir şekilde ayırt edebilmesini gerektirmektedir Bu görev aynı zamanda birçok resim tanıma meraklısına temel bir uygulama sağlamıştır.

İlk gıda tanıma meydan okumasıyla karşılaştırıldığında, bu sefer başlatılan rekabet 2.0 biraz daha zor. İçerik türlerinin ikiye katlanmasına ek olarak, dört bileşenin resim tanıma oranı da azalmıştır. Görüntü tanımaya odaklanan geliştiriciler için bunun denemeye değer bir zorluk olduğuna inanıyorum!

İki kategori --- > Çoklu kategori

Eğer bu zorluğun sadece kategoriyi ikiye katlamak olduğunu düşünüyorsanız, o zaman büyük bir yanlış anlama var demektir. Akademik bir bakış açısından, bu soru aslında önceki iki sınıflandırma probleminden çoklu sınıflandırma problemine genişletilmiştir.

Genellikle iki sınıflandırma problemiyle uğraşırken, ilgili kategorileri yalnızca doğru (1) ve yanlış (0) gibi iki kategoriye ayırmamız ve ardından bunları çiftler halinde eşleştirmemiz gerekir. Test sonuçlarını gerçek durumla karşılaştırdıktan sonra, dört tür veri içeren bir kafa karışıklığı matrisi de elde edeceğiz:

  • Tahmin doğrudur ve gerçek olan gerçek True Positives (TP)

  • Tahmin yanlış ve gerçek doğru Yanlış Negatifler (FN)

  • Tahminin doğru ve gerçek olanın yanlış olduğu Yanlış Pozitifler (FP)

  • Tahmin yanlış ve gerçek yanlış Doğru Negatifler (TN)

İki sınıflandırma problemi

Ek olarak, modelin kalitesini ölçmek için bundan türetilen birçok ilgili göstergeyi de içerir. Örneğin: Kesinlik - model (TP + TN) tarafından doğru şekilde değerlendirilen verilerin toplam verilere oranı; Geri çağırma - veri setindeki model tarafından doğru şekilde değerlendirilen pozitif örneklerin (TP) oranı Doğruluk Model tarafından değerlendirilen tüm pozitif vakalar (TP + FP) için, gerçek vakaların oranı (TP).

Ve bu zorlukta yer alan 4 kategori gibi çoklu sınıflandırma problemi ise, sadece sınıflandırma patlıcan (0), yam (1), acı kabak (2), brokoli (3) ve ilgili kafa karışıklığı matrisine yükseltilmeyecektir. Ayrıca 2 * 2'den 4 * 4'e değişecektir. Çoklu sınıflandırma problemi 10 kategoriye genişletilirse, karışıklık matrisi 10 * 10 matris haline gelecektir.

Çok sınıflı hücre sınıflandırma problemlerine örnekler

Doğrusal regresyon sınıflandırmasına benzer şekilde, çoklu doğrusal regresyon, birim doğrusal regresyondan daha karmaşıktır.Değişken sayısının artırılması, tek değişkenin çokluya genişletilmesi anlamına gelir; gradyan iniş yöntemini kullanırken, yöntem, tek değişkenli doğrusal regresyon ile aynıdır ve maliyet fonksiyonu da büyük ölçüde değişecektir.

Spesifik olarak, birden fazla değişken olduğunda, değişkenlerin değer aralıkları farklı olacaktır. Fark çok büyükse, sonuçta ortaya çıkan maliyet fonksiyonu, özellikle uzun ve dar bir elips gibi son derece düzensiz olur.Bu zamanda, gradyan inişi gerçekleştirildiğinde, yol çok kıvrımlı olacaktır.

Resim kaynağı: https://blog.csdn.net/qq_36187544/article/details/87879423

Bu şekilde, çoklu sınıflandırma problemi sadece birden fazla parametrenin maliyetini arttırmakla kalmaz, aynı zamanda modelin kalitesi göz önüne alındığında, modeli yargılamak ve optimize etmek için daha karmaşık ölçütler gerektirir. Bu nedenle, bir çoklu sınıflandırma probleminin her bir ek kategorisi için, tanımlama probleminin karmaşıklığı büyük ölçüde artacaktır.

Çok sınıflı problem çözme fikirleri

Problem ikili sınıflandırmadan çoklu sınıflandırmaya değiştiğinde, geliştiriciler genellikle sökme yöntemini kullanır, yani: çoklu sınıflandırma problemini çoklu iki sınıflandırma problemine bölün, her iki sınıflandırma problemi için bir sınıflandırıcı eğitin ve ardından sentezleyin. Birden fazla sınıflandırma standardı altındaki tahmin sonuçları, nihai sınıflandırmayı elde etmek için entegre edilmiştir. Sorunları dönüştürmek için üç ana bölme stratejisi türü vardır:

  • İkili ilişki Her bir etiketi ayrı bir sınıf sınıflandırma sorunu olarak ele alın. Bir veri kümesi D verildiğinde, N kategori vardır.Bu durumda, bu kategoriler N (N-1) / 2 ikili sınıflandırma görevleri oluşturmak için eşleştirilir.Örnekler test sırasında bu sınıflandırıcılara aktarılır. Sonra bir karar verin.

  • Sınıflandırıcı zinciri Her seferinde bir sınıfı olumlu, geri kalanını olumsuz örnek olarak alın ve toplam N sınıflandırıcı eğitin. Test ederken, sadece bir sınıflandırıcı pozitif bir kategoriyi öngörüyorsa, ilgili kategori etiketi nihai sınıflandırma sonucu olarak kullanılır.Çok sayıda sınıflandırıcı pozitif bir kategori öngörürse, en yüksek güvenilirliğe sahip kategori nihai sınıflandırma sonucu olarak seçilir.

  • Çok sınıflı strateji Bir hata düzeltme çıktı kodu sınıflandırma yöntemine dayalı olarak, kodlama ve kod çözme olmak üzere iki adıma ayrılır. Kodlama, N kategorisini M zamanına bölmekten sorumludur ve kod çözme, nihai tahmin sonuçlarını elde etmek için M sınıflandırıcılarla test örneklerini tahmin etmekten sorumludur.

ECOC kodlama diyagramı

Stratejiden bağımsız olarak, her sınıflandırıcının eğitim seti için geliştirici, ilk olarak orijinal eğitim setinin etiketini iki kategoriye yeniden tanımlayabilir, bunu ikili bir sınıflandırma problemine dönüştürebilir ve ardından her sınıflandırıcı için karşılık gelen mantığı oluşturabilir. Bu şekilde, test seti sınıflandırılır ve her sınıflandırıcı etiketini elde etmek için değerlendirilir ve son olarak nihai tanıma sonucu, her sınıflandırıcının etiketi aracılığıyla elde edilir.

Ek olarak, uygun değerlendirme göstergelerinin seçilmesi mevcut görev için daha uygun algoritmaların seçilmesine yardımcı olur.Geliştiriciler ayrıca bu tanıma modeli için uygun değerlendirme göstergeleri tasarlayabilir. Sınıflandırma görevleri için, değerlendirme göstergelerinin ana odağı, sistemin doğru bir şekilde sınıflandırma yeteneğidir; bu nedenle, ilgili değerlendirme göstergeleri iki sınıflandırmanın doğruluğu, geri çağrılması ve doğruluğunu ifade edebilir.

Çok kategorili sınıflandırma için, şekil üç kategoriye ayrılmış iki özelliği göstermektedir

Yiyecek tanıma sorunu (): patlıcan, tatlı patates, acı kabak veya brokoli?

AI Araştırma Enstitüsü tarafından başlatılan gıda tanıma mücadelesinin görevi, gıda resimlerinde görünen bileşenleri doğru bir şekilde değerlendirmektir. Bunların arasında patlıcan, yam, acı kabak ve brokoli olmak üzere 4 içerik kategorisi vardır.

İlk gıda tanıma serisi "Patates veya Soya Peyniri" meydan okumasıyla karşılaştırıldığında zorluk arttı. Ancak önceki oyunda olduğu gibi, her resim yalnızca bileşenlerden birini içerir.

Kaynak: AI Araştırma Enstitüsü

Yarışma ana sayfası, 6140 eğitim seti ve 856 test seti dahil olmak üzere "pnömoni X-ışınları" ile ilgili veri setleri sağlar. Yarışmacıların yemek resimlerindeki içerik maddelerine göre sınıflandırmaları gerekir, burada: patlıcan = 0, patates = 1, acı kabak = 2, brokoli = 3.

Başlangıç zamanı: 2020-02-1318:00:00

Bitiş saati: 2020-03-1423:59:59

Bu yarışmanın temel ödül havuzu 3.000 yuan'dır. Yarışmada üç tür ödül vardır: Katılım Ödülü (% 30), Atılım Ödülü (% 20), Sıralama Ödülü (% 50); AI Araştırma Derneği Bahar Festivali kırmızı zarf etkinliği hala devam ediyor Devam edin, arkadaşlarınızı para ödülüne katılmaya davet edin ve para ödülü doğrudan yarışma ödülü olarak kabul edilen kişisel hesabınıza aktarılacaktır. Yukarıdaki dört ödül birbiriyle çelişmiyor!

Veri setinin bazı resimlerine örnekler

Veri seti indirme bağlantısı:

https://static.leiphone.com/food_challenge2.zip

Çin Yeni Yılı Kırmızı Paket Etkinlikleri:

https://god.yanxishe.com/competition/activity/jumpPullNewer

Değerlendirme kriterleri

Son gönderim sonuç dosyası aşağıdaki gibidir, burada ilk alan test setinin görüntü kimliğidir (kimliğin 0'dan başlayan dosya adı olduğunu unutmayın); ikinci alan: malzemenin kimliği (patlıcan = 0, yam = 1, acı kabak) = 2, brokoli = 3)

Not: UTF-8 kodlamasının kullanılması önerilir, toplam 856 sonuç, çünkü yetersiz sayı puanlama başarısızlığına neden olabilir ~

Tüm yarışmanın değerlendirilmesi tamamen şeffaftır. Resim verilerinin doğru şekilde ayırt edildiğini doğrulamak için yarışmacılar tarafından gönderilen csv dosyalarını karşılaştıracağız ve aşağıdaki formüle göre skoru hesaplayacağız, burada:

  • Doğru: doğru model sınıflandırması sayısı

  • Toplam: test setindeki toplam numune sayısı

Her gün 24: 00'da resmi web sitesi sıralamalarındaki en son sonuçları da güncelleyeceğiz.Sıralamalarınızı istediğiniz zaman, istediğiniz yerde kontrol edebilirsiniz.

Daha fazla bilgi için lütfen yarışma ana sayfasına gidin: https://god.yanxishe.com/26

Leifeng.com Yapay Zeka Geliştirici Leifeng.com

İlkokul öğrencileri Ding Ding'i "bir yıldız övgüyle" raflardan aldılar mı? App Store: İletişimsizlik
önceki
Lingnan Uçan İğne, Xiguan Kemik Onarımı ... Genetik Olmayan İnsanlar Anti-salgına Yardım Ediyor
Sonraki
Guangzhou'daki 180 taksinin ilk partisi "şeffaf" koruyucu giysiler "giyiyor
Tek bir enfeksiyon vakası olmamıştır ve bu toplulukta şüpheli bir sığır vakası olmamıştır.
Film tarihinin ilk filmi "Tren İstasyonunda" saniyeler içinde 4K HD olur, AI tahmini + enterpolasyon, siyah beyaz da "renkli TV" haline gelebilir
Guangdong Resim Akademisi ressamı doktorun aşkını söylüyor
Android'in babası tekrar iş kurmayı başaramazsa Essential telefonda görüşürüz
Arkadaşlar ezin! Xiaomi 10 Pro 5999'da fırtına estiriyor, DXOMARK kamera videolarında ilk sırada yer alıyor
En güzel "retrograd" a haraç! Kalbini dürt! Babadan kıza bir "özür" mektubu
Today Paper | Gradyan Kırpma; Adlandırılmış Varlık Tanıma; Doğal Dil İşleme; Serbest Güç Fonksiyonu Öğrenme, vb.
Bugünden itibaren, Shenyang Demiryolundaki 173 tren askıya alındı
Hubei'deki bu yer savaş zamanı kontrolünü uygular: kapalı bina yönetimi, 14 gün 1 döngü
Yeni koronavirüs COVID-19 mu yoksa SARS-CoV-2 mi? Önyargıyı ortadan kaldırmak isimlendirmeyle başlar
Video Kızım, Dongguan tecrit koğuşundaki bir hemşire için doğum gününü kutladı, "Anne, sana sarılamaz, sadece senin için dans et"
To Top