Kaggle Buzdağı Görüntü Sınıflandırma Yarışması gün batımına yakın, şampiyon takımın planının önemli noktalarını görün

Leifeng.com AI Araştırma Enstitüsü'ne göre, birkaç gün önce sona eren Kaggle "Statoil / C-CORE Buzdağı Sınıflandırıcı Yarışması" nda (Buzdağı Görüntü Sınıflandırma Yarışması), David Austin ve Weimin Wang'dan oluşan bir ekip birinci olarak çıktı ve 25.000 $ ödül kazandı. Raporlara göre, gemilerin tehlikeli sularda daha güvenli seyretmesini sağlamak, gemi ve kargo hasarını azaltmak ve kayıpları önlemek için çözümleri gerçek hayata etkili bir şekilde uygulanabilir.

Kaggle'ın resmi web sitesine göre, bu buzul görüntü sınıflandırma yarışması, tarihte en çok katılan ekiplerle Kaggle'daki en sıcak görüntü sınıflandırma yarışmasıdır. Tüm veri yarışmaları arasında, bu yarışma popülerlikte yedinci sırada yer aldı.

Kısa bir süre önce, yabancı medya David Austin ile derinlemesine bir röportaj yaptı. Röportajda aşağıdaki konuları tartıştılar:

  • Buzdağı görüntü sınıflandırma yarışması nedir;

  • Şampiyon programındaki işleme yöntemleri, çekirdek algoritmalar ve ilgili teknolojiler;

  • Yarışmada karşılaşılan en büyük sorunlar ve çözümler;

  • Kaggle yarışmalarına katılmak isteyenler için tavsiyeler.

Aşağıda Leifeng.com AI Araştırma Enstitüsü tarafından derlenen ve derlenen özel röportaj içeriği yer almaktadır:

Şekil 1: Kaggle Buzdağı Sınıflandırma Mücadelesinin görev amacı, giriş uydu görüntüsünü buzdağlarına veya gemilere bölen bir görüntü sınıflandırıcı oluşturmaktır.

S: Merhaba David, röportajımı kabul ettiğiniz için çok teşekkür ederim Buzdağı Görüntü Sınıflandırma Yarışması'nda aldığınız iyi sonuçlar için tebrikler. Bilgisayarla görü ve derin öğrenmeyle nasıl ilgilenmeye başladınız?

C: Son iki yılda derin öğrenmeye olan ilgim gün geçtikçe arttı. Çünkü insanların verilerden inanılmaz sonuçlar almak için kullandığını görüyorum. Derin öğrenme alanındaki en son araştırma ve pratik uygulamalarla çok ilgileniyorum.Kaggle'ın harika bir platform olduğunu düşünüyorum. Yarışma sayesinde, en son teknolojileri kontrol etme ve uygun senaryolarda yeni teknolojileri deneme yeteneğini koruyabiliyorum.

S: Bu yarışmaya katılmadan önce, bilgisayarla görme ve makine öğrenimi alanındaki akademik geçmişiniz nasıldı? Daha önce diğer Kaggle yarışmalarına katıldınız mı?

C: Yaklaşık on yıl önce ilk kez makine öğrenimi ile tanıştım ve o sırada gradyan artıran ağaçları ve rastgele ormanları öğrenmeye ve bunları sınıflandırma problemlerine uygulamaya başladım. Son yıllarda derin öğrenmeye ve bilgisayarla görmeye daha fazla önem vermeye başladım. Bir yıldan daha kısa bir süre önce, Kaggle yarışmalarına katılmaya başladım. Bu, becerilerimi geliştirmenin bir yolu. Bu yarışma, Kaggle yarışmalarına üçüncü kez katılacağım.

Şekil 2: Buzdağı

S: Buzdağı Sınıflandırma Yarışması hakkında daha fazla konuşabilir misiniz? Sizi bu yarışmaya katılmaya iten nedir?

Cevap: Buzdağı Sınıflandırma Mücadelesi iki sınıflı bir görüntü sınıflandırma problemidir Bu yarışma, katılımcıların uydu görüntülerinde gemileri ve buz dağlarını ayırmasını gerektirir. Bu çalışma özellikle enerji arama alanında önemlidir ve buz kütleleri gibi tehditleri tespit etmemizi ve bunlardan kaçınmamızı sağlar.

Bu yarışmadan elde edilen verilerin özellikle ilginç iki yönü var:

  • İlk olarak, eğitim setinde sadece 1604 görüntü bulunan veri seti oldukça küçüktür. Bu şekilde, donanım açısından bakıldığında, rekabete katılma eşiği çok düşüktür. Ancak diğer yandan görüntü sınıflandırma görevlerini sınırlı veri ile tamamlamak çok zordur.

  • İkinci olarak, bu resimleri çıplak gözle gözlemlerseniz, bir TV ekranında beliren "kar taneleri" gibi görünürler - bir gürültü karmaşası. İnsanların hangi görüntülerin gemi, hangi görüntülerin buzdağı olduğunu görmesi tamamen imkansızdır.

Şekil 3: Giriş resminin "buzdağı" mı yoksa "tekne" mi olduğunu insan gözü için doğru bir şekilde belirlemek zordur.

İnsanların görüntü kategorilerini çıplak gözle doğru bir şekilde ayırt etmesi çok zordur. Bence bu, derin öğrenmenin ve bilgisayarla görmenin insanların yapamayacağı şeyleri yapabileceğini test etmek için iyi bir fırsat.

Şekil 4: Şampiyon takım entegre bir evrişimli sinir ağı yapısı kullanıyor

S: Şimdi biraz daha teknik konuları tartışalım. Kazanma stratejinizde kullanılan veri işleme yöntemlerini, algoritmaları ve ilgili teknolojileri tanıtabilir misiniz?

Cevap: Tamam, genel olarak veri işleme yöntemlerimiz çoğu geleneksel bilgisayar görme problemlerinde kullanılanlara çok benziyor. Verileri anlamak için önceden biraz zaman harcıyoruz.

Gözetimsiz öğrenme yöntemlerini kullanmak benim en sevdiğim tekniklerden biridir.Bu kalıpları öğrenerek, bundan sonra hangi derin öğrenme yöntemlerini kullanacağımıza karar verebiliriz.

Bu görevde, standart KNN (K Nearest Neighbor Algorithm), model yapısını tanımlamaya yardımcı olan anahtar sinyalleri tanımlayabilir. 100'den fazla değiştirilmiş evrişimli sinir ağı ve VGG'ye benzer bir yapı içeren çok büyük bir evrişimli sinir ağı yapısı kullanıyoruz ve daha sonra açgözlü harmanlama stratejisini ve diğer görüntü özelliklerini birleştiren iki entegre öğrenme algoritması katmanını kullanıyoruz. Model sonuçlarını birleştirin.

Bu çok karmaşık bir yöntem gibi görünüyor. Ama hatırla! Buradaki amaç, günlük kaybı hatasını en aza indirmektir. Bu görevde sadece bunun gibi bazı modeller ekledik çünkü bunlar aşırı uyum olmadan log kaybını azaltabilirler. Bu, birçok zayıf makine öğrenimi modelini entegre etmenin gücünün bir başka güzel örneğidir.

Sonunda, daha önce olduğu gibi aynı evrişimli sinir ağı yapılarının çoğunu eğittik, ancak burada girdi olarak başlangıçta denetimsiz öğrenme yoluyla seçilen orijinal verilerin yalnızca bir alt kümesini kullanıyoruz ve bu da modelimizin performansını artırıyor.

Şekil 5: Aşırı uyum, bu yarışmada karşılaştıkları en zor sorundur

S: Sizin için bu yarışmada karşılaşılan en büyük sorun nedir?

C: Oyunun en zor kısmı, modelin gereğinden fazla uygun olmadığını doğrulamaktır.

Dürüst olmak gerekirse, bu veri seti görüntü sınıflandırma problemleri için oldukça küçüktür, bu yüzden fazla uydurmanın büyük bir problem olacağından endişeliyiz. Bu nedenle, tüm modellerin 4 kat çapraz doğrulamaya tabi tutulmasını sağlamak gerekir.Bu, hesaplama maliyetini artıracak olsa da, aşırı uyum riskini azaltabilir. Özellikle logaritmik kayıp gibi çok katı bir kayıp fonksiyonuyla uğraşırken, her zaman aşırı uyuma dikkat etmeniz gerekir.

S: Modeli eğitmek ne kadar sürer?

Cevap: Seçtiğimiz evrişimli sinir ağının ölçeği çok büyük olmasına ve tüm model eğitim süreçlerinde 4 kat çapraz doğrulama kullanılmasına rağmen, eğitim süreci yalnızca bir ila iki gün sürer. Çapraz doğrulaması olmayan tek bir model birkaç dakika içinde eğitilebilir.

S: Bu yarışmada kullandığınız en önemli tekniklerden veya ipuçlarından birini seçecek olsanız, neyi seçerdiniz?

Cevap: Hiç şüphe yok ki en önemli adım, verilerin daha iyi anlaşılması için önceden yapılan keşifsel analizdir.

Keşif analizinin sonuçları, görüntü verilerinin dışında, verilerdeki çok fazla gürültüyü ortadan kaldırmaya yardımcı olabilecek çok önemli bir özellik olduğunu göstermektedir.

Bence bilgisayarla görme veya derin öğrenme problemlerinde en çok gözden kaçan adımlardan biri, verileri önceden anlamak ve bu bilgiyi en iyi tasarım seçimlerini yapmamıza yardımcı olmak için kullanmaktır.

Kullanıma hazır algoritmaları elde etmek ve referans almak artık daha kolay ve bu algoritmaları genellikle basit ve kaba bir şekilde düşünmeden çözülmesi gereken sorunlara uyguluyoruz. Bununla birlikte, bu algoritmaların bu görev için en iyi seçim olup olmadığını veya eğitimden önce veya sonra verileri düzgün bir şekilde işlememiz gerekip gerekmediğini gerçekten düşünmedik.

Şekil 6: Kazanan çözüm Tensorflow, Keras ve XGBoost çerçevelerini kullanıyor

S: Bu yarışmada hangi araçları ve kitaplıkları seçtiniz?

Cevap: Şahsen, TensorFlow ve Keras'ın kullanılacak en iyisi olduğunu düşünüyorum, bu yüzden derin öğrenme problemleriyle uğraşırken onları seçme eğilimindeyim.

İstifleme ve artırmanın iki entegre öğrenme yöntemine gelince, bunu uygulamak için XGBoost kullanıyorum.Bu aynı zamanda ona aşina olmam ve iyi sonuçlara sahip olduğunun kanıtlanmış olmasıdır.

Yarışmada dl4cv sanal ortamımı kullandım (bu bilgisayarla görme derin sinir ağlarında kullanılan Python sanal ortamı) ve ona XGBoost'u ekledim.

S: Kaggle yarışmalarına ilk kez katılan yeni başlayanlar için iyi bir öneriniz var mı?

Cevap: Kaggle'ın harika bir topluluk kültürü var ve bunun üzerindeki yarışmalar bu mekanizma tarafından yürütülüyor.

Oyuncuların topluluk içinde tartışabileceği birçok forum vardır ve ayrıca çeşitli tartışma yolları da vardır. Yarışmacılar isterlerse kodlarını paylaşabilirler. Genel yöntemleri öğrenmeye ve kodu belirli problemlere uygulamaya çalıştığınızda bu çok yararlıdır.

Kaggle yarışmasına ilk kez katıldığımda, forumdaki makaleleri ve diğer yüksek kaliteli kodları dikkatlice okuyarak birkaç saat geçirdim ve bunu öğrenmenin en iyi yollarından biri olarak buldum.

S: Bir sonraki adım için planlarınız nelerdir?

Cevap: Şu anda yapacak çok projem var, bu yüzden bir süre meşgul olacağım. Çok ilginç görünen bazı Kaggle yarışmaları da var, bu yüzden muhtemelen onlara katılmak için daha sonra geri geleceğim.

S: Okuyucular sizinle iletişim kurmak isterse, iletişim yönteminiz nedir?

Cevap: En iyi yol LinkedIn kullanıcı profilime yazmaktır. Weimin Wang ile LinkedIn aracılığıyla da iletişime geçebilirsiniz. Aynı zamanda PyImageConf2018'e de katılacağım, benimle yüz yüze görüşmek isterseniz o zaman bana gelebilirsiniz.

PyImageSearch aracılığıyla

Leifeng.com AI Araştırma Enstitüsü tarafından derlenmiş ve derlenmiştir.

Yorum: Yunmi Technology'nin ABD'deki halka arzı, Xiaomi'nin ekolojik zincirinden kopmak için bir "kumar".
önceki
Üst düzey ticari çaylak DEVELOP Devan ineo + 258 renkli çok işlevli makine değerlendirmesi
Sonraki
Emekliliği ertelemek bizden ne kadar uzakta?
2019 Domuz Yılı daha güzel ve zarif, Xiao Ji, Bayrağı gerçekleştirmenize yardımcı oluyor!
Yüzlerce çiçeğin açtığı yapay zeka çağında, Horizon güvenliği güçlendirmek için yapay zeka çiplerini nasıl kullanıyor?AI Güvenlik Zirvesi 2018
Steam'deki strateji oyunu "Azizlerin Savaş Bayrağı", 2019 baharında piyasaya sürülecek.
Bugün kırılganlık ve depresyonla birlikte savaşalım
Yemek pişirme ve müzik de doğru. Alman-İtalyan HT9828 davlumbaz editörün tavsiye ödülünü kazandı
Grandland Smart Liu Mingyan: Akıllı Evin Yeni Gelişimi, Grandland Smart Yeniden Yükselmeye Başladı
Hayatının geri kalanını kutla
Aynı gökyüzüne bakıyorum! "Youkai Watch 4" altyazıyı ve son fragmanı duyurdu
"Acele et ve kardeşimi götür" gösteriye devam ediyor, mizaç annesi Jiang Hongbo tam puanlı bir sürpriz yaptı
Daha zarif bir kadın olmak için Xiaoji kozmetik buzdolabı güzelliğiniz için savaşmanıza yardımcı olur
Mobike kendisini Meituan'a satıyor / YouTube genel merkezindeki çekim / Apple, Google yöneticilerini avlıyor / Ctrip çevrimiçi araba çağırma lisansı alıyorLei Feng Morning Post
To Top