Google, "akıcı açıklama" AI yardımcı aracını başlattı, görüntü açıklama hızı 3 kat arttı! (Kağıt ile)

Xinzhiyuan Raporu

Derin öğrenmeye dayalı modern bilgisayarla görme modellerinin performansı (TensorFlow nesne algılama API'si tarafından uygulananlar gibi), giderek daha büyük etiketli eğitim veri kümeleri (kamuya açık görüntüler gibi) kullanılarak eğitilip eğitilemeyeceklerine bağlıdır.

ancak, Yüksek kaliteli eğitim verilerinin nasıl elde edileceği, bilgisayar görüşü alanında hızla ana darboğaz haline geliyor. Bu, özellikle otonom sürüş, robotik ve görüntü arama gibi uygulamalarda kullanılan anlamsal bölümleme piksel tahmin görevleri için geçerlidir.

Aslında, geleneksel manuel veri etiketleme araçları, etiketleyicinin görüntüdeki her bir nesneyi tanımlamak için görüntü sınırına dikkatlice tıklamasını gerektirir. Bu sıkıcıdır: COCO + Stuff veri kümesinde bir görüntüyü etiketlemek ve tamamını etiketlemek 19 dakika sürer Veri seti 53.000 saat sürüyor!

COCO veri kümesindeki görüntü örnekleri (solda) ve piksel piksel anlamsal etiketlemesi (sağda). Resim kaynağı: Florida Memory

Bu makalenin içeriği, 2018 ACM Multimedya Konferansı'nın "Cesur Yeni Fikirler" bölümünde sunulacaktır. Google araştırmacıları, sınıflandırma verilerini etiketlemek ve görüntüdeki her hedefin dış hatlarını ve dış hatlarını tanımlamak için kullanılabilecek makine öğrenimi odaklı bir arayüz üzerinde çalıştılar. arka fon, Etiketli veri setlerinin üretim hızını orijinalin 3 katına çıkarın.

Araca Akışkan Açıklama adı verilir Güçlü anlamsal bölümleme modelinin çıktısından başlayarak, manuel işaretleyiciler makine destekli düzenleme işlemleriyle onu değiştirmek için doğal kullanıcı arayüzünü kullanabilir. Google tarafından bu kez geliştirilen arayüz, etiketleyicilerin değiştirilecek içeriği ve sırayı seçmelerine olanak tanıyarak, makinenin henüz anlamadığı içeriğe verimli bir şekilde odaklanmalarını sağlar.

COCO veri kümesindeki görüntüler için akışkan ek açıklama arayüzünün görselleştirmesini kullanın. Resim kaynağı: gamene

Daha doğrusu, görüntüyü etiketlemek için, önce görüntüyü önceden eğitilmiş bir anlamsal bölümleme modeli (Mask-RCNN) aracılığıyla işleriz. Bu, yaklaşık 1000 görüntü parçası ve bunların sınıflandırma etiketleri ve güven puanları oluşturacaktır. En yüksek güven puanına sahip segment etiketi başlatmak için kullanılır ve etiketleyiciye sunulur.

Ardından etiketleyici şunları yapabilir: (1) Makine tarafından oluşturulan aday etiketlerden geçerli segment için bir etiket seçebilir. (2) Makine tarafından kapsanmayan nesnelere bölümleme ekleyin. Makine, en olası önceden oluşturulmuş bölümü belirleyecektir ve işaretçi, en yüksek kaliteyi seçebilir. (3) Mevcut bölümü silin. (4) Üst üste binen segmentlerin derinlik sırasını değiştirin. (Demo bağlantısı burada: https://fluidann.appspot.com/, yalnızca masaüstü platformları için)

COCO veri setinin üç görüntüsü üzerindeki etiketleri karşılaştırmak için geleneksel manuel etiketlemeyi (orta sütun) ve sıvı etiketlemeyi (sağda) kullanın. Manuel işaretleme araçları kullanılırken hedefin sınırı genellikle daha doğru olsa da, işaretlemedeki farklılığın en büyük nedeni, insan işaretçilerinin genellikle tam bir nesne sınıflandırması hakkında farklı görüşlere sahip olmasıdır. Kaynak: sneaka (üstte), Dan Hurt (ortada), Melodie Mesiano (altta).

Akışkan açıklama, görüntü açıklamalarını daha hızlı ve daha kolay hale getirmenin ilk adımıdır. Gelecekteki amaç, hedef sınırların işaretlenmesini iyileştirmek, arayüzün hızını artırmak için makine zekasını daha fazla kullanmak ve nihayet, daha önce tanınmayan sınıflandırmaları işleyebilen ve en verimli ve en zorlu veri toplamayı sağlayabilen arayüzün genişletilmesini gerçekleştirmektir.

Aslında, bu araçla ilgili bir ön baskı yaklaşık bir ay önce arxiv'de yayınlandı.

Kağıt adresi:

https://arxiv.org/pdf/1806.07527

Referans bağlantısı:

https://ai.googleblog.com/2018/10/fluid-annotation-exploratory-machine.html

Xinzhiyuan AI DÜNYA 2018

Dünya Yapay Zeka Zirvesi Tam inceleme

Xinzhiyuan, 20 Eylül'de Pekin'deki Ulusal Kongre Merkezi'nde AI WORLD 2018 Dünya Yapay Zeka Zirvesi'ne ev sahipliği yaptı. Makine zekası ve insan kaderi.

Xinzhiyuan AI World 2018'in büyük olayını gözden geçirin:

IQIYI

Sabah: https://www.iqiyi.com/v_19rr54cusk.html

Öğleden sonra: https://www.iqiyi.com/v_19rr54hels.html

Sina:

1.000 kilometre test sürüşü Chevrolet Explorer: üç puan hassasiyet, yedi puan kahramanca
önceki
Arabanın bu yerlerde çalındığını iddia edemez mi? Hırsızlık nasıl önlenir?
Sonraki
HKUST IFLYTEK, bilgisayarla görme değerlendirme görevleri için iki dünya rekoru daha kırdı ve art arda yedi dünya ilki kazandı!
"Sahte malların" kulübede kral olmasına asla izin vermeyin, çiftçilerin tağşiş olmadan iyi bir yaşamın tadını çıkarma hakkı vardır!
Herkesi kızdırın! ABD ordusunun on milyarlarca dolarlık büyük siparişi "içeriden" Amazon mu? Google gibi devlerden büyük memnuniyetsizlik
Kesintisiz 100.000 kilometre sürerken Kaichen D60'ın gerçekten anlatmak istediği hikaye nedir?
Sichuan güveci neden bu kadar kokulu? Alttaki malzemede gizli olan sır "açığa çıkar" ...
Tsinghua Berkeley ICLR Makalesi: Altı Budama Yöntemini Yeniden Düşünmek
Enerji krizi + yeni emisyon düzenlemeleri, 1970'lerin klasik arabaları nelerdir?
Github2.2K yıldız PyTorch kaynak listesi: 450 NLP / CV / SP, kağıt uygulaması, öğreticiler, örnekler
"Nerdesin koca, doğurmak üzereyim!"
Ücretsiz klinik hizmeti Fuxing Medical Huzurevine girdi
Mercedes-Benz'in satışları artıyor Bir 4S mağazasından nasıl bir cevap bulduk?
Pekin-Guangdong savaşı ve Su-Shanghai çatışması Süper Lig'in bu turunu patlattı, SIPG Wanda'nın rekorunu kırdı ve bir parti kazanmak için koştu.
To Top