Google'ın yeni makalesi: Robotların belirli nesneleri kavramak için görsel tanımaya güvenmesine izin verin

Annie arXiv'den derlendi

Qubit Üretildi | Genel Hesap QbitAI

Kısa süre önce, Google ekibi arXiv'de yeni bir "Anlamsal Kavrayışta Uçtan Uca Öğrenme" makalesi yayınladı. Bu makale, Google üyeleri Eric Jang, Sudheendra Vijayanarasimhan, Julian Ibarz, Sergey Levine ve Peter Pastor tarafından ortaklaşa tamamlandı.

Qubits, makaledeki temel bilgileri seçer, derler, düzenler ve herkesle paylaşır.

Deney tanıtımı

Bu makale ilk olarak robotun anlamsal yakalama görevini tartışmaktadır, yani robot, kullanıcı tarafından belirlenen kategorideki karşılık gelen nesneleri yakalamak için monoküler görüntüler kullanır. Görsel sinir işleme modelindeki ikili akış hipotezinden esinlenen araştırmacılar, nesne tanıma, sınıflandırma ve yakalama rotalarının tasarımının uçtan uca öğrenilmesine izin veren anlamsal bir yakalama çerçevesi önerdiler.

Personel, test için kullanılan eşyaları kullanıcının tanımlamasına göre 16 kategoriye ayırır.

Shuangliu hipotezinden esinlenen araştırmacılar, modeli "ventral akış" ve "geri akış" olarak ikiye ayırdı.

Dorsal akış (yeşil) ve karın akışı (mor), görsel korteksin aynı alanından kaynaklanır / Wikipedia

Bu modelde, abdominal akış nesne kategorilerinin belirlenmesinden sorumluyken, geri akış doğru kavrama için gereken geometrik ilişkiyi açıklamaktadır. Test uzmanları, geri akışı eğitmek için çok sayıda kendi kendini denetleyen veri seti elde etmek için robotun otonom veri toplama yeteneklerini kullandı ve uygun insan gözetimi eşliğinde karın akışını eğitmek için yarı denetimli öğrenmede etiket yayma algoritmasını kullandı.

İkili akış hipotezinden etkilenen model, abdominal akış ve dorsal akış olarak ikiye ayrılır.

Makale, deneysel yöntemlerle geliştirilmiş kavrama sistemi yöntemini göstermektedir. Tabii ki, bu yalnızca uçtan uca içeriği değil, aynı zamanda sınırlayıcı kutu algılamasını kullanan temel işleme yöntemlerini de içerir. Sadece bu değil, aynı zamanda yardımcı veriler, anlamsal olmayan yakalama verileri ve ana olmayan işlemler ve anlamsal olarak etiketlenmiş görüntüler ile birlikte eğitilen ve anlamsal yakalama performansını büyük ölçüde artırabilecek bir model gösterdi.

Deneyde kullanılan robot kolun iki parmağı ve bir monoküler görüntü kamerası var.

Deneysel sonuçlar

Bu deneyde, robotun farklı nesne türleri arasından rastgele belirlenmiş beş nesneyi kavramasına izin verilerek robotun anlamsal kavrama yeteneği değerlendirilir. Her deney 10 kez tekrarlandı ve yakalanan nesneler 30 eğitimli denek ve 30 test edilmemiş denekten oluşuyordu. Araştırmacılar, temel karşılaştırma yoluyla karar verme anlamsal yakalama modelinde çeşitli mimarilerin rolünü kanıtladılar.

Karşılaştırmalı deney sonuçlarının istatistiksel tablosu

Bu deneyin sonuçları aşağıdaki 6 nokta olarak özetlenebilir:

1) Uçtan uca anlamsal yakalama, geleneksel tespit ve sınıflandırma yöntemlerinden daha iyidir

2) Çift akışlı anlamsal ayrıştırma tahmini, tek akışlı modelden daha iyidir

3) Ayrılmış mimariyi anlama yeteneği, çift dallı mimariden daha iyidir

4) Dikkatli 9 katmanlı CNN, dikkat çekmeden 16 katmanlı CNN'den daha iyi performans gösterir

5) Yardımcı anlamsal veriler, çift akışlı mimarinin sınıflandırma performansını artırabilir

6) Nesnelerin dağılımını yansıtan yardımcı anlamsal veriler, sınıflandırma ve yakalama doğruluğunu artırır

Son olarak, kağıdın adresini ekleyin:

https://arxiv.org/abs/1707.01932

Bitiş

Bir uyarı

Beş grup kübit okuyucu başvuruya açıktır.Yapay zeka ile ilgilenen arkadaşlar, kübit asistanının WeChat qbitbot2'sini ekleyebilir, gruba katılmak için başvurabilir ve yapay zekayı birlikte tartışabilir.

Ayrıca, qubit ustaları tarafından bir araya getirilen otonom sürüş teknolojisi grubu, Yalnızca otonom sürüşle ilgili alanlarda çalışan öğrencileri veya öncü mühendisleri kabul edin . Uygulama yöntemi: qbitbot2'yi arkadaş olarak ekleyin, not " Otopilot "Katılmak için başvurun ~

İşe Alım

Qubit'ler işe alıyor muhabiri düzenlemek Pozisyonları bekliyorum, Pekin, Zhongguancun'da çalışıyor. İlgili ayrıntılar için lütfen şu yanıtı verin: resmi hesabın diyalog arayüzünde "İşe Alım".

Kaptan Çin hikayenin bir kopyası, posterler bile Call of Duty'yi kopyalamak zorunda mı? Oyuncu: Bu çok Çinli
önceki
Bir piyano kadar zariftir ve bir evi nasıl tutacağını bilir. Bu araba "Tanrıça" unvanına layıktır.
Sonraki
2 puan% 69 +% 77 sepet altında + 3 puan% 40, bu şu anki mektup kardeşim!
Küresel oyun endüstrisine hükmetmek için! Tencent, Steam'i onaylamak için büyük bir hamle mi yaptı? Oyuncular paniğe kapılıyor!
Wen Xiaoting Süper Lig'e veda ediyor! Ödül töreninin yeni tarzı, sıcak tartışma hayranlarını kendine çekiyor: Guizhou futbolunun yükünü uyandırmak
Anlamsal bölümlemede derin öğrenme yöntemlerinin tam çözümü: FCN ve SegNet'ten DeepLab'a
Yeni Güneydoğu DX7 gerçek kapasitesini ortaya koyuyor Tüketiciler satın alacak mı?
Hızlanın, saldırın ve iyi savunma yapın, "Çifte İmparator" Roketlerin iki damarından geçmek için 3 vuruş!
O zamanlar, en güçlü DOTA oyuncusu, ülkenin şanını kazanmak için yılda on şampiyonluk kazandı ve şimdi moba mobil oyunları oynayarak yaşıyor.
Dalian partisi asker ve general gönderir! U23 Nanjing'e asker göndermek üzere Hayranlar: İlk takım hala bir araya gelebilir mi?
Geelynin Ocak-Şubat satışları yıllık bazda% 38,5 arttı
40 yaşında bir gazi daha! Bekarlar kral, tarihin 4 puan kralı, en iyi altıncı adam hükümdarı!
O zamanlar 1980'lerde doğan oyun konsollarının% 80'i teknoloji ile değil, nefes alarak tamir edilebilir miydi?
Guoan sadece 1 adil yarışma ödülü kazandı ve 6 kulüp hiç para almayacak! Hayranlar: Bir ödül Dalian'a gidiyor
To Top