Annie arXiv'den derlendi
Qubit Üretildi | Genel Hesap QbitAI
Kısa süre önce, Google ekibi arXiv'de yeni bir "Anlamsal Kavrayışta Uçtan Uca Öğrenme" makalesi yayınladı. Bu makale, Google üyeleri Eric Jang, Sudheendra Vijayanarasimhan, Julian Ibarz, Sergey Levine ve Peter Pastor tarafından ortaklaşa tamamlandı.
Qubits, makaledeki temel bilgileri seçer, derler, düzenler ve herkesle paylaşır.
Bu makale ilk olarak robotun anlamsal yakalama görevini tartışmaktadır, yani robot, kullanıcı tarafından belirlenen kategorideki karşılık gelen nesneleri yakalamak için monoküler görüntüler kullanır. Görsel sinir işleme modelindeki ikili akış hipotezinden esinlenen araştırmacılar, nesne tanıma, sınıflandırma ve yakalama rotalarının tasarımının uçtan uca öğrenilmesine izin veren anlamsal bir yakalama çerçevesi önerdiler.
Personel, test için kullanılan eşyaları kullanıcının tanımlamasına göre 16 kategoriye ayırır.
Shuangliu hipotezinden esinlenen araştırmacılar, modeli "ventral akış" ve "geri akış" olarak ikiye ayırdı.
Dorsal akış (yeşil) ve karın akışı (mor), görsel korteksin aynı alanından kaynaklanır / Wikipedia
Bu modelde, abdominal akış nesne kategorilerinin belirlenmesinden sorumluyken, geri akış doğru kavrama için gereken geometrik ilişkiyi açıklamaktadır. Test uzmanları, geri akışı eğitmek için çok sayıda kendi kendini denetleyen veri seti elde etmek için robotun otonom veri toplama yeteneklerini kullandı ve uygun insan gözetimi eşliğinde karın akışını eğitmek için yarı denetimli öğrenmede etiket yayma algoritmasını kullandı.
İkili akış hipotezinden etkilenen model, abdominal akış ve dorsal akış olarak ikiye ayrılır.
Makale, deneysel yöntemlerle geliştirilmiş kavrama sistemi yöntemini göstermektedir. Tabii ki, bu yalnızca uçtan uca içeriği değil, aynı zamanda sınırlayıcı kutu algılamasını kullanan temel işleme yöntemlerini de içerir. Sadece bu değil, aynı zamanda yardımcı veriler, anlamsal olmayan yakalama verileri ve ana olmayan işlemler ve anlamsal olarak etiketlenmiş görüntüler ile birlikte eğitilen ve anlamsal yakalama performansını büyük ölçüde artırabilecek bir model gösterdi.
Deneyde kullanılan robot kolun iki parmağı ve bir monoküler görüntü kamerası var.
Bu deneyde, robotun farklı nesne türleri arasından rastgele belirlenmiş beş nesneyi kavramasına izin verilerek robotun anlamsal kavrama yeteneği değerlendirilir. Her deney 10 kez tekrarlandı ve yakalanan nesneler 30 eğitimli denek ve 30 test edilmemiş denekten oluşuyordu. Araştırmacılar, temel karşılaştırma yoluyla karar verme anlamsal yakalama modelinde çeşitli mimarilerin rolünü kanıtladılar.
Karşılaştırmalı deney sonuçlarının istatistiksel tablosu
Bu deneyin sonuçları aşağıdaki 6 nokta olarak özetlenebilir:
1) Uçtan uca anlamsal yakalama, geleneksel tespit ve sınıflandırma yöntemlerinden daha iyidir
2) Çift akışlı anlamsal ayrıştırma tahmini, tek akışlı modelden daha iyidir
3) Ayrılmış mimariyi anlama yeteneği, çift dallı mimariden daha iyidir
4) Dikkatli 9 katmanlı CNN, dikkat çekmeden 16 katmanlı CNN'den daha iyi performans gösterir
5) Yardımcı anlamsal veriler, çift akışlı mimarinin sınıflandırma performansını artırabilir
6) Nesnelerin dağılımını yansıtan yardımcı anlamsal veriler, sınıflandırma ve yakalama doğruluğunu artırır
Son olarak, kağıdın adresini ekleyin:
https://arxiv.org/abs/1707.01932
Bitiş
Bir uyarı
Beş grup kübit okuyucu başvuruya açıktır.Yapay zeka ile ilgilenen arkadaşlar, kübit asistanının WeChat qbitbot2'sini ekleyebilir, gruba katılmak için başvurabilir ve yapay zekayı birlikte tartışabilir.
Ayrıca, qubit ustaları tarafından bir araya getirilen otonom sürüş teknolojisi grubu, Yalnızca otonom sürüşle ilgili alanlarda çalışan öğrencileri veya öncü mühendisleri kabul edin . Uygulama yöntemi: qbitbot2'yi arkadaş olarak ekleyin, not " Otopilot "Katılmak için başvurun ~
İşe Alım
Qubit'ler işe alıyor muhabiri düzenlemek Pozisyonları bekliyorum, Pekin, Zhongguancun'da çalışıyor. İlgili ayrıntılar için lütfen şu yanıtı verin: resmi hesabın diyalog arayüzünde "İşe Alım".