Metin | Spektrum
Afrika şehirlerinde, Henan'ın kırsal kesimlerinde, hayal edemeyeceğiniz her yerde çok sayıda veri açıklayıcısının olduğunu duymuş olabilirsiniz.
Resimdeki her vazoyu ve her arabayı elle çerçevelediler ve "vazo" ve "araba" olarak işaretlediler. Bir süre sonra, bu insanlar binlerce işaretli fotoğrafı paketleyip Pekin, Şanghay ve hatta San Francisco'daki AI şirketlerine gönderdiler.
GQ bu insanlara "yapay zeka için çalışanlar" diyor.
Yapay zeka hızla gelişiyor ve irili ufaklı internet teknolojisi şirketleri art arda araştırmalar yaparak bunları ticari kullanıma soktular. Bununla birlikte, kullanılabilir bir yapay zekayı eğitmek için büyük miktarda doğru etiketlenmiş resim, video ve diğer materyaller gerekir.
Bu nedenle, pazarın veri açıklama talebi o kadar büyük ki "AI için çalışanlar" katılmak için acele ediyor ve daha önce iş bulamayan birçok avare var - sonuçta bu iş yalnızca fareyi hareket ettirmeyi ve kullanmayı gerektirir Fazla bilgi yok.
Ancak korkarım ki bu insanlar yakında tekrar işsiz kalacaklar.
Geçen hafta, Johns Hopkins Üniversitesi, Stanford Üniversitesi ve Google'dan uzmanlar, sinir ağlarını otomatik olarak aramak ve bunları görüntü segmentasyon araştırmalarına yatırmak için sinir ağlarını kullanımlarını tanıtan bir makale yayınladılar. ilerleme:
Araştırmacılar, bir sinir mimarisi (A) tasarlamak için Sinirsel Mimari Seartch (NAS) teknolojisini kullanıyor, yeni bir sinir mimarisini (B) otomatik olarak aramasına / tasarlamasına ve görüntü semantik segmentasyonuna (semantik görüntü segmentasyonu) yatırım yapmasına izin veriyor. Görevde.
Araştırmacılar, otomatik olarak aranan bu sinir mimarisi B'nin ana akım küçük ölçekli görüntü veri kümeleri üzerinde eğitim almadan doğrudan kullanıldığını ve performansının mevcut insan tarafından tasarlanmış ve önceden eğitilmiş modelleri aştığını buldu.
Geçmişte insanlar her zaman yapay zekayı tasarlamanın çok fazla bilgi ve deneyim gerektirdiğine inandılar, kısacası insanların tasarım yapmasını gerektirdi.
Ancak şimdi, AI tarafından tasarlanan AI, insanlar tarafından tasarlanan AI'dan daha güçlü.
Makalenin başlığının adı Auto-DeepLab: Anlamsal Görüntü Segmentasyonu için Hiyerarşik Sinir Mimarisi Araması
Araştırmacılar, sinir mimarilerini otomatik olarak arayabilen (tasarlayabilen) bu teknolojiyi Auto-DeepLab olarak adlandırdı. Ad, Google'ın yapay olarak geliştirilmiş görüntü semantik segmentasyon teknolojisi olan DeepLab'den gelmektedir. Auto'dan önce, DeepLab temelinde yeni teknolojinin büyük ölçüde otomasyon elde edebileceği anlamına gelir.
Makalenin imzalı yazarlarından ikisi Johns Hopkins Üniversitesi'nden, ilk yazar Google'da stajyer olan Chenxi Liu, dördü Google'dan, geri kalanı ise Google Cloud'un eski baş bilim adamı Stanford Üniversitesi'nden. , Bilgisayarla görme akademisi ve endüstrisinde tanınan Profesör Li Feifei.
"AutoML (Editörün Notu: algoritma seçimini, model hiperparametre ayarlamasını, yinelemeli modellemeyi ve model değerlendirmeyi otomatikleştiren Google liderliğindeki AI planı) ve yapay zekanın yaygınlaşması ruhuna uygun olarak, uzman deneyimine ve bilgisine güvenmiyoruz, Sinir ağı mimarisi otomatik olarak tasarlandı ve insanların ilgisi önemli ölçüde arttı. "Yazar bahsetti.
Auto-DeepLab, "AI otomatik olarak tasarlayan AI" konusunda birkaç önemli yeni girişimde bulunuyor.
Her şeyden önce, sinir mimarisi araştırması NAS teknolojisi, AI alanında ortaya çıkan bir türdür ve temel olarak basit görüntü sınıflandırması için kullanılır. Bu makalede, araştırmacılar ilk olarak NAS'ı yüksek yoğunluklu görüntü öngörü görevlerine (yani, Cityscapes kentsel sokak görünümü veri kümesi, PASCAL VOC 2012 ve ADE20K gibi daha karmaşık yüksek çözünürlüklü görüntülerin anlamsal bölümlendirmesine) yerleştirmeye çalıştı. veri seti).
İkinci olarak, bilgisayar görüşü alanındaki sinir ağı mimarisi genellikle bir iç katmana ve bir dış katmana bölünmüştür.Otomatik sinir mimarisi tasarımı yalnızca iç katmanı tasarlayabilir ve dış katman hala insan tasarımı ve manuel ayarlamaya ihtiyaç duyar. Ve Auto-DeepLab, yapay zekanın dış katman tasarımında ve parametre ayarlama yeteneklerinde ustalaşmasına ve görüntü semantik segmentasyon görevlerinde mükemmel sonuçlar elde etmesine izin veren ilk girişimdir.
Altı kelime "Görüntü Anlamsal Bölümleme" biraz kafa karıştırıcı gelebilir, ancak aslında anlaşılması kolaydır: bir resmi birkaç kategoriye ayırın ve ardından tüm pikselleri sınıflandırın.
Örneğin, aşağıdaki resim basitçe üç kategoriye ayrılabilir. İmge anlamsal bölümlemenin görevi, her pikselin bir kişiye mi, bisiklete mi yoksa bir arka plana mı ait olduğunu belirlemektir.
Açık olması gereken, görüntü anlamsal bölümlemenin görevinin yalnızca bir pikselin hangi kategoriye ait olduğunu belirlemek olduğu ve bağımsız nesneleri tanımlayıp ayırt edemeyeceğidir.
Bununla birlikte, imge anlamsal bölümleme, cep telefonu fotoğrafçılığı için kullanılabilen "portre modu" gibi, hala çok önemli bir anlama sahiptir. Daha iyi görüntü semantik bölümleme teknolojisini kullanan cep telefonları, ister bir kişiye ister bir arka plana ait olsun, daha yüksek hassasiyetli bir fotoğraftaki her pikseli tanımlayabilir.
Şu anda Google, Xiaomi ve diğer şirketler bu teknolojiyi cep telefonlarında kullanıyor. Teorik olarak, gelecekteki "portre modu" saç ve giysi kenarlarında daha iyi sonuçlar elde edebilir.
Ve otonom sürüş sahnesinde, sinir ağının bunun bir araba, bir yaya veya öndeki bir bina olup olmadığını belirlemesi ve ardından bundan kaçınmak için farklı stratejiler benimsemesi gerekiyor ve bu da temeli oluşturmak için görüntü semantik bölümlemesini gerektiriyor.
Bu makalenin etkisinden, Auto-DeepLab başka görevlere de aktarılabilir. Bunun anlamı, yapay zekanın yapay zekayı otomatik olarak tasarlaması için çok fazla hayal gücünün olabileceğidir.
Örneğin yazar, makalenin sonunda, mevcut araştırma çerçevesinde, nesne tanıma yönünde araştırmaya devam edebileceklerini belirtmiştir.
Benzer sonuçlar elde edilebilir ve geniş ölçekte kullanılabilirse, bir gün, veri açıklama (özellikle görüntü açıklama) konusunda, insan açıklamalarının maliyetinin avantajları da ortadan kalkabilir.
Yapay zeka, yapay zeka için çalışabiliyorsa, insanlardan daha verimli ...
Yapay zeka için çalışanlar işini kaybedecek mi?
Editör: Xu Xiangying