Li Feifei ve diğerlerinin yaptığı yeni araştırma, yapay zekayı gerçekten gereksiz hale getirebilir

Metin | Spektrum

Afrika şehirlerinde, Henan'ın kırsal kesimlerinde, hayal edemeyeceğiniz her yerde çok sayıda veri açıklayıcısının olduğunu duymuş olabilirsiniz.

Resimdeki her vazoyu ve her arabayı elle çerçevelediler ve "vazo" ve "araba" olarak işaretlediler. Bir süre sonra, bu insanlar binlerce işaretli fotoğrafı paketleyip Pekin, Şanghay ve hatta San Francisco'daki AI şirketlerine gönderdiler.

GQ bu insanlara "yapay zeka için çalışanlar" diyor.

Yapay zeka hızla gelişiyor ve irili ufaklı internet teknolojisi şirketleri art arda araştırmalar yaparak bunları ticari kullanıma soktular. Bununla birlikte, kullanılabilir bir yapay zekayı eğitmek için büyük miktarda doğru etiketlenmiş resim, video ve diğer materyaller gerekir.

Bu nedenle, pazarın veri açıklama talebi o kadar büyük ki "AI için çalışanlar" katılmak için acele ediyor ve daha önce iş bulamayan birçok avare var - sonuçta bu iş yalnızca fareyi hareket ettirmeyi ve kullanmayı gerektirir Fazla bilgi yok.

Ancak korkarım ki bu insanlar yakında tekrar işsiz kalacaklar.

Geçen hafta, Johns Hopkins Üniversitesi, Stanford Üniversitesi ve Google'dan uzmanlar, sinir ağlarını otomatik olarak aramak ve bunları görüntü segmentasyon araştırmalarına yatırmak için sinir ağlarını kullanımlarını tanıtan bir makale yayınladılar. ilerleme:

Araştırmacılar, bir sinir mimarisi (A) tasarlamak için Sinirsel Mimari Seartch (NAS) teknolojisini kullanıyor, yeni bir sinir mimarisini (B) otomatik olarak aramasına / tasarlamasına ve görüntü semantik segmentasyonuna (semantik görüntü segmentasyonu) yatırım yapmasına izin veriyor. Görevde.

Araştırmacılar, otomatik olarak aranan bu sinir mimarisi B'nin ana akım küçük ölçekli görüntü veri kümeleri üzerinde eğitim almadan doğrudan kullanıldığını ve performansının mevcut insan tarafından tasarlanmış ve önceden eğitilmiş modelleri aştığını buldu.

Geçmişte insanlar her zaman yapay zekayı tasarlamanın çok fazla bilgi ve deneyim gerektirdiğine inandılar, kısacası insanların tasarım yapmasını gerektirdi.

Ancak şimdi, AI tarafından tasarlanan AI, insanlar tarafından tasarlanan AI'dan daha güçlü.

Makalenin başlığının adı Auto-DeepLab: Anlamsal Görüntü Segmentasyonu için Hiyerarşik Sinir Mimarisi Araması

Araştırmacılar, sinir mimarilerini otomatik olarak arayabilen (tasarlayabilen) bu teknolojiyi Auto-DeepLab olarak adlandırdı. Ad, Google'ın yapay olarak geliştirilmiş görüntü semantik segmentasyon teknolojisi olan DeepLab'den gelmektedir. Auto'dan önce, DeepLab temelinde yeni teknolojinin büyük ölçüde otomasyon elde edebileceği anlamına gelir.

Makalenin imzalı yazarlarından ikisi Johns Hopkins Üniversitesi'nden, ilk yazar Google'da stajyer olan Chenxi Liu, dördü Google'dan, geri kalanı ise Google Cloud'un eski baş bilim adamı Stanford Üniversitesi'nden. , Bilgisayarla görme akademisi ve endüstrisinde tanınan Profesör Li Feifei.

"AutoML (Editörün Notu: algoritma seçimini, model hiperparametre ayarlamasını, yinelemeli modellemeyi ve model değerlendirmeyi otomatikleştiren Google liderliğindeki AI planı) ve yapay zekanın yaygınlaşması ruhuna uygun olarak, uzman deneyimine ve bilgisine güvenmiyoruz, Sinir ağı mimarisi otomatik olarak tasarlandı ve insanların ilgisi önemli ölçüde arttı. "Yazar bahsetti.

Auto-DeepLab, "AI otomatik olarak tasarlayan AI" konusunda birkaç önemli yeni girişimde bulunuyor.

Her şeyden önce, sinir mimarisi araştırması NAS teknolojisi, AI alanında ortaya çıkan bir türdür ve temel olarak basit görüntü sınıflandırması için kullanılır. Bu makalede, araştırmacılar ilk olarak NAS'ı yüksek yoğunluklu görüntü öngörü görevlerine (yani, Cityscapes kentsel sokak görünümü veri kümesi, PASCAL VOC 2012 ve ADE20K gibi daha karmaşık yüksek çözünürlüklü görüntülerin anlamsal bölümlendirmesine) yerleştirmeye çalıştı. veri seti).

İkinci olarak, bilgisayar görüşü alanındaki sinir ağı mimarisi genellikle bir iç katmana ve bir dış katmana bölünmüştür.Otomatik sinir mimarisi tasarımı yalnızca iç katmanı tasarlayabilir ve dış katman hala insan tasarımı ve manuel ayarlamaya ihtiyaç duyar. Ve Auto-DeepLab, yapay zekanın dış katman tasarımında ve parametre ayarlama yeteneklerinde ustalaşmasına ve görüntü semantik segmentasyon görevlerinde mükemmel sonuçlar elde etmesine izin veren ilk girişimdir.

Altı kelime "Görüntü Anlamsal Bölümleme" biraz kafa karıştırıcı gelebilir, ancak aslında anlaşılması kolaydır: bir resmi birkaç kategoriye ayırın ve ardından tüm pikselleri sınıflandırın.

Örneğin, aşağıdaki resim basitçe üç kategoriye ayrılabilir. İmge anlamsal bölümlemenin görevi, her pikselin bir kişiye mi, bisiklete mi yoksa bir arka plana mı ait olduğunu belirlemektir.

Açık olması gereken, görüntü anlamsal bölümlemenin görevinin yalnızca bir pikselin hangi kategoriye ait olduğunu belirlemek olduğu ve bağımsız nesneleri tanımlayıp ayırt edemeyeceğidir.

Bununla birlikte, imge anlamsal bölümleme, cep telefonu fotoğrafçılığı için kullanılabilen "portre modu" gibi, hala çok önemli bir anlama sahiptir. Daha iyi görüntü semantik bölümleme teknolojisini kullanan cep telefonları, ister bir kişiye ister bir arka plana ait olsun, daha yüksek hassasiyetli bir fotoğraftaki her pikseli tanımlayabilir.

Şu anda Google, Xiaomi ve diğer şirketler bu teknolojiyi cep telefonlarında kullanıyor. Teorik olarak, gelecekteki "portre modu" saç ve giysi kenarlarında daha iyi sonuçlar elde edebilir.

Ve otonom sürüş sahnesinde, sinir ağının bunun bir araba, bir yaya veya öndeki bir bina olup olmadığını belirlemesi ve ardından bundan kaçınmak için farklı stratejiler benimsemesi gerekiyor ve bu da temeli oluşturmak için görüntü semantik bölümlemesini gerektiriyor.

Bu makalenin etkisinden, Auto-DeepLab başka görevlere de aktarılabilir. Bunun anlamı, yapay zekanın yapay zekayı otomatik olarak tasarlaması için çok fazla hayal gücünün olabileceğidir.

Örneğin yazar, makalenin sonunda, mevcut araştırma çerçevesinde, nesne tanıma yönünde araştırmaya devam edebileceklerini belirtmiştir.

Benzer sonuçlar elde edilebilir ve geniş ölçekte kullanılabilirse, bir gün, veri açıklama (özellikle görüntü açıklama) konusunda, insan açıklamalarının maliyetinin avantajları da ortadan kalkabilir.

Yapay zeka, yapay zeka için çalışabiliyorsa, insanlardan daha verimli ...

Yapay zeka için çalışanlar işini kaybedecek mi?

Editör: Xu Xiangying

Artık tanrıçalara özel değil, saf insanlar tarafından sürülebilen küçük bir araba, 6.1S yüz kırıyor ve geri dönüş oranı son derece yüksek
önceki
2019 Beijing Fuarı için "Run to the World Garden" Gönüllü İşe Alım ve Tanıtım Faaliyetleri resmi olarak başlatıldı
Sonraki
Winshang.com'a Özel: Kasım 2018'de Fujian ticari gayrimenkulündeki önemli olayların bir envanteri
Ekspres teslimat hacmi büyük ölçüde arttı, ancak çift 11 yüksekokul ekspres teslimatı patlamadı! Sırf bu yüzden ... ekspresi bir veya iki dakika içinde bulabilirsin!
"Kapıyı ağla" yoğunlaştı, Mercedes-Benz'in Guo Degang'dan öğrenmesi tavsiye ediliyor
LOL Golem'in nihai hamlesi prens tarafından kesilebilir mi? Taş adamın büyük hareketini başka ne kesintiye uğratabilir?
Guimanlong Suzhou'nun ilk mağazası Hong Leong Hui HLCC alışveriş merkezinde açıldı
Yeni nesil POLO nihayet geliyor! Görünüm daha serttir, alan çok yönlü olarak artar ve uyum baskı altındadır
Pekin 212'nin Düşüşü, sadece duygularla değil, klasiklere bir övgü
İmparator Guan-Heilongjiang Güzel Sanatlar Yayınevi Li Ming, tanrıların Çin halk efsaneleri tarafından boyanmış
TSM ormancısı kuzenine lüks bir bilgisayar göndererek şöyle dedi: Elmasla 13 yaşında ve hemen köşede!
"Sınırsız Güzellik" temasıyla Platin Otel Moda Haftası yeni zirvelere ulaşacak
Bu ortak girişim bir zamanlar bir sokak arabası olarak görülüyordu, ancak şimdi 50.000'in üzerine düştü. Neden giderek daha fazla satış yapamıyor?
Toyota'nın küresel model fabrikası, geniş alan ve yakıt açısından verimli, Corolla'dan daha kaliteli, yaklaşık 100.000
To Top