Sogou, birden fazla göstergeyle dünya rekorları kırarak Cityscapes değerlendirme dünya şampiyonu oldu

Son zamanlarda, Sogou'nun vizyon araştırma ekibi, Nvidia, Facebook ve Shangtang gibi düzinelerce güçlü uluslararası bilimsel araştırma kurumunu yenerek ve bir anda onları tazeleyerek, otonom sürüş alanında uluslararası yetkili değerlendirme koleksiyonu Cityscapes alanında vaka segmentasyon değerlendirmesinde birinciliği kazandı. Çin'i temsil eden ve olağanüstü teknik gücümüzü dünyaya gösteren bir dünya rekoru.

Bu, Sogou'nun bu yıl CVPR konferansında WAD Otonom Sürüş Tanıma Mücadelesini kazandıktan sonra kazandığı bir başka şampiyonluk. Kısa bir süre içinde arka arkaya iki dünya şampiyonluğu kazanmak, Sogou'nun bilgisayarla görmede sektör lideri olduğunu tam olarak kanıtlıyor.

Cityscapes değerlendirme veri kümesi nedir?

Hepimizin bildiği gibi yapay zeka teknolojisi, otonom sürüş alanında çok geniş bir pazar alanına sahip ve aynı zamanda insanlar için en umut verici uygulamalardan biri. Yapay zekanın yol durumu bilgilerini yargılama ve tanıma yeteneğinin nasıl belirleneceği, değerlendirme veri seti seviyesine bağlıdır.

Cityscapes değerlendirme veri seti 2015 yılında Mercedes-Benz tarafından tanıtılmış ve yayınlanmıştır. Şu anda otonom sürüş alanında en yetkili ve profesyonel imaj anlamsal segmentasyon değerlendirme setlerinden biri olarak kabul edilmektedir.Gerçek sahnelerde kentsel yol ortamının anlaşılmasına ve görevin zorluğuna odaklanmaktadır. Otonom sürüş gibi popüler taleplere daha yüksek ve daha yakın. Cityscapes değerlendirme veri setinde iki alt görev vardır: piksel segmentasyonu ve örnek segmentasyonu Piksel segmentasyonu ile karşılaştırıldığında, örnek segmentasyonu daha zordur ve aynı zamanda bilgisayar görüş alanındaki en önemli ve zorlu görevlerden biridir.

Makinelerin nasıl daha "akıllı" hale getirileceği ve yeterli öğrenme yeteneklerine sahip olunması, tüm yapay zeka araştırma ve geliştirmelerinde en büyük sorundur ve aynı zamanda yerli ve yabancı teknoloji şirketlerinin çalışmak için yarıştığı otomatik sürüş teknolojisidir. Cityscapes değerlendirme veri setinde öne çıkabilmek ve dünya rekorunu kırabilmek, Sogou'nun zaten AI teknolojisinde güçlü bir sert güce sahip olduğu anlamına geliyor.

Örnek segmentasyonu, otonom sürüşün şafağı ortaya çıktı

Örnek bölümleme, hedef algılama, görüntü bölümleme ve görüntü sınıflandırma gibi birden çok AI teknolojisini birleştiren çok kapsamlı bir sorundur. Adından da anlaşılacağı gibi, piksel düzeyinde anlamsal bölümleme, görüntüdeki her pikseli karşılık gelen bir kategoriye sınıflandırmaktır, yani piksel düzeyinde sınıflandırmaya ulaşmaktır; sınıflandırmanın belirli nesnesi bir örnektir. Bu durumda, örnek segmentasyonu yalnızca piksel düzeyinde sınıflandırmayı değil, aynı zamanda belirli kategoriler temelinde farklı örnekleri de gerektirir. Örnek bölümleme, sürücüsüz arabalar, robotlar ve video gözetimi gibi alanlarda çok önemli ve önemli bir değere sahiptir ve dünya çapındaki bilimsel araştırma ve geliştirme topluluğunun yakın ilgisini çekmiştir.

Şehir Manzaraları değerlendirme seti, farklı koşullar altında 50 şehirde sokak manzaraları ve 30 tür nesne etiketi içerir. Sogou'nun bu kez katıldığı örnek sahne görüntüsü anlamsal bölümleme değerlendirmesi, birçok nesne kategorisine ve karmaşık sahneye sahiptir ve bu da zorluğu çok zorlaştırır. Karmaşık bir örnek ortamla karşı karşıya kalan Sogou'nun teknolojisi çok zekidir.

Geçmişte, yapay zekayı genellikle tek bir şeride odakladık, ancak gerçek yol durumu bilgileri çok karmaşık ve değişkendir. Sürücülerin yeterince "altı yolu görmeleri, tüm yönleri duymaları" gerekir. Tüm yol koşullarını gözlemlemek için genel duruma bakın. Bu nedenle Sogou, küresel bir kodlama modülünü tanıtarak örnek segmentasyonunda küresel bilginin etkisini önemli ölçüde iyileştirdi. Global kodlama modülü, görüntüdeki anlamsal bilgileri iyi bir şekilde yakalayabilir ve örnekle ilişkili özellik eşlemesini seçmeli olarak vurgulayabilir, böylece doğruluğu artırabilir.

Öte yandan, eğitim sürecinde her pikselin segmentasyon kaybını ortaya koyarsanız, sahnenin küresel bağlamının kullanımına odaklanmak yerine, sınıflar arasında ciddi bir dengesizliğe neden olacaktır. Bu duruma yanıt olarak, Sogou, küresel bir eşgörünüm kodlama kaybı fonksiyonu GIE-loss'u tanıttı. Bu kayıp işlevi, ağın küresel anlamsal bilgiyi öğrenme yeteneğini güçlendirmek için sahnede görünen örnek kategorilerini tahmin edecektir. Her piksel için geleneksel kayıp işlevinin aksine, GIE kaybı, boyutuna bakılmaksızın her nesneye aynı şekilde davranır Bu kayıp işlevini kullandıktan sonra, küçük nesnelerin bölümleme etkisi açıkça daha iyidir.

Karşılaştırma Tablosu Bir

Karşılaştırma Tablosu İki

Karşılaştırma Tablosu Üç

Yukarıdaki sonuçların karşılaştırması sayesinde, örneğin segmentasyon gibi geleneksel algoritmanın hem yakın hem de uzak nesneleri hesaba katamayacağı eksiklikleri tamamen değiştiren global kodlama modülünün tanıtımını açıkça görebiliriz.Yakın nesneler çok iyi tanınabilir ve uzaktaki küçük nesneler bölümlere ayrılır. Etki de çok gelişti ve son AP100 endeksini diğer takımları çok geride bıraktı.

Şimdiye kadar, Cityscapes değerlendirmesi, Facebook, Hong Kong Çin Tıbbı Üniversitesi, SenseTime, NVIDIA ve diğer pek çok yenilikçi şirket ve yurtiçi ve yurtdışındaki en iyi akademik kurumlar dahil olmak üzere yaklaşık yüz ekibi cezbetti. Son iki yılda SenseTime, Hong Kong Çin takımı ve NVIDIA'nın tüm görüntü segmentasyon değerlendirmelerinde neredeyse şampiyonluğu ele geçirdiğini belirtmekte fayda var. Yarışmaya ilk kez katılan Sogou ekibi, tüm değerlendirme göstergelerinde diğer takımları çok geride bırakarak dünya rekoru kırarak tartışmasız sonuçlarla birinciliği kazandı.

Sürekli algoritma birikimi ve yineleme yoluyla, Sogou vizyon araştırma ekibi, gerçek uygulama gereksinimlerini karşılamak için görevler için algoritma modellerini hızlı bir şekilde taşıyabilen bir dizi verimli ve kullanımı kolay genel algılama ve segmentasyon çerçevesi oluşturmuştur. CVPR2018 WAD algılama görevi, temelde bu örnek segmentasyon görevinde kullanılan modelle aynıdır ve bu, modelin verimliliğini ve kullanım kolaylığını doğrular. Aynı zamanda, ekip kısa süre önce bazı basit deneyler yaptı. Birkaç kod değişikliğiyle, yalnızca birkaç saatlik eğitim, bazı ünlü değerlendirme veri kümelerinde en yüksek puanları elde edebilir.

"Doğal etkileşim + bilgi hesaplamaya" odaklanan Sogou'nun gelecekteki yapay zeka yolu ulaşılacak

Yapay zeka önermelerinin kapsamı çok geniş ve Sogou'nun atılım seçimi çok küçük. Noktayı yüzeye çıkarmak, Wang Xiaochuan'ın Sogou için planladığı gelecekteki yol.

Sogou, doğal etkileşim alanının gelişimine odaklanarak her zaman yapay zeka temel stratejisi olan "doğal etkileşim + bilgi hesaplama" stratejisine bağlı kalmıştır. Ses alanında, yeterli gerçek derlem verisi avantajına sahip olan Sogou, ses tanımayı insan-makine diyaloğu ile birleştirdi, Zhiyin motorunu piyasaya sürdü ve dünyanın ilk ticari yapay zeka eşzamanlı çevirisini başlattı. Yalnızca ses tanımanın "dinleme becerisine" ek olarak, Sogou sentez yönünde "konuşma becerisine" yönelik atılımlar da yaptı. Otomatik olarak öğrenebilen yapay zeka makinesi, hem dinleme, konuşma hem de çeviri yeteneklerine sahiptir ve sektöre öncülük eder. durum. Çok modlu girdi, Sogou'nun sesli etkileşim araştırma ve geliştirmesinin odak noktası haline geldi.

Görüş alanında, Sogou ayrıca yapay zeka teknolojisinde sürekli atılımlar gerçekleştirerek makinelerin doğal etkileşimini daha kapsamlı hale getirdi. 2017 Wuzhen İnternet Konferansı'nda Sogou, sektörün ilk dudak dili tanıma teknolojisini piyasaya sürdü, ilk görme ve işitme kombinasyonunu gerçekleştirdi ve makinelerin kullanıcıların taleplerini daha çeşitli boyutlarda anlamalarına yardımcı oldu. Araçlar ve akıllı evler gibi dikey sahnelerde doğruluk oranı% 90'a kadar çıkmaktadır. Bu kez, şehir manzaralarının örnek sahne görüntüsü semantik bölümleme değerlendirmesi büyük bir zafer kazandı ve aynı zamanda Sogou'nun görsel tanıma teknolojisi birikimini yansıtıyor ve makinenin çeşitli algılama yeteneklerinin etkileşim düzeyini daha da iyileştirmesine yardımcı oluyor.

Art arda birçok uluslararası yarışma şampiyonluğunu kazanan Sogou, yapay zeka alanında yeterli teknik altyapısını kanıtladı. Gelecekteki AI yolu olan Sogou'nun kesinlikle daha iyi sonuçlar alacağına ve kullanıcının etkileşimli deneyimini kişisel olarak iyileştirmek için gerçek AI ürünlerini kullanacağına inanmak için nedenlerimiz var.

Yunqi Konferansı 19'unda başladı. Bu "eğlenceli" ve "yararlı" teknolojileri önceden araştırdık.
önceki
P2P seri fırtınalar, "akıllı yönlendiricilerin yaratıcısı" bağışık değildir!
Sonraki
Lütfen çevrimiçi çocukların İngilizce platform seçimine dikkat edin: sınıfta değilse bazı platformlar düşülebilir
"İnternet +" çağında bilmeniz gereken sekiz yasal konu!
Sun Xingyun ile röportaj: İçemiyorum, emekli olamıyorum ve evlenemiyorum. Geç saatlere kadar ayakta kalan Koreli hayranlar için savaşmalıyım
Intelin dahili yol haritasına maruz kalma: AMDnin iplik yırtıcılarına karşı yeni ateş serisi 28 çekirdek
Sahte sahteler çıldırdı! Pinduoduo resmi yanıtı: nadir bir çevrimiçi kamuoyu saldırısından muzdarip
Lei Jun: Gerçekten açlık pazarlaması değil, Xiaomi Mi 9 çok popüler ve onu kapmak zorundasın
Sun Xingyun ile röportaj: İçemezsin, emekli olduktan sonra evlenemezsin, geç saatlere kadar ayakta kalan Koreli hayranlar için savaşmalısın
210.000 ABD Doları gibi çok yüksek bir fiyata ikinci el mal satmak, ne olduğunu bilmek ister misiniz? dedim
Microsoft Office paketinin fiyatı yine arttı!
Taç Yol Kısa Eksen, Taç Yol Sübvansiyonu, Taç Yol Kupası Tutucu
Palm Fun Technology Başkanı Liu Huicheng, Mobil Oyun Endüstrisini Yükseltme Yolunu Analiz Etmek İçin CDEC2018'e Katıldı
Uluslararası bir arkadaş çevresi oluşturmak için uluslararası bir arkadaş çevresi oluşturun
To Top