g u t x .com.tr İpek yolu - Çin'i anlamaya götürürüm

Jilian Technology, Google AI Landmark Recognition Competition'ı iki kez kazandı ve tanınma ve erişim teknolojisi gelişti

İki ay süren zorlu rekabetin ardından, Google'ın ev sahipliği yaptığı 2019 Google Landmark Recognition Challenge'ın sonuçları yakın zamanda açıklandı.Geechain Technology'nin AI ekibinin katılımcıları büyük bir puanla birinci oldu. Bu, Geechain Teknolojisinin Google'daki dönüm noktasıdır. Yarışmada ikinci kez şampiyonluğu kazanmak, Çin AI ekibi için uluslararası yarışmada bir başka kilometre taşı zaferidir.

Google, geçtiğimiz yıl dünyanın en büyük dönüm noktası veri kümesi olan Google-Simgesel'i piyasaya sürdü. Örnek düzeyinde tanıma ve görüntü almada araştırma ilerlemesini desteklemek için Google ayrıca iki yarışma düzenledi: Landmark Recognition 2018 ve Landmark Retrieval 2018. 500'den fazla araştırmacı ve makine öğrenimi araştırmacısı katıldı. Bu mücadelenin galibi olarak Jilian Technology, Amerika Birleşik Devletleri'nde düzenlenen CVPR 2019 konferansına bir kez daha teknik bir seminer vermek üzere davet edilecek.Bu konferans, bilgisayar görüşü alanında dünyanın en iyi konferansıdır ve konferans endüstrisi ve akademide tanınmaktadır.

Bu yıl Google, yeni ve daha büyük bir dönüm noktası veri kümesi google-landmarks-v2'yi yayınladı. Bu yepyeni ve daha da büyük bir dönüm noktası tanıma veri setidir. Veri seti, geçen yıla göre üç kat daha fazla olan 4,13 milyon resim içermektedir. Yer işaretlerinin sayısı 200.000 farklı yer işaretine ulaşmıştır. Bu simge yapılar arasında Almanya'daki Neuschwanstein Kalesi, Amerika Birleşik Devletleri'ndeki Golden Gate Köprüsü, Japonya'daki Kiyomizu Tapınağı, Büyük Giza Sfenksi, Machu Picchu vb. Bulunmaktadır. Google, dünya genelindeki fotoğrafçı topluluklarının veri setinin oluşturulmasını teşvik eden çabaları sayesinde bu kadar çok sayıda resmin işaretlenebileceğini söyledi.

Google AI yazılım mühendisleri Bingyi Cao ve Tobias Weyand şunları söyledi: "Hem örnek tanıma hem de görüntü alma yöntemleri, daha iyi ve daha güçlü bir sistemi eğitmek için görüntü sayısı ve çeşitli işaretler dahil olmak üzere daha büyük bir veri kümesi gerektirir. Bu veri kümesinin olabileceğini umuyoruz. Örnek tanıma ve görüntü alımında en son teknolojileri geliştirmeye yardımcı olun. "

Ölçek farklılığından dolayı, bu veri setinin çeşitliliği çok daha fazladır ve en gelişmiş örnek tanıma yöntemleri için daha büyük bir zorluk teşkil etmektedir. Bu yeni veri setine dayanarak, Google bunu 2019 Google Landmark Recognition Challenge'ı başlatmak için bir fırsat olarak değerlendirdi; bilgisayar vizyonu alanında dünyanın bilimsel elitlerini katılmaya ve birlikte daha karmaşık bir dönüm noktası saptama bilgisayar vizyonu modeline doğru büyük bir adım atmaya çağırdı. .

2019 Google Landmark Recognition Challenge Google, dünya çapında milyonlarca veri bilimcisi kullanıcısı olan ve dünyanın en yetkili veri bilimi yarışma platformu olan Kaggle platformuna hala kaydoluyor ve gönderiyor. Yarışma mekanizması, yarışmacıların belirli bir sorgu görüntüsünden sonra veritabanındaki sorgu yer işaretlerini içeren tüm görüntüleri tanımlamasını gerektirir.Bu, milyonlarca veri hacmi ve çok fazla alakasız bilgi içeren görüntü içeriği için hayal edilemez bir zorluktur.

Ek olarak, tespit edilen nesnenin bir dönüm noktası olması nedeniyle, diğer nesnelerin benzer işlemlerine kıyasla tanınmasında önemli farklılıklar vardır. Örneğin, büyük etiketli bir veri kümesinde bile, çok popüler olmayan bu yer işaretleri genellikle eğitim verilerine sahip değildir; ek olarak, yer işaretleri genellikle taşınamaz katı nesnelerdir ve bu sırada kapanma gibi görüntü yakalama koşulları, Açı, hava durumu, ışık vb. Tümü tanıma sonucunu etkileyecektir.

Bununla birlikte, Landmark Recognition Challenge hala dünyanın her yerinden 281 takımın ilgisini çekti.Program 2 ay sürdü.Katılımcılar, dünyanın her yerinden bilgisayar görüşü alanında zengin deneyime sahip yüksek kaliteli bireyler ve takımlardı. Geechain Technology'nin AI ekibi, en sonunda 0.37606 toplam puanla listede birinci oldu ve birçok tanınmış AI ekibini geride bıraktı; ikinci ve üçüncü sıralar sırasıyla 0.35988 ve 0.35541 puan aldı.

Bu Google dönüm noktası tanıma yarışmasının şampiyonu olan Jilian Technology'nin katılımcı AI ekibi de kazanma planlarını paylaştı:

Bu rekabet geçen yılla aynı zorluklara sahip:

1. Kategori sayısı son derece eşitsizdir: kategori başına ortalama 20,35 örnek, ancak 20'den az kategoride 150.000 kategori vardır ve bu toplamın neredeyse dörtte üçüdür ve yaklaşık 19.000 kategorinin örnek sayısı yalnızca 1'dir. ;

2. El ile temizleme olmadığı için, eğitim setinde aynı kategoride, herhangi bir ortak özelliği olmayan birçok resim var veya aynı dönüm noktasının resimleri farklı kategorilerde görünüyor;

3. Test setinde çok sayıda parazitli resim var.

Bu yarışmada kullanılan yöntem kabaca aşağıdaki gibidir (daha ayrıntılı bir giriş, organizatörün talebi üzerine bir makale şeklinde arXiv'e yüklenecektir):

Bu yılki toplam kategori sayısı 200.000'i aştığından, doğrudan CNN sınıflandırma ağının eğitimini bırakıyoruz ve aşağıdaki iki model ve üç adımdan oluşan geri alma yöntemini ana fikir olarak seçiyoruz.

Model 1: Küresel Erişim Modeli. Temizlenmiş eğitim seti (toplam 830.000 sayfa, 110.000 kategori) üzerine eğitilmiş global özellik tabanlı bir geri alma modeli olan omurga, ResNet-101, ResNeXt-101, SE-ResNet-101, SE-ResNeXt-101, SENet- 154 beş temel model, havuzlama GeM, RMAC, MAC, SPoC'yi seçer ve her global havuzlama, 1024 boyutlu çıktı tamamen bağlı bir katmana bağlanır ve son özellik, yukarıdaki dört havuzlama (her biri 2048 boyut) tarafından çıkarılır. Dört tam bağlı çıkışla (her biri 1024 boyut) birleştirilerek toplam 12288 boyut. Kayıp işlevi aynı anda eğitmek için Kontrastif + Üçlü seçer ve boyutluluğu eğitimden sonra 2048'e düşürmek için zayıflatılmış denetimsiz beyazlatma kullanır. Nihai model, yukarıdaki beş modelden (beş temel ağa karşılık gelir) ve açık kaynak DIR modeli ağırlıklı eklemeden oluşur.

Model 2: Yerel Erişim Modeli. Bu model, Google'ın yakın zamandaki açık kaynaklı Algılama (D2R) modelini kullanır. (https://github.com/tensorflow/models/tree/master/research/delf)

Adım 1: 118.000 test seti resminin tümünü 4.13 milyon eğitim seti resmiyle karşılaştırmak için Model 1'i kullanın Her test resmi, en yakın beş eğitim resminin benzerliğini korur ve son tahmin olarak en yüksek toplamlı kategoriyi seçer. Bu adım, özel / genel listede 0.25138 / 0.21534 puana sahiptir.

Adım 2: Adım 1 ile aynı, ancak bu sefer ilk 20 eğitim görüntüsünü saklayın ve ikincil karşılaştırma için model 2'yi kullanın ve son olarak en yüksek ikincil ilk 5 toplam puana (D2R) sahip kategoriyi tahmin edin. Bu adım, özel / genel listede 0.31870 / 0.26782 puana sahiptir.

Adım 3: Bu adım, tüm süreçteki en kritik adımdır. Oyun, puan almak için GAP mekanizmasını kullandığından, parazit resmi dereceli listede çok yüksek sıralanırsa, nihai sonucu doğrudan etkileyecektir.Bunun için aşağıdaki yeniden sıralama stratejisini benimsiyoruz. 2. adımdaki 1. derece test resminden başlayarak, daha düşük sıralara sahip tüm resimleri (sıra-20000'e kadar) Model 2 ile karşılaştırın. Puan belirli bir eşikten yüksekse (23'e ayarladık), ardından resmi artırın Sıralama. Bu işlemi tüm ilk 500 test resminde gerçekleştirdikten sonra, yeniden sıralanan listeyi iki kez yeniden sıralayın. Bu süreçten sonra özel / genel sıralama puanı 0.36787 / 0.31626'dır. Son olarak, bu stratejiyi 1. adımın tahmininde kullanın (bu sefer ilk 300'ü seçin, çünkü 1. adımın puanı nispeten düşüktür) ve yeniden sıralanmış iki yeni listenin en üstteki resimlerini çapraz bir şekilde sıralayın ve puan: Nihai puan 0,37606 / 0,32101 idi.

Ayrıca Model 1'den çıkarılan özelliklerle MLP'yi de eğitmeye çalıştık ve yukarıdaki 3. adımdaki işlemi gerçekleştirdik. Bu sonucun sonucu özel listede 0,37936'ya yükseltilebilir, ancak maalesef herkese açık listede 0.32100 puan aldığı için bu gönderiyi son gönderi olarak seçmedik.

Son olarak Geechain Technology'nin katılımcı AI ekibi de bu mücadelede kullandıkları algoritmaların Geechain Technology ürünlerinde kullanılacağını belirtti.

Geechain Technology, Geelian Teknolojisinin tanıma teknolojisindeki başarılarının bir göstergesi olan Google Landmark Challenge'a bir kez daha katıldı ve aynı zamanda Geelian Technology'nin uzun yıllardır derin yapay zeka teknolojisi geliştirmesine duyduğu güvendir. Jilian Technology, sahne tanıma, video tanıma ve diğer alanlarda olağanüstü sonuçlar elde etti ve AI + video alanında başarılı bir şekilde yerli lider bir kuruluş haline geldi. Google Landmark Challenge'da bu kez tacı ikinci kez kazanmak, Jilian Technology'nin bilgisayarla görme alanındaki lider gücünü de gösteriyor. 31 Mayıs'ta, Jilian Technology ve Fudan Üniversitesi tarafından ortaklaşa desteklenen VideoNet Video İçeriği Tanıma Yarışması'nın resmi olarak tescili kabul ettiği bildirildi.Gelecekte Jilian Technology, yapay zeka araştırma ve geliştirmeyi teşvik etmeye ve son teknoloji alanlardaki teknolojik atılımları ve uygulamaları birlikte keşfetmeye devam edecek. Yeni nesil video yapay zeka lideri olmak için yenilik yapın.

Zhongxiang Teknolojisi invertör üreticisi 12V24V - 220V şınav invertör 1000w

Şunlar da hoşunuza gidebilir

Araba soğutma suyu bardakları, akıllı araba malzemeleri, siyah teknoloji sıcak ve soğuk bardaklar, çok fonksiyonlu elektrikli ısıtma kapları, soğuk hava deposu küçük buzdolapları

Şunlar da hoşunuza gidebilir

100 muhasebe firmasının geliri açıklandı: "büyük dörtlü" geçen yıl kişi başına 615.200 kazandı

Rui Chuang Mikro Nano Teknoloji İnovasyon Kurulu toplantısı: ilk büyük müşteri Hikvision'dur