Xin Zhiyuan Rehberi Google'ın en büyük önemli veri kümesi güncellemesi olan açık kaynaklı Google-Simge-v2, 5 milyon görüntü ve 200.000 önemli nokta içerir. Aynı zamanda, daha fazla insanı projeye katkıda bulunmaya teşvik etmek için toplam 50.000 ABD doları (yaklaşık 340.000 RMB) ödüllü iki yarışma düzenlenecek.
Niagara Şelalesi ve Huangguoshu Şelalesi, coğrafi konum ve fotoğraflardaki görünüm açısından farklıdır. Google AI departmanı, fotoğraftaki şelalenin yandan görünüm, önden görünüm veya hava fotoğrafı olmasına bakılmaksızın, AI'nın yalnızca ikisi arasında ayrım yapamayacağını, aynı zamanda karşılık gelen koordinatlarını da belirleyebileceğini umuyor.
Geçtiğimiz yıl Google, o zamanın en büyük dönüm noktası veri kümesi olan Google-Simgesel'i piyasaya sürdü ve 500'den fazla makine öğrenimi araştırmacısının katıldığı iki yarışma düzenledi: Landmark Recognition 2018 ve Landmark Retrieval 2018.
Bir yıldan kısa bir süre sonra Google, yükseltilmiş sürümünü açık kaynaklı hale getirdi: Google-Merkezi-v2. Bu, daha büyük bir yer işareti tanıma külliyatına sahip yeni bir kütüphanedir. İki kat fazla fotoğraf ve yedi kat daha fazla yer işareti verisi içerir. O zamandan beri Google, daha karmaşık bir dönüm noktası algılama bilgisayarlı görme modeli hedefine doğru önemli bir adım attı. Aşağıdaki resim, Google-Land-v2'deki önemli noktaların konumlarının bir ısı haritasıdır.
Ardından Google, makine öğrenimi topluluğu Kaggle'da iki yeni görev başlattı: Landmark Recognition 2019 ve Landmark Retrieval 2019 ve bölgesel bir görüntü alma çerçevesi olan Detect-to-Retrieve'in kaynak kodunu ve modelini yayınladı.
Landmark Recognition 2019 katılımcılarının yer işareti tespiti için bir AI modeli tasarlamaları gerekir. Landmark Retrieval 2019 katılımcılarının, belirlenen yer işaretleriyle ilişkili görüntüleri bulmak için bir AI sistemi kullanması gerekir. Her iki etkinlik de toplamda 50.000 $ 'lık nakit ödüller içeriyor ve kazanan takım da CVPR 2019 seminerine katılmaya davet edilecek.
Google AI yazılım mühendisleri Bingyi Cao ve Tobias Weyand şunları söyledi: "Hem örnek tanıma hem de görüntü alma yöntemleri, daha iyi ve daha güçlü bir sistemi eğitmek için görüntü sayısı ve çeşitli işaretler dahil olmak üzere daha büyük veri kümeleri gerektirir. Bu veri kümesini umuyoruz. Örnek tanıma ve görüntü alma konusunda en son teknolojileri ilerletmeye yardımcı olabilir. "
Bingyi ve Weyand'a göre, Google-Merkezi-v2, dünyanın her yerinden fotoğrafçılar tarafından toplanan 200.000'den fazla farklı yer işaretinin 5 milyondan fazla görüntüsünü içeriyor ve ardından Neuschwanstein Kalesi ve Golden Gate Köprüsü gibi fotoğraflardaki görüntülere açıklama ekliyor , Kiyomizu Tapınağı, Burj Khalifa, Sfenks, Machu Picchu ve diğer ünlü turistik yerler. Son olarak, Google araştırmacıları, tarihi tamamlamak için Wikimedia'daki resimler, ses ve diğer medya dosyaları gibi ücretsiz kaynakları kullandılar ve Az bilinen görüntüler.
Peki Algıla-Al çerçevesi ne için kullanılır? Bingyi ve Weyand, orijinal dönüm noktası veri kümesinin 80.000 alt kümesi üzerinde eğitilen yayınlanmış modelin, algılanan öğeyi içeren görüntü alanına "ekstra ağırlık" sağlamak için nesne algılama modelinden sınırlayıcı kutuyu kullandığını söyledi. Doğruluğu önemli ölçüde artırın.
Şu anda, bu veri seti için yalnızca eğitim seti indirilmeye açıktır. Test seti, meydan okuma ilerledikçe kademeli olarak açılacaktır.
veri seti:
https://github.com/cvdfoundation/google-landmark
Meydan okuma:
https://www.kaggle.com/c/landmark-recognition-2019