Starbucks deneyimini yükseltmek için AR nasıl kullanılır? Ali mühendisleri "üç eksen" önerdi

Alimei'nin rehberi: Geçen yılın sonunda Şangay'da Starbucks Premium Kahve Kavurma Atölyesi açıldı.Bu, AR deneyimi olan dünyanın ilk yeni perakende kahve atölyesi. Bu AR teknolojisi, Ali Yapay Zeka Laboratuvarı'nın X Laboratuvarı tarafından geliştirilmiştir.Müşteriler AR aracılığıyla kahve içerken Starbucks kahve kavurma, üretim ve demleme işlemlerinin tamamını keşfedebilir.Aynı zamanda, AR teknolojisi aracılığıyla sezgisel olarak da hissedebilirler. 20.000 metrekarelik atölyede her detay.

Bugün, Ali Mei AR'nin arkasındaki gizemi sizin için ortaya çıkarmak için bir fincan kahve kullanacak.

AR Tanıtımı

AR tam adı artırılmış gerçeklik, gerçeklik ve sanal görüntüleme teknolojisinin gerçek zamanlı bir birleşimidir. AR'yi bir junior olarak düşünürseniz, bir Starbucks mağazasındaki işi şu şekildedir: "Kamerada cezve olup olmadığını görüyorum. Öyleyse, misafirler için üzerine bir interaktif düğme koyacağım ve sonra bunu bırakacağım Düğme her zaman cezveye yapışır. AR Xiaoer'in çalışması aslında AR teknolojisinin üç ekseni: algılama (cezve arama), işleme (etkileşimli düğmeler çizme) ve izleme (cezve yapıştırma).

Görüntü alanında, "izleme" ve "oluşturma" zaten nispeten olgun teknolojilerdir. Ana teknik engel, "algılama" nın büyüsünde yatmaktadır. Örneğin, tanınmış yabancı "Pokémon Go", kedi yakalamaya benzer bir AR oyunu olan ilk popüler oyundur. Yangına rağmen, "Pokemon Go" nun dezavantajı, AR modunun çevre ile etkileşime girememesidir.Oyuncular Pikachu'nun havada süzüldüğünü, gölde duran küçük ateş ejderhasını ve diğer tuhaf resimleri görebilirler. Teknik olarak konuşursak, "Pokémon Go" yalnızca donanım tabanlı "izleme" ve "işleme" kullanır ve algıya sahip değildir. Düşük kaliteli artırılmış gerçeklik (AR) yetenekleri, oyuncuların ikame duygusu yaşamamasına neden olur ve çoğu oyuncu, oyunu oynamak için uzun süre AR modunu kapatır.

"Pokemon Go" nun AR etkisi

Yüksek algılama yeteneklerine sahip AR nasıl görünmelidir? Şu anda, birçok sosyal yazılım ve kamera yazılımı, videolarda kullanıcıların gerçek zamanlı olarak köpek dillerini vurgulamasına, kedi kulakları takmasına ve sevimli kedi bıyıkları çizmesine olanak tanıyor. Bazı yazılımlar, kullanıcıların AR makyajını uygulamasına bile izin veriyor. Bu yazılımların tümü, yüzün konumu, ağzın açılıp kapanması ve hatta yüz özelliklerinin konumu ve konturu dahil olmak üzere olgun yüz algılama yeteneklerine sahiptir. Bununla birlikte, bu algıların, nispeten olgun yüz algılama alanına odaklanan sınırlılıkları vardır; Öte yandan, makinelerin insanların bir bakışta anlayabileceği binlerce şeyi algılaması daha zor bir görevdir.

Müşteri kimliği

AR gerçek zamanı vurgular ve müşteride elde edilebilecek tanınma en verimli olanıdır. Mağazadaki büyük bakır kutular, kavurma çekirdekleri gibi çevreden kolayca etkilenmeyen bazı büyük nesneleri belirlemek için müşteride klasik makine öğrenimi algoritmalarını kullanıyoruz ve çeşitli veri ön işleme stratejileri kullanıyoruz ve sonunda çok şaşırtıcı sonuçlar elde ediyoruz. İstemci tarafındaki işlem, sunucu tarafı erişiminin ağ trafiği tarafından kısıtlanacağı gibi değildir, yanıt süresi de çok hızlıdır ve etkisi çok kararlıdır.

Ancak mağazada AR tarafından algılanabilen nesneler, büyük bir çubuktan elde tutulan bir Fransız basınına kadar geniş bir yelpazede farklılık gösterir. Bu nesnelerin, geleneksel makine görmesinin üstesinden gelemeyeceği bazı zor sorunları vardır:

  • Metal yansıması: Bir nesneyi ortam olmadan farklı açılardan görmek tamamen farklı dokulara sahip olabilir.

  • Şeffaf: Örneğin, Fransız basınçlı kaplar ve diğer içi boş şeffaf kaplar, bunlara kaç tane nesnenin yerleştirileceğini kimse bilmiyor ve hatta çoğu zaman boş.

  • Değişen ortam: her yere yerleştirilen küçük nesneler, küçük nesneler, çeşitli cep telefonu kameraları, hepsi tanımlama zorluğunu artırır.

  • Bu sorunların üstesinden gelmek için bir Derin öğrenmeye dayalı bulut tanıma hizmeti.

    Bulut tanımlama hizmeti

    Derin öğrenmenin görüntülere uygulanması, görüntü sınıflandırma modelleri, hedef tanıma modelleri vb. Dahil olmak üzere çok olgunlaşmıştır. Görüntü algılama işlevini gerçekleştirmek için ikisini birleştiriyoruz.Aşağıda her ikisinin de özellikleri kısaca açıklanmaktadır:

    • Hedef tanıma modeli: hedefin içeriğinin yerini algılayabilir, dezavantajı algılama yeteneğinin zayıf olmasıdır

    • Görüntü sınıflandırma modeli: Yüksek algılama yeteneğine sahip bir "sınıflandırma modeli", dezavantajı hedef konumun belirlenememesidir.

    Sınıflandırma modelinin ve algılama modelinin avantajlarını birleştirerek, algılama modeli çoğu nesnenin konumunu belirlemek için kullanılabilirken, algılanması zor nesneler sınıflandırma modeline aktarılır ve bir konum "tahmin edilir".

    Sol: sınıflandırma modelinin çıktısı, sağ: tanıma modelinin çıktısı

    Görüntü sentezi

    Makine öğrenimi veya derin öğrenme olsun, büyük miktarda veri gereklidir, ancak büyük ve çeşitli verilerin toplanması çok zaman alan ve zaman alan bir projedir. Keyfi olarak yerleştirilmiş, şeffaf ve yansıtıcı cezve için eğitim verilerinin çeşitliliğinin önemi göz ardı edilemez.

    Görüntü sentezi, çeşitlilik sorununu resmi olarak çözmek için güçlü bir araçtır. Görüntü sentezi sayesinde, herhangi bir hedefi herhangi bir arka plana otomatik olarak yerleştirebiliriz:

  • Çok sayıda hedef görüntü toplamak için yeşil ekranda görüntü elde etme araçlarını kullanın

  • Otomatik yeşil ekran kesimi ile görüntü hedefini kesin

  • Herhangi bir arka plan görüntüsüyle sentezleyin ve hedef rengi arka plana benzer bir renk dağılımına dönüştürün

  • Görüntü sentezinin, boyut ve fiziksel yasalar gibi sentez sonucunun mantıksal olup olmadığını önemsemediğini belirtmek gerekir. Sentezin amacı, makineye ön plan ile arka planı ayırt etmeyi öğretmektir.

    Görüntü sentezi adımları

    Renk füzyon diyagramı

    Renk ve görüntüleme simülasyonu

    Temel bir AR uygulaması için yukarıda belirtilen proje yapılır. Bununla birlikte, AR algısı büyük ölçüde kameranın görüntüleme kalitesine dayanır Büyük ölçekli ticari AR uygulamaları için, yine de farklı cep telefonu kameralarına uyum sağlamak kesinlikle gereklidir.

    Aslında çok fazla cep telefonu kullanmak ve çok fazla veri toplamak bir çözüm, ancak bir yapay zeka ekibi için akıllıca bir yol değil. Mevcut görüntüleri diğer kameralar tarafından toplanan analog görüntülere dönüştürmek için iki otomatik algoritma kullanıyoruz:

    1. Saf renk değişimi: B görüntüsünün rengini referans olarak alın ve A görüntüsünün renk dağılımını B görüntüsüyle tutarlı olacak şekilde dönüştürün

    Saf renk değişimi örneği

    2. Tepki eğrisi simülasyonu: B kamerasının oluşturulan görüntüsünü simüle etmek için A kamerasının tepki eğrisini başka bir B kamerasının tepki eğrisiyle değiştirin

    Tepki eğrisi simülasyon sonuçları örneği

    AR ve yeni perakende

    Gerçekliğin ve sanal AR teknolojisinin birleşimi, Starbucks Premium Kahve Kavurma Atölyesi'nin yeni bir perakende kahve atölyesine dönüştürülmesini sağlıyor. Starbucks arkadaşları bunalmış olsa bile, AR, her müşteriyi Starbucks'a girdikleri andan itibaren bir kaşif haline getirebilir, cep telefonlarının kamerasıyla mağazadaki hazineleri özgürce avlayabilir ve bu da kullanıcıların küçük bir ortağın liderliğinden daha fazla merak uyandırabilir.

    Sanal ve gerçek artırılmış gerçekliğin birleşimi, çevrimiçi ve çevrimdışı bağlanmanın yeni perakende konseptiyle örtüşüyor AR'yi birleştiren yeni perakende uygulamaları için sonsuz olasılıklar var. Tmall Genie APP'deki AR kılavuzu bir örnektir, henüz deneyimlemediyseniz indirebilir ve hissedebilirsiniz.

    Son olarak, daha iyi fikirleriniz varsa, lütfen bunları mesaj alanında paylaşın. Daha farklı çözümler görmeyi dört gözle bekliyoruz.

    Lüks C-sınıfı otomobil veya Camry standart değişim mi? Lexus ES satın almaya değer mi?
    önceki
    Changan Automobilein bir aylık resmi istifası, Yidongun performansı neden en övgüye değer?
    Sonraki
    1 dakikada 1 forma sat! Cristiano Ronaldo Juventus'tan önce para kazandı ve Bianconeri odak noktası olacak
    Zhou Qi bu tedaviyi ne zaman aldı? I.Dünya Savaşı'nda tüm rakip takım arkadaşlarını yendi ve gökyüzünü övdü!
    Lippi, Ulusal Futbol Ligi 5 savaşına koçluk yapıyor: Güney Kore'ye karşı zafer en parlak, İran'a en çok kaybettiren zafer!
    Mutluluğu koru! Bu Bahar Şenliği eve gitmeyecekler
    Manchester United'ın hücumu donuk bir United'a indirildi ve bu 70.000 kişinin kükremesine neden oldu! Şampiyonlar Ligi maçı ve mağlubiyet sıralama turlarını etkiliyor
    Daha fazla kilometre! 2019 BMW i3 pil yükseltmesi yeniden
    Birkaç gün önce hikayeleri olan bir grup insanla ve zevkli bir araba ile bir tavır paylaşımı toplantım vardı.
    Arjantin'den daha mı iyi? 5,73 milyon nüfusa sahip küçük bir ülke saygı görmeye değer.
    Ya kaybetmek? Deshuai maçtan sonra çok mutluydu ve sözleri Çinli hayranları utandırdı!
    Sarah'nın kaybının en son gelişmesi: polis aramayı bıraktı ve Premier Lig'de bir sonraki sessizlik turu!
    Nestlé New Retail 2019'da resmi olarak sosyal e-ticarete girdi
    Çevik geliştirmenin temel çelişkisi nedir? On yıldan fazla bir süredir sektörde olan mühendisler düşünüyor
    To Top