Ali, AliGenie2.0 sistemini yayınladı, "Yüz Kutu Savaşı" görsel silah kullanıyor

Xinzhiyuan Raporu

Yazar: Zhang Qian

Xin Zhiyuan Rehberi Dün Alibaba Yapay Zeka Laboratuvarı genel müdürü Qian Xue, Tmall Genie'nin satış hacminin 2 milyon adedi aştığını duyurdu.Daha da önemlisi son AliGenie2.0 sisteminin görsel yeteneklerini artırdı ve çok modlu etkileşim yeteneklerine sahip olduğunu açıkladı. 2018'deki "Yüz Kutu Savaşı" nın önemli bir eğilimi görselleştirme ve ekrandır. Hemen hemen tüm devler, AI konuşmacılarını "uzun gözler" yapacak.

Tmall Genie X1, X2'nin yükseltilmiş sürümü beklendiği gibi görünmedi ve insan-bilgisayar etkileşim sistemi AliGenie, güçlü işlevlere sahip en son sürüm 2.0'a yükseltildi.

22 Mart'ta Alibaba Yapay Zeka Laboratuvarı Qianxue (Chen Lijuan) genel müdürü AliGenie2.0 sistemini piyasaya sürdü. En büyük iyileştirmesi, 1.0 bazında görsel yeteneklerin eklenmesi ve çok modlu etkileşim yeteneklerinin tanıtılması oldu. Bazı yardımcı ekipmanların eklenmesi, Tmall Genie'nin görsel yeteneğe sahip olmasını sağlayabilir. Aynı zamanda Asakusa, Tmall Genie satışlarının 2 milyon adedi aştığını da duyurdu.

Amazon, dört yıl önce AI konuşmacı savaşını tetikleyen Echo'yu başlattı; geçen yıl Amazon, ekranlı bir konuşmacı olan Echo Show'u başlattı ve konuşmacının görselleştirilmesi ve ekran haline getirilmesi bir trend haline geldi. AliGenie2.0'a ek olarak, Jingdong Dingdong Play ve Baidu'nun yakında çıkacak olan "Xiaodu at Home" un hepsi görsel yeteneklere sahip ve AI konuşmacıları nihayet görsel olacak.

AliGenie2.0: görüntü tanıma, nesne algılama, yüz tanıma yeteneklerini artırın

Geçen yılın Mayıs ayında AI Labs, yerleşik AliGenie1.0 sistemi ile Tmall Genie X1'i piyasaya sürdü.

AliGenie1.0, 100 milyon varlığı anlama yeteneğine sahip olduğu ve yaklaşık 1 milyar ilişki kurduğu süper güçlü bir bilgi sistemi kurdu. Aynı zamanda, AliGenie1.0 algoritması da yükseltiliyor. Ali AI Labs yepyeni bir sekans etiketleme modeli yayınladı.Bu sekans etiketleme modeli, otomatik hata düzeltme sorununu çözebilir ve daha güçlü hata toleransı ile konuşmanın anlaşılmasına yardımcı olabilir. AliGenie ayrıca aktif öğrenme yeteneğine de sahiptir ve sistem, kullanıcıyla her etkileşime girdiğinde otomatik olarak gelişecektir.

Asakusa tarafından yayınlanan AliGenie2.0 sistemi, 1.0 baz alınarak oluşturulmuştur. Görme ve ses gibi çok modlu etkileşim yeteneklerine sahip yeni nesil insan-bilgisayar iletişim sistemi. Yalnızca işitsel yeteneklere sahip olmayacak, aynı zamanda görsel yeteneklere ve duygusal geri bildirim yeteneklerine de sahip olacak.

Bunlar arasında görsel yetenek üç ana teknolojiye ayrılmıştır: görüntü tanıma, yüz tanıma ve nesne algılama.

Aynı zamanda Alibaba AI Labs, çok modlu bir etkileşim süreci oluşturmak için ses yeteneklerini ve görsel yetenekleri entegre ederek daha akıllı bir insan-bilgisayar iletişim sistemi oluşturdu.

Qianxue, insan-bilgisayar etkileşiminin sadece sesten çok daha fazlası olduğuna inanıyor. "Gelecekte insan-bilgisayar etkileşiminin sadece işitme değil, aynı zamanda görme, koku alma ve daha güçlü duygusal geribildirim yeteneklerine sahip olacağını düşünüyoruz."

Alibaba AI Labs, geçen yıl doğal dil anlayışına ve diğer alanlara çok yatırım yaptı. Geçen yıl Ekim ayında, Microsoft Research Asia baş araştırmacısı Dr. Nie Zaiqing ile Google Tango ve DayDream teknik direktörü Dr. Mingyang Li'nin tanıtıldığını duyurdu. Şu anda, Nie Zaiqing, Ali AI Labs Beijing Ar-Ge Merkezi'nin çeşitli araştırma ve geliştirme çalışmalarından sorumludur ve bilgi grafiği ve doğal dil anlayışının iki alanını kırmaya odaklanmaktadır. Li Mingyang, AI Labs makine görüşünün seçkin bilim insanıdır.

Nie Zaiqing, Ali AI Labs Beijing Ar-Ge Merkezi başkanı

Özel bir röportajda Nie Zaiqing, Tmall Elflerin durumları algılama ve aktif olarak öğrenme yeteneğine sahip olduğunu söyledi. Doğal dili anlamadaki büyük zorluk, doğal dilin çeşitliliğinden kaynaklanmaktadır.Bir cümlenin sayısız anlamı olabilir. Bu, geliştiricilerin büyük veriler arasındaki etkileşimi aktif olarak keşfetmelerine ve geliştiriciler ve kullanıcılar için aktif olarak bir yol bulmasına izin vermek için büyük veri gerektirir. Birlikte etkileşim kurmak ve dilin tüm anlamlarını mükemmelleştirmek makine tarafından anlaşılabilir.Bu aynı zamanda Ali AI Labs'ın teknik avantajıdır.

Ali AI Labs'ın donanım mantığı: elle oluşturun ve sınır ötesini anlayın, AliGenie sistemi gelecekte açık olabilir

Tmall Genie X2 piyasaya sürülmemiş olsa da, daha küçük boyutlu Tmall Genie çerezleri, Tmall yönlendirici, Tmall Magic Screen S1 ekransız TV ve çevre birimleri gibi birçok küçük donanım da tanıtıldı.

Alibaba platform oluşturmada en iyisidir. Bu sefer, tek seferde birden fazla donanım ürünü çıkarır. Bu, rotayı değiştirmekle ilgili değildir. Arkasındaki mantık çok gerçekçi: donanım, yazılımdan çok daha zordur.

Qianxue, Tmall Sihirbazı olmadan önce Ali AI Labs'ın sektördeki bazı ortaklarla donanım geliştirmeye çalıştığını, ancak sonuçta iki farklı yazılım ve donanım alanında sınır ötesi işbirliği sürecinde işbirliği sürecinde birçok zorlukla karşılaştığını söyledi. Ve içlerindeki sorunları bilmiyorlar.

Genel olarak konuşursak, yalnızca servisler ve sistemler yapıyorsanız ve bunu donanım yapmak için üçüncü bir tarafa bırakırsanız, kalite kontrol, üretim döngüsü ve diğer bağlantılarda ustalaşmak kolay değildir.Ayrıca, AI Labs'ın geçen yıl donanımı oluşturmaya başlamasının nedeni de budur.

Ancak platform olarak Ali'nin genleri değişmedi. Qianxue, AliGenie sisteminin gelecekte daha iyi olacağını, böylece donanım ortaklarının AliGenie teknolojisini (ilgili ürünler) yapıp uygulayabileceğini umuyor.

Ayrıca Asakusa, Tmall Genie'nin satışlarının artık 2 milyon adedi aştığını da duyurdu.

Yüz Kutu Savaşı yükseltmeye devam ediyor: görsel yetenekleri artırın ve daha fazla senaryo elde edin

2014'te Amazonun Yankısı ortaya çıktı ve AI hoparlör savaşının fitilini ateşledi. Google Home, Appleın Home Pod ve yerli Ali Tmall Elfler, Xiaominin Xiao Ai sınıf arkadaşları ve Cheetah AI hoparlörleri mekana girdiler; geçen yıl Amazon bir kemer çıkardı Ekrandaki hoparlör Echo Show, AI konuşmacılarını rekabetin başka bir aşamasına getiriyor: görselleştirme.

Tmall Genie bu kez ekranlı bir hoparlör başlatmamış olsa da, AliGenie 2.0 görsel yeteneği ortaya koydu ve "Genie Fire Eye" ı başlattı: Tmall Genie mobil uygulaması ile donatılmış cep telefonuna harici bir XHolder (cep telefonu tutucusuna benzer) yerleştirildi Daha sonra, Tmall elfleri görsel bilişsel yeteneklere sahip olabilir.

Bu yaklaşım, Google'ın sanal gerçeklik ürünleri olan çevre birimi Google Cardboard'u piyasaya sürdüğüne benziyor ve maliyetlerden büyük ölçüde tasarruf ederken görsel işlevler gerçekleştirebiliyor.

Ancak "dost iş adamları" daha radikaldir. Bu yılki CES'de JD.com'un akıllı hoparlörü Dingdong Play tanıtıldı.Bu ürün, video görüşmeleri ve yüz tanıma gibi işlevleri gerçekleştirebilen 8 inçlik bir LCD ekrana sahip. Baidu ayrıca yakın zamanda "Xiaodu at Home" akıllı video hoparlörünü önümüzdeki hafta piyasaya süreceğini duyurdu.

2018'e girerken, görselleştirme ve ekranlaştırma, "Yüz Kutu Savaşı" nı yeni bir rekabet aşamasına getirdi. Saf sesli hoparlörlerle karşılaştırıldığında, görsel işlevlere sahip hoparlörler daha fazla senaryo elde edebilir. Alibaba "Elf Huoyan" ı örnek alarak, kitapları resimlerle tanımak için yayıncılık endüstrisi ile işbirliği yaptı. "Elf Huoyan" akıllı ses etkileşimini ve sesli okumayı gerçekleştirerek çocukların kitap ve okuryazarlık okumasına yardımcı olabilir ve devasa bir ticarileştirme alanına sahiptir.

Burası Güneydoğu Asya'daki en ihmal edilen seyahat noktası, ucuz ve eğlenceli!
önceki
Buna yüzme havuzu deniyor. Yaptığın tek şey hamam!
Sonraki
Özel askerlerden "meydan okuma kitabı", gaziler onu yakaladı!
Wu Jingui, Boas'ı patlattıktan sonra, yerel yakışıklıyı kızdırdı, "küçük deli" küstahlığın bedelini ödedi.
Tiantu Investment CEO'su Feng Weidong: Yeni perakende girişimciliği bu iki çukurdan kaçınmalı
Amazon neden Google'ı yeniyor? 520 milyar dolarlık AI bulut pazarı, tarihin en güçlü şirketini oluşturacak
Beklenmedik bir şekilde, buradaki adalar gerçekten havada "yüzüyor"!
Ding Yan Yuhang şiddetle gitti, takım arkadaşları birbiri ardına çağırdı ve iyi arkadaşı Zhai Xiaochuan'ın yorumu yine parlaktı!
Zuckerberg'in en karanlık haftası: Keras yazarı bombalandı: Facebook totaliter bir hapishaneye dönüşecek
"2018 Perakende İnovasyonu TOP Listesi" açıklandı: 53 perakende inovasyon öncüsü listede!
Sevgili kendiniz, bu 7 seyahat yönteminin size getirdiği hoşgörünün tadını çıkarın!
Cheetah Fu Sheng "açık asılı": üç robotu serbest bırakın + blockchain AI hoparlörü + robotik kol
Bu şiirlere ruh için tavuk çorbasının eski versiyonu denilebilir
Hanchuan mahkeme memurlarının akademik belgeleri, İl Yüksek Mahkemesinden defalarca ödül kazandı.
To Top