Yorum: Facebook'un akıllı sohbet cihazının arkasındaki AI teknolojisi

Kabul edin, her görüntülü sohbete başladığımızda, herkesin birbirinin çift çenesine ve büyük burun deliklerine bakmamasını sağlamak için cihazın konumunu ayarlamak için en az bir dakika harcamalıyız.

Bu açıdan bakıldığında Facebook'un geçtiğimiz yıl Ekim ayında piyasaya sürdüğü akıllı sohbet cihazı Portal Plus'ın sunduğu çözümlerde yenilikçilik eksikliği yaşanmıyor.

basit ifadeyle, Portal Plus'ta kullanılan akıllı kamera, görünür aralığın dışına çıkmamanızı sağlamak için kullanıcıyı otomatik olarak izleyebilir. , Ve ses seviyesini kullanıcının cihazdan gerçek mesafesine göre ayarlayın. Yani, sohbetin yarısına gelseniz ve aniden ayağa kalkıp odanın diğer ucuna gidip bir şeyler alsanız bile, karşı taraf görüşünü kaybetmeyecek veya sizi duymayacaktır.

Gizmodo'dan resim

Bu tür bir deneyim, önünüzde birinin sizin için çekim yapması gibidir. Aslında, bu etkiyi elde etmek için, Facebook mühendisleri danışmanlık ve öğrenme için Hollywood'da profesyonel fotoğrafçılar işe aldı.

Birçok akıllı telefonun kamera algoritmalarının aksine, Portal'ın arkasındaki algoritma insan yüzlerini değil, insan duruşlarını ve hareketlerini takip ediyor.

2017'nin başlarında, Facebook'un yapay zeka ekibi, insanların 2D hareketlerini takip edebilen Mask R-CNN adlı bir bilgisayar görme modeli oluşturdu. Portal, bu algoritma setini küçük mobil cihaz çiplerinde çalışabilen R-CNN2Go modeline uygun hale getirdi ve optimize etti.

Bu aşamada, kamera insanları nasıl takip edeceğini zaten biliyor olsa da video hala "sert ve sert" görünüyor. O zamandan beri, Portal ekibi Hollywood yabancı yardımcıları-fotoğrafçıları, sinematografik teknisyenleri ve belgesel film yapımcılarını işe alıyor, bir yandan fotoğrafın yaygın kabul gören "temel becerilerini" öğreniyor, diğer yandan da aile içi sohbet ortamlarında olası karşılaşmaları atıyorlar. Zor açıya bakın ve profesyonellerin bununla nasıl başa çıkacağını görün.

Lovevfx'in izniyle görüntü

"Bence ekip, merceğin daha olgun bir kompozisyon, yani ancak küçük bir teknikle ve insan davranışının anlaşılmasıyla alınabilecek bir karar almasını sağlamayı başardı." Rafa Camargo, Facebook'un donanım işinden sorumlu başkan yardımcısı ve Portal projesinin başı olduğunu söyledi. Facebook'a katılmadan önce Camargo, Google'ın yenilik departmanı ATAP'nin (İleri Teknolojiler ve Projeler) bir üyesiydi.

Yapay zekanın geliştirilmesi için, "doğal" eşiği aslında çok yüksektir, çünkü bu, makinenin (veya arkasındaki mühendisin) simülasyon sonuçlarını "insan gibi" yapmanın anahtarını bulduğu anlamına gelir.

2018'deki Google I / O konferansında randevu almak için berber dükkanını arayan Google Asistan, bir zamanlar izleyiciyi "Hımm Hımm" tonuyla şaşırttı, ancak şimdi Portal, Hollywood'un izleyicilerde geliştirdiği film izleme alışkanlıklarını ödünç aldı. "Doğal" hissi yaratın.

Çok doğal geliyor. Aslında bu kompozisyonu televizyonlarda ve filmlerde kullanıyorlar çünkü bu yıllarda herkes, insan beyninin sevdiği yolun bu olduğunu keşfetti.

"Doğal" olmanın yanı sıra, Portal ekibi modeli tasarlarken bazı ilginç çoktan seçmeli sorular da yaptı.

Örneğin: Bir aile videoda büyükannesiyle sohbet ediyor Aniden çocuk annesinin kollarından fırlıyor, koşmaya başlıyor ve sonunda odanın karanlık bir köşesine gidiyor. Bu durumda, Portal çocuğu izlemeye devam etmeli mi?

Mantıklı bir bakış açısına göre, bazı insanlar bir çocuk çok hızlı koşarsa onu izlemenin fotoğrafı kötüleştireceğini düşünür, bu yüzden çocuğu takip etmeyin. Ancak Portal ekibindeki Büyükanne kullanıcıları bu sorunu sorduğunda çoğu görüntülü sohbetlerin çoğunun kameranın diğer tarafındaki insanlarla, özellikle de çocuklarla tanışmak için kullanıldığını söyledi.

Facebook'tan resim

Portal ekibi nihayet kullanıcılar için manuel kontrolü bıraktı , Kameraya giren tüm insanları takip etmek için otomatik modu kullanabilirler veya belirli kişilere odaklanıp diğerlerini görmezden gelmeyi seçebilirler.

Portal, kullanıcılara burada seçme hakkı verse de, göz ardı edemeyeceğimiz şey, bazı akıllı telefon kameralarının ve hatta görüntülü sohbetlerin varsayılan olarak "güzelliğe" dönmesi ve kullanıcıların orijinal görünümü görememesi ve Netflix gibi yayın hizmetlerinin olmasıdır. Varsayılan olarak yalnızca önerilen içerik sağlanır. Orijinal tam listeyi görmek istiyorsanız, ayrıca bir "gizli koda" da ihtiyacınız vardır.

Bu algoritmik hizmetlerin özü, kullanıcıların seçme hakkını "silahsızlandırması" ve çoğu durumda bu sadece karar verme hakkı değil, aynı zamanda "orijinal" içeriği elde etme hakkıdır.

Belki bu yüzden Yapay zeka hizmetlerinden bahsederken, kullanıcıların bir hizmet sağlayıcı seçmelerinin anahtarlarından biri "güven" dir.

Bu sadece mahremiyet hakkını değil, aynı zamanda seçim yapmamıza yardım etmesini istediğimiz kişileri de içerir. Geçtiğimiz iki yıl içinde yaşanan çeşitli skandalların ardından Facebook adı, Portal'ın "sokakta parçalanmasının" ana nedenlerinden biri haline geldi. Aynı zamanda bu isim, sıradan insanları özellikle güvenlik konusunda hassas kılıyor.

Facebookun Portal'ın arkasındaki algoritmasının görüntülü sohbet deneyimine gerçekten yepyeni bir gelişme getirdiği ya da sadece adını değiştirip popüler hale geleceği inkar edilemez. Facebook ekibi ayrıca R-CNN2Go modelini mobil uygulamalara ve diğer ürünlere genişletmeyi planlıyor.

Birden fazla anket, çoğu Amerikalının Instagram ve WhatsApp'ın Facebook olduğunu bilmediğine işaret etti.

"Yoksul hükümet" aşırı topraklanmış gaz boyama sloganı ülke çapında ortaya çıktı
önceki
Nubia yumuşak ekranlı bilekli telefon yine görücüye çıkacak, Ni Fei, China Unicom ile işbirliği yaptığını açıkladı!
Sonraki
Zafer Kralı, engebeli yolla "bir kükreme" ile buluşuyor - Zhang Fei Stratejisi
Yeni Baojun 730 otomatik şanzıman modeli casus fotoğraflar veya 6AT ile donatılmıştır
Yeni Balenciaga yine saldırıyor! Bu sefer "çoraplar ve ayakkabılar" biraz farklı mı?
CES'te giriş yapan JD.com, perakendenin geleceğinin ne olduğunu dünyaya gösterdi
Patlayıcı çıktı şovu, seyircinin prequel Miyamoto Musashi sis analizini patlatıyor
En yaygın 35 Python mülakat soruları ve yanıtları (2018 baskısı)
"Ev ve Her Şeyi Şaşırttı" road show sona taşındı, yarın üç önemli olay yayınlanacak
Yeni Nike Air Max 97 renk şemasının önizlemesinde başı çek, flüoresan renk enjeksiyonu hiç de düşük anahtar değil!
Anaokulu mu yoksa "eğlence parkı" mı? Okul tarzı burada farklı
Glory başkan yardımcısı, Xiaomi 9'u kışkırtmak için inisiyatif aldı ve iki Xiaomi yöneticisi doğrudan yanıt verdi!
"White Snake: Origin" hayranları kendiliğinden Pekin'de film izleme aktiviteleri organize ediyor, yönetmen teşekkür etmek için geldi
Pozlama istasyonu Anket birth Doğuştan bugüne kadar çok sayıda sokak lambası, çok eski veya kör!
To Top