Kabul edin, her görüntülü sohbete başladığımızda, herkesin birbirinin çift çenesine ve büyük burun deliklerine bakmamasını sağlamak için cihazın konumunu ayarlamak için en az bir dakika harcamalıyız.
Bu açıdan bakıldığında Facebook'un geçtiğimiz yıl Ekim ayında piyasaya sürdüğü akıllı sohbet cihazı Portal Plus'ın sunduğu çözümlerde yenilikçilik eksikliği yaşanmıyor.
basit ifadeyle, Portal Plus'ta kullanılan akıllı kamera, görünür aralığın dışına çıkmamanızı sağlamak için kullanıcıyı otomatik olarak izleyebilir. , Ve ses seviyesini kullanıcının cihazdan gerçek mesafesine göre ayarlayın. Yani, sohbetin yarısına gelseniz ve aniden ayağa kalkıp odanın diğer ucuna gidip bir şeyler alsanız bile, karşı taraf görüşünü kaybetmeyecek veya sizi duymayacaktır.
Gizmodo'dan resim
Bu tür bir deneyim, önünüzde birinin sizin için çekim yapması gibidir. Aslında, bu etkiyi elde etmek için, Facebook mühendisleri danışmanlık ve öğrenme için Hollywood'da profesyonel fotoğrafçılar işe aldı.
Birçok akıllı telefonun kamera algoritmalarının aksine, Portal'ın arkasındaki algoritma insan yüzlerini değil, insan duruşlarını ve hareketlerini takip ediyor.
2017'nin başlarında, Facebook'un yapay zeka ekibi, insanların 2D hareketlerini takip edebilen Mask R-CNN adlı bir bilgisayar görme modeli oluşturdu. Portal, bu algoritma setini küçük mobil cihaz çiplerinde çalışabilen R-CNN2Go modeline uygun hale getirdi ve optimize etti.
Bu aşamada, kamera insanları nasıl takip edeceğini zaten biliyor olsa da video hala "sert ve sert" görünüyor. O zamandan beri, Portal ekibi Hollywood yabancı yardımcıları-fotoğrafçıları, sinematografik teknisyenleri ve belgesel film yapımcılarını işe alıyor, bir yandan fotoğrafın yaygın kabul gören "temel becerilerini" öğreniyor, diğer yandan da aile içi sohbet ortamlarında olası karşılaşmaları atıyorlar. Zor açıya bakın ve profesyonellerin bununla nasıl başa çıkacağını görün.
Lovevfx'in izniyle görüntü
"Bence ekip, merceğin daha olgun bir kompozisyon, yani ancak küçük bir teknikle ve insan davranışının anlaşılmasıyla alınabilecek bir karar almasını sağlamayı başardı." Rafa Camargo, Facebook'un donanım işinden sorumlu başkan yardımcısı ve Portal projesinin başı olduğunu söyledi. Facebook'a katılmadan önce Camargo, Google'ın yenilik departmanı ATAP'nin (İleri Teknolojiler ve Projeler) bir üyesiydi.
Yapay zekanın geliştirilmesi için, "doğal" eşiği aslında çok yüksektir, çünkü bu, makinenin (veya arkasındaki mühendisin) simülasyon sonuçlarını "insan gibi" yapmanın anahtarını bulduğu anlamına gelir.
2018'deki Google I / O konferansında randevu almak için berber dükkanını arayan Google Asistan, bir zamanlar izleyiciyi "Hımm Hımm" tonuyla şaşırttı, ancak şimdi Portal, Hollywood'un izleyicilerde geliştirdiği film izleme alışkanlıklarını ödünç aldı. "Doğal" hissi yaratın.
Çok doğal geliyor. Aslında bu kompozisyonu televizyonlarda ve filmlerde kullanıyorlar çünkü bu yıllarda herkes, insan beyninin sevdiği yolun bu olduğunu keşfetti.
"Doğal" olmanın yanı sıra, Portal ekibi modeli tasarlarken bazı ilginç çoktan seçmeli sorular da yaptı.
Örneğin: Bir aile videoda büyükannesiyle sohbet ediyor Aniden çocuk annesinin kollarından fırlıyor, koşmaya başlıyor ve sonunda odanın karanlık bir köşesine gidiyor. Bu durumda, Portal çocuğu izlemeye devam etmeli mi?
Mantıklı bir bakış açısına göre, bazı insanlar bir çocuk çok hızlı koşarsa onu izlemenin fotoğrafı kötüleştireceğini düşünür, bu yüzden çocuğu takip etmeyin. Ancak Portal ekibindeki Büyükanne kullanıcıları bu sorunu sorduğunda çoğu görüntülü sohbetlerin çoğunun kameranın diğer tarafındaki insanlarla, özellikle de çocuklarla tanışmak için kullanıldığını söyledi.
Facebook'tan resim
Portal ekibi nihayet kullanıcılar için manuel kontrolü bıraktı , Kameraya giren tüm insanları takip etmek için otomatik modu kullanabilirler veya belirli kişilere odaklanıp diğerlerini görmezden gelmeyi seçebilirler.
Portal, kullanıcılara burada seçme hakkı verse de, göz ardı edemeyeceğimiz şey, bazı akıllı telefon kameralarının ve hatta görüntülü sohbetlerin varsayılan olarak "güzelliğe" dönmesi ve kullanıcıların orijinal görünümü görememesi ve Netflix gibi yayın hizmetlerinin olmasıdır. Varsayılan olarak yalnızca önerilen içerik sağlanır. Orijinal tam listeyi görmek istiyorsanız, ayrıca bir "gizli koda" da ihtiyacınız vardır.
Bu algoritmik hizmetlerin özü, kullanıcıların seçme hakkını "silahsızlandırması" ve çoğu durumda bu sadece karar verme hakkı değil, aynı zamanda "orijinal" içeriği elde etme hakkıdır.
Belki bu yüzden Yapay zeka hizmetlerinden bahsederken, kullanıcıların bir hizmet sağlayıcı seçmelerinin anahtarlarından biri "güven" dir.
Bu sadece mahremiyet hakkını değil, aynı zamanda seçim yapmamıza yardım etmesini istediğimiz kişileri de içerir. Geçtiğimiz iki yıl içinde yaşanan çeşitli skandalların ardından Facebook adı, Portal'ın "sokakta parçalanmasının" ana nedenlerinden biri haline geldi. Aynı zamanda bu isim, sıradan insanları özellikle güvenlik konusunda hassas kılıyor.
Facebookun Portal'ın arkasındaki algoritmasının görüntülü sohbet deneyimine gerçekten yepyeni bir gelişme getirdiği ya da sadece adını değiştirip popüler hale geleceği inkar edilemez. Facebook ekibi ayrıca R-CNN2Go modelini mobil uygulamalara ve diğer ürünlere genişletmeyi planlıyor.
Birden fazla anket, çoğu Amerikalının Instagram ve WhatsApp'ın Facebook olduğunu bilmediğine işaret etti.