Amazon AI mucizesinin arkasındaki kadın, Alexa'nın başıyla özel sohbet

Amazon Alexa şüphesiz şu ana kadar dünyadaki en başarılı AI tüketici ürünüdür.Amazon'un bir başka mucizesi olarak da tanımlanabilir.Amazon'un AI imparatorluğunun temel ürünü bile denilebilir.

Bu, Bay DT'nin EmTech Dijital Yapay Zeka Zirvesi'ndeki son özel hamlesi ve içerik hala ağır: MIT Technology Review'in yayıncısı ve baş editörü Jason Pontin, Amazon Alexa'nın başkanı Toni Reid ile konuşuyor.

Toni Reid Amazon'da 19 yıl çalıştı, 2012'de ekibe katıldı ve 2014'te Alexa projesini resmen devraldı. Alexa'yı sıfırdan başlatmak için tüm süreci tamamladı. Jason ile yaptığı konuşmada, ses arayüzü anlayışından Alexa projesine geçti. Teknik yol tasarımından geliştirme sürecindeki az bilinen anekdotlara kadar, izleyiciye etkileyici bir diyalog getirdi.

Bayan Toni Reid size dünya çapında ses asistanı Alexa'nın ön ve arka sahnelerini gösterecek.

MIT Technology Review'un yayıncısı ve yazı işleri müdürü Jason Pontin, Amazon Alexa'nın başı Toni Reid ile konuşuyor

Aşağıda, Sayın DT tarafından derlenen diyaloğun tam metni yer almaktadır:

Jason Pontin: Yapay zekanın önemli bir uygulaması, makinelere insanlarla daha doğal bir şekilde nasıl etkileşim kuracaklarını öğretmektir. Bence Amazon şu anda dünyanın en büyük doğal arayüz deneyini yürütüyor ve taşıyıcısı kişisel asistan Alexa.

Öncelikle, seyircilerden kaç kişinin evinde Alexa var diye sormak istiyorum.

İnsanların yarısının ellerini kaldırdığını düşünüyorum, ancak burası San Francisco ve teknoloji meraklıları Alexa'yı kaçırmamalı.

Peki, Alexa'yı resmen tartışmaya başlamadan önce, lütfen Toni'ye deneyiminizden bahseder misiniz ve sizi Alexa geliştirmeden sorumlu asıl kişi yapan tesadüf nedir?

Toni Reid: Amazon'da 19 yıldır çalışıyorum, insan kaynaklarından iş geliştirmeye, ürün yönetimine kadar her şeyi yaptım. Daha sonra Amazon Dash ekibine katıldım ve ağırlıklı olarak Amazon Fresh taze gıda satış hizmetleri için teknik destek sağlıyorlar. Bu dönemde Amazon'un ses geliştirme ekibiyle yakın çalışmaya başladım. Bu muhtemelen 2012'de ve ne Alexa ne de Echo henüz piyasaya sürülmedi.

Toni Reid, Amazon Alexa projesi başkanı

Bu dönemde, ses ekibimiz Alexa ve Echo'nun en eski önizleme sürümleri dediğimiz şey üzerinde çalışıyordu. Biliyorsunuz başlangıçta Alexa'nın ne işe yaradığını, insanların neden böyle bir ürüne ihtiyaç duyduğunu bile anlamadım.

Daha sonra prototipi geri alıp denedikten sonra ekibin hedeflerini ve vizyonunu anlamaya başladım. O zamanki prototipte çok fazla hata olmasına ve performansı mevcut üründen çok daha az olmasına rağmen, Alexa ve Echo beni gerçekten büyüledi. Bu yüzden, 2014'te Alexa ekibini resmen devraldım.

Jason Pontin: Alexa'yı ya da herhangi bir sesli asistanı hiç kullanmamış olanları bu tür bir ürünü almaya nasıl ikna edersiniz? Onlara ses teknolojisinin çözebileceği sorunlar nasıl açıklanır?

Toni Reid: Tabii ki bu kolay bir iş değil, pazarlama departmanımız birçok araştırma ve tatbikat yaptı. Tıpkı prototipi aldığım zamanki gibi, ne yapabileceğini bilmiyorum. Ancak, ancak gerçekten eve götürüp kullanmaya başladıktan sonra, teknolojinin birçok şeyi daha kolay ve daha kolay hale getirdiğini deneyimleyebilirsin.

Artık Alexa yavaş yavaş olgunlaşıp binlerce beceriyi öğrendiğine göre, kullanıcılar rolünü kolayca anlayabilir ve bunun işe ve hayata getirdiği faydaları açıklamamıza gerek yok.

Jason Pontin: Alexa'yı ilk versiyondan günümüze kadar deneyimlediniz, insan-bilgisayar etkileşimi arayüzünde sesin neden bu kadar önemli bir rol oynadığını düşünüyorsunuz?

Toni Reid: Her şeyden önce ses, etkileşim kurmanın en basit ve en doğal yolu ve insan iletişiminin en temel yoludur. Bu nedenle, Alex için donanım taşıyıcısı Echo'yu tasarlarken, ona bir ekran eklemedik. Bu yaklaşım aslında zorluğu artırıyor: Kullanıcılar cihazı yalnızca saf sesle kullanabilir ve yardımcı olarak ekran geri bildirimi yoktur.

Etkileşim için ses kullanmak istediğinizde, bir tür etkileşim motoru (Eylem Motoru) kullanacaksınız. Kullanıcı talepte bulunacak ve sesli talimatlar verecektir. İlk adımımız, otomatik konuşma tanıma (ASR) gibi kullanıcıların neye ihtiyacı olduğunu anlamak ve ardından konuşmanın bağlamını anlamak için doğal dil anlayışıdır.

Kullanıcı sesli bir komut verdikten sonra, kullanıcıyla konuşmayı ileri geri tekrarlamak yerine, karşılık gelen eylemi gerçekleştirmek için tek bir şansımız olduğunu düşünüyorum. Genel olarak konuşursak, sadece iki diyalog fırsatı vardır: Üçüncü diyalogda kullanıcının ihtiyaçları netleştirilmezse, bu tam bir başarısızlık olacaktır. Bu tür tekrarlanan konuşmalar, kullanıcılar için çok kötü bir deneyimdir.

Jason Pontin: Sesin en insani etkileşim yolu olduğunu ve insanlarla diğer türler arasındaki en temel farklılıklardan biri olduğunu düşünüyor musunuz? Ancak bu, insanların sesli etkileşim için yüksek beklentilere sahip olduğu anlamına gelir. Bahsettiğiniz iki zaman içindeki ihtiyaçları netleştirmenin yanı sıra, insanların sesli etkileşimden ne bekleyebileceğini düşünüyorsunuz?

Toni Reid: Kullanıcıların beklentileri aslında çok pratik. Alexa'nın konuşulabilir, çeşitli işlevlere sahip ve gelecekte de yapabileceğimiz insanlara daha yakın olmasını umuyorlar.

Ancak mevcut kullanıcıların en büyük beklentisi aynı zamanda insan-makine diyaloğundaki en büyük sorun: bağlam. Örneğin, şimdi sen ve ben yüz yüze konuşursak, söylediklerimi gerçekten anladığınızı veya benim bakış açıma katılıp katılmadığınızı söyleyecek birçok görsel ipucu olacak.

Ancak insan-bilgisayar diyalog sahnesinde bu tür görsel ipuçları eksik. Yapay zeka açısından, eksik bağlamı doldurmak mevcut en önemli önceliktir.

Bağlam, insan diyaloğunun önemli bir parçasıdır

Jason Pontin: Çok ilginç bir sorum var: Alexa'nın belli bir kişiliği var mı? Çünkü herkes Siri'nin yaramaz, kendini yenen, ironik gibi kendine özgü garip kişiliğine sahip olduğunu biliyor. Apple kullanıcılarının az çok deneyime sahip olduğuna inanıyorum. Alexa'nın da belli bir kişiliği varsa, bunu bilerek mi tasarladınız?

Toni Reid: Evet, Alexa'da var ve ekibimiz ona bu kişiliği vermekten sorumlu. Alexa'nın kişiliğini tanımlamak için üç kelime kullanıyoruz: akıllı, alçakgönüllü, yardımsever ve elbette, belki biraz soğuk ve komik. Onunla savaşmayı deneyebilirsin, oldukça ilginç. AI açısından bakıldığında, belirli bir teknolojiye biraz kişilik kazandırmak önemlidir.

Jason Pontin: Siri'yi örnek olarak alalım. Yapay zeka arayüzü olarak, cep telefonlarını tutan ve Siri ile konuşan insanların sahnesi, Alexa'nın havadan yapılan konuşmalarından açıkça çok farklı. Alexa'nın nasıl kullanılacağı ve sesli geri bildirimle ilgili düşünceleriniz nelerdir?

Toni Reid: Kullanıcı verilerinin analizini asla durdurmadık.Sadece sesle çalışan bir cihaz olarak, kullanıcıya geri beslenecek bilgi miktarına karar vermelisiniz. Örneğin, hava durumu sorulduğunda, makine "68 derece Fahrenheit" veya "San Francisco'daki dış ortam sıcaklığı 68 derece Fahrenheit" şeklinde yanıt verebilir.

Aynı zamanda, Alexa'yı tasarlama sürecinde de göz önünde bulundurmamız gereken, kullanıcılara ne kadar bilgi vermemiz gerektiğidir.Bazı insanlar sadece en basit ve en net cevaplara ihtiyaç duyabilir ve bazı insanlar makinelerle konuşma sürecinden daha çok keyif alabilir. Geri bildirim bilgisinin miktarını yalnızca kullanıcı verilerine göre gerçek zamanlı olarak ayarlayabiliriz.

Jason Pontin: Bazen kesin bir cevap istemiyoruz. Örneğin, bu gece saat 6'daki sıcaklığı sormak, belki ne tür kıyafetler giymem gerektiğini bilmek istiyorum. Bu tür sorunları düşündünüz mü?

Toni Reid: Gerçekten düşünülüyor. Bu tür soruların cevapları genellikle belirli bir derecede öngörü gerektirir. Bu konuda sadece cep telefonlarının bir avantajı vardır, örneğin cep telefonundan hava durumu ile ilgili sesli sorgulamalar yapıldıktan sonra ekranda giysi indeksi gibi diğer faydalı bilgiler gösterilecektir.

Alexa'yı tasarlama sürecinde prensibimiz, sesli geribildirimi olabildiğince kısa ve öz tutmaktır, çünkü kullanıcının problemiyle doğrudan ilgili olmayan çok fazla bilgi iletişim verimliliğini azaltacaktır.

Jason Pontin: Siri'nin ekran avantajı var ama Alexa'nın bu işlevi yok, bu boşluğu doldurmanın bir yolu var mı?

Toni Reid: Kullanım senaryosuna bağlı olduğunu düşünüyorum. Örneğin, belirli bir tanımı açıklamak istiyorsanız, yalnızca sesli açıklamayı duymanız gerekir. Ancak bir albümü sorgulamak istiyorsanız, albüm kapağını ekranda görüntülemek çok önemli hale geliyor.

Amazon ayrıca, Alexa ile donatılmış Fire TV ve Kindle tabletleri gibi ürünlere de sahiptir. Amazon ayrıca aktif olarak cihazları filtrelemek için genişliyor ve bazı deneyimler biriktirmeye başlıyor.

Jason Pontin: Alexa kullanıcılarının sayısı on milyonlara ulaştı, bu son derece büyük bir eğitim veritabanı. 2 yıl öncesine kıyasla, şu anda sahip olduğunuz eğitim verilerinden ne gibi yeni şeyler keşfettiniz?

Toni Reid: İlk nokta, bu devasa eğitim veritabanı sayesinde kullanıcıların soru sorma şekillerinin giderek daha fazla farkına vardık. Hava durumu, müzik, trafik, alışveriş vb. Hakkında sorsalar, Alexa'nın sesli komutları anlayışı gittikçe daha doğru hale geliyor .

İkinci nokta daha çok ürünün kendisiyle ilgilidir. Kullanıcılar, diğer ürün türlerine entegre edildiğinde veya diğer ülke ve bölgelere nakledildiğinde Alexa'nın performansı konusunda çok endişelidir. Örneğin geçen sonbaharda Alexa'yı Birleşik Krallık ve Almanya'da yayınladığımızda, yerel kullanıcılar Alexa'nın Amerika Birleşik Devletleri'nde elde edebileceği özelliklerin zaten çok farkındaydı ve bunun için büyük beklentilerini dile getirdiler.

Ancak, bazı işlevler tam olarak yerel olarak uyarlanmadığından, kullanıcı beklentilerini tam olarak yönetmek için bunları şimdilik yayınlamadık.

Alexa'nın Mart 2017'de Amerika Birleşik Devletleri, İngiltere ve Almanya'da ustalaştığı toplam beceri sayısının en son istatistikleri

Jason Pontin: Şu anda Alexa kaç dil konuşuyor?

Toni Reid: İki, İngilizce ve Almanca Bence İngiliz İngilizcesi üçüncü dil olabilir, haha!

Jason Pontin: İngiliz aksanı değiştiremiyorum ... Ancak, Alexa'nın Almanca versiyonunun etkisini hayal bile edemiyorum (seyirciler güldü). Tamam, şaka yok. Alexa'nın bir sonraki hedefi nedir? Alexa'nın başka hangi yeteneklere sahip olmasını umuyorsunuz?

Toni Reid: Alexa'nın daha doğal bir diyalog işlevine sahip olmasını ve daha çok bir insan gibi olmasını umuyoruz. Yeteneklerini daha da geliştireceğiz ve ona daha fazla beceri vereceğiz.

Alexa'nın sadece evde değil, gitmek istediğiniz her yerde kullanılabileceğini umuyoruz ve kullanıcıların varlığını görmezden gelmesini sağlamaya çalışıyoruz.

Jason Pontin: Daha fazla dedikodu sorusu sorun Alexa için gördüğünüz tüm beceriler arasında en tuhaf şey nedir?

Toni Reid: Nasıl osurulur ... (seyirci kahkahalara boğulur)

İlk "Roma Kupası" Masa Tenisi Şehir Davetiye Turnuvası Roma'da başarıyla gerçekleştirildi
önceki
Gecikme yok! AFC Şampiyonlar Ligi'nde dün Guoan'da gol atan 16 yaşındaki Taylandlı genç, bugün her zamanki gibi okula gidecek
Sonraki
Yujian Yeni Yıl Gümrükleri Bu tür tuhaf Yeni Yıl gelenekleri Çin'de neredeyse ortadan kalktı, ancak Japonya'da hala görülebilir
Zigong Şehri, Gongjing Bölgesi "okul-yerel işbirliğinin" derinlemesine geliştirilmesi, Sichuan Sanat ve Bilim Üniversitesi ile başarılı bir şekilde bir sözleşme imzaladı
Ön ödeme | Weilai Li Bin 10.000 araba sattı, ödülü He Xiaopeng kullanmalı
Bahar Şenliği için resmi veriler: Post-90'lar en yüksek sayıda WeChat kırmızı zarfı oluşturdu. Yıllık kırmızı zarf şehri ...
Fransız gösterileri yayılmaya devam ediyor ve bazı lise öğrencileri okulun "savaş alanına" girmesini engelliyor
Wu Lei etkisi! Bu La Liga takımı çok para kazanıyor ve Çinli şirketler İspanyollara sponsor olmak için sıraya giriyor!
Büyük veriyle desteklenen Çin medikal endüstrisi "inatçı hastalıkları" tedavi edebilir mi?
CCTV5 bu akşam UEFA Şampiyonlar Ligi Manchester United vs Barcelona'yı yayınlayacak.Sihirli bir büyü Manchester United'ın evinde kaybedeceğini mi gösteriyor?
AI araştırması birçok alanda durgunlaşıyor
Sizi üç nesil yapay zekaya götürmek için 10 dakika
Python tek tıklama ile Java mı? "Google Çeviri" sorun çıkarmaz (bağlantı eklidir)
Yandu'nun hikayesini anlatan Zigong, bir tur rehberi ve açıklayıcı becerileri yarışması düzenliyor
To Top