Pulitzer Ödüllü muhabir, dünyanın ilk ses devinin doğuşunu ayrıntılarıyla anlatıyor Derinlik

Bu makale, münhasıran izin verilen ve Çin Anakarası'nda yayınlanan MIT Technology Review'den alınmıştır. Yazar George Anders, The Wall Street Journal'da bir rapor yazdığı için 1997 Pulitzer Ödülü'nü kazandı. Aşağıdakiler çeviriden sonra tam metindir:

Mevcut interaktif devrim geçmişten farklıdır: geçmişte herkes kendini teknik ürünlere adapte etme, yazı yazma, dokunma veya kaydırma gibi eylemlere uyum sağlama eğilimindeydi. Şimdi, sesin ana etkileşim yolu haline gelmesi için, insanlara hitap etmesi gerekiyor.

Ancak, şimdi sesli etkileşim pazarında lider olmasına rağmen, bu büyük zorluk Alexa'nın başlangıçta "menzilinde" değildi.

Ses canavarının doğuşu

31 Ağustos 2012'de dört Amazon mühendisi temel bir patent başvurusunda bulundu. Nasıl çalıştığını açıklamak için yalnızca bir düzineden fazla kelimeye ve basit bir şemaya ihtiyaçları vardır: Bir kullanıcı "müzik çal" şeklinde bir sesli komut verdi ve bir makine "sorun yok" olarak yanıt verdi ve kullanıcı tarafından istenen şarkıyı çalmaya başladı. Elbette bu görevi tamamlamak için kullanıcının sessiz bir ortamda olduğundan emin olması gerekir.

Bu isteğe bağlı makine, Alexa'nın orijinal şeklidir. Amazon mühendisleri böyle bir ürün tasarladı, Bunu, dünyadaki en büyük ve en karmaşık veri kümelerinden biri olan Amazon veri kümesiyle insanca iletişim kurmak için kullanmayı umuyorum.

O zamandan beri, ses tabanlı ev yapay zekası Amazon'un önemli bir işi haline geldi ve Amazon'un rakipleriyle savaşması için giderek daha fazla savaş alanı haline geldi. Bugün Google, Apple, Samsung, Microsoft ve diğer şirketler bu savaş alanında bir araya geldi ve ayrıca çekici ve kullanımı kolay sesli etkileşim cihazları oluşturmak için ellerinden geleni yapmaları için binlerce araştırmacı ve iş uzmanını gönderdiler.

Şekil Amazon Alexa + Echo

2014'te pazara sunulduğundan bu yana, Alexa ile çalışan makineler milyonlarca sattı. Sese dayalı yapay zeka cihazları kullanan ABD pazarında, Amazon'un satışları toplam birim ürün satışlarının% 70'ini oluşturdu. Tabii ki rekabet de yoğunlaşıyor. Rakip Google Home milyonlarca birim sattı ve Apple ve Microsoft kendi sürümlerini piyasaya sürmek üzere.

Araştırmaya göre Google, Apple, Microsoft ve Amazon'un AI platformlarının her biri farklı avantajlar gösteriyor. Google Asistan, çok çeşitli arama komutları için en iyi seçimdir; Appleın Siri ve Microsoftun Cortana'sı başka yeteneklere sahiptir; Alexa özellikle alışveriş komutları için iyidir.

Bu büyük şirketler bu pazara giriyor çünkü yarışmanın kazananları büyük ödüller, yani üç önemli pazar üzerinde kontrol ve etki alacaklar: Ev otomasyonu, ev eğlence pazarı ve alışveriş pazarı Bu üç pazarın en küçüğü ev otomasyonudur.Bu pazar tek başına halihazırda yılda 5 milyar ABD dolarının üzerinde bir paya sahiptir.Amerika Birleşik Devletleri'ndeki toplam perakende sektörü, büyük bir potansiyele sahip olan 4,9 trilyon ABD dolarına ulaştı.

Amazon, akıllı ses asistanlarının, akıllı telefonlar gibi insanların günlük hayatını değiştirmesini bekliyor: akıllı telefonlar hayatın her alanına girdi, insanların flört kurallarını değiştirdi ve hatta insanların yürüme hızını değiştirdi. Benzer şekilde, ses temelli yapay zeka da aile hayatının her yönünü değiştirecek.

Ancak Echo'nun akıllı telefonlar kadar popüler olabilmesi için Amazon'un daha fazlasını yapması gerekiyor. Amazon, bu amaçla bağımsız geliştiricileri, Apple'ın APP geliştiricilerine verdiği uzun vadeli destek gibi, platformda yeni hizmetler oluşturmaya teşvik ediyor. Şimdiye kadar, platformda 15.000'den fazla "beceri paketi" veya uygulama oluşturuldu. Dahası, uygulama oluşturma araçlarının eşleşmesi çok kolay hale geldi.

Şimdi, çok fazla programlama bilgisi olmadan basit bir uygulama oluşturmak yalnızca bir saat sürüyor. Platformdaki en popüler uygulamalar, Uber ve Lyft'in araç çağırma araçlarıdır. İstenmeyen kötü uygulamalar, kullanıcılara sözlü taciz kullanan 48 uygulamayı içerir.

Bu iddialı geliştiriciler arasında Alexa ile çalışan donanım şirketleri ve Alexa ile eşleşen yazılım hizmetleri sağlayan şirketler var. Örneğin CapitalOne, banka müşterilerine Alexa tabanlı fatura ödemesi sağlıyor; Toronto merkezli akıllı termostat üreticisi Ecobee, insanların odayı birkaç kelimeyle ısıtmasına veya soğutmasına olanak tanıyan Alexa destekli bir sürümle donatılabilir. , Alexa cihazları şirketin en hızlı büyüyen ürün grubu ve Alexa cihazları şimdiden toplam satışlarının yaklaşık% 40'ını oluşturuyor.

Amazon, 50 $ 'lık düşük kaliteli Dot'tan 230 $' lık bir video ekranına sahip üst seviye Echo'ya kadar değişen fiyatlar ile Dot and Echo makineleri satarak para kazanıyor. . Bu cihazlar, kullanıcıları Amazon çevrimiçi alışveriş merkezlerinde daha fazla alışveriş faaliyetine yönlendirebilirse, bu Amazon'a başka bir büyük geri dönüş getirecektir - ancak Amazon bu konudaki verileri ifşa etmeyecektir.

Aslında, Alexa destekli Echo cihazları ve Dot cihazları, sizin için ışıkları kapatabilen, şakalar anlatabilen veya sizin için haber okuyabilen her yerde bulunan ev asistanlarıdır. Ayrıca kullanıcılar hakkında veri toplayabilir ve bunu Alexa'yı geliştirmek ve kullanımını artırmak için kullanabilirler.

Amazon söz konusu olduğunda, isteğe bağlı makine zaten değiştirildi. Bugün, son derece büyük bir canavar haline geldi.

Daha iyi dinle

Alexa veya aksesuar ürünleri soğuk kış aylarında sizin için kapıyı kilitleyebiliyor veya araç ısıtıcısını açabiliyorsa, bunu neden kendiniz yapmanız gerekiyor?

Şu anda Amazon, Alexa'ya bağlı akıllı termostatlar, lambalar ve diğer cihazları üreten şirketlerden para kazanmaya çalışmadı. Yine de, Amazon'un gelecekte bu şirketlerle pazar gelirini nasıl paylaşacağını hayal etmek hala kolay.

Amazonun en büyük önceliği, Alexa'nın yapay zeka sistemi insan verilerine dayalı olsun ve insan kaynaklarından öğrenme hızını artırsın.

Hemen hemen tüm sesli AI oyuncuları bunu bilir Voice AI, tüketiciler için çok çekici çünkü ihtiyaçlarımızla doğrudan yüzleşebilir ve klavye veya ekrana yazmamızı gerektirmeden konuşmalarımıza ve düşüncelerimize yanıt verebilir. Bu aynı zamanda teknik olarak inşa etmeyi son derece zorlaştırır çünkü konuştuğumuzda sözlerimiz her zaman organize olmaz. Aksine, sık sık kendimizi böleriz, düşüncelerimiz dalgalanır, kelimeleri garip şekillerde kullanırız, başımızı sallar, başımızı sallar ve mırıldanırız. Gerçekte söylediklerimiz anlaşılmaz olsa bile, kendi sözlerimizin anlaşılabileceğini düşünme eğilimindeyiz.

Binlerce Amazon çalışanı bu zorluğun üstesinden gelmek için çok çalışıyor. Bu kişiler Seattle, Sunnyvale, California ve Massachusetts, Cambridge Araştırma Merkezi'nde çalışıyor. Öyle olsa bile, Amazon'un işe alım sayfası kısa süre önce, bir düzine departmana dağıtılmış, makine öğrenimi uzmanları için 215 pozisyon dahil olmak üzere 1.100'den fazla yeni Alexa pozisyonu sundu.

Şekil Amazon Alexa baş bilim adamı Rohit Prasad

Alexa Baş Bilim İnsanı Rohit Prasad için, Amazon neden bu kadar çok insana ihtiyaç duyuyor ve araştırma ekibi ne zaman tam kadroya sahip olacak? 20 yıldır uzun süredir konuşma teknolojisinde çalışıyor ve çoğu zaman sinir bozucu sonuçlar aldı.

Sorunun cevabı, geçtiğimiz beş yılda büyük fırsatların geldiğidir.

Gerçekten etkili bir sesle tetiklenen yapay zeka yaratmanın karmaşık ve fethedilmemiş bir görev olduğuna hiç şüphe yok. Geçmişte, dil bilimcileri, deneylerin ilk turunda kaotik kelimelerin tam anlamını belirlemek için çok çalıştılar. Bugün, yeni makine öğrenimi yöntemleri farklı yönler alarak ilerleme kaydetmiştir: İşlerine kusurlu eşleşmelerle başladılar, ardından hızlı ince ayar ve anlık tahminler yaptılar.

Önemli olan, büyük miktarda kullanıcı verisini analiz etmek ve erken hatalardan ders almaktır. Alexa, kullanıcılarla ne kadar çok etkileşim kurarsa ve ne kadar çok veri toplarsa o kadar akıllı hale gelir. Alexa'nın ilerlemesiyle, daha fazla fırsat geliyor ve bu da işbirliği için daha fazla insan gücü gerektiriyor.

Prasad, "Bir örnek vereyim," dedi. "Alexa'ya sorarsanız Adele'nin ilk albümü nedir?" Cevap "19" olmalı. Ona "çal" dersen, Alexa hangi albümü çalmaya başlayacağını bilecek. "Peki ya arada başka konuşmalar varsa? Albümün ilk çıktığı zaman Alexa'ya sorarsanız, kaç kopya sattığını sorarsanız ve ardından Alexa'dan" çalmasını "isterseniz, Alexa'nın önceki sürümü Sorun sıkıştı. Şimdi Alexa'nın teknolojisi insanların düşüncelerine ayak uydurabiliyor, en azından bazen burada "o" nun hala "ilk albüm" anlamına geldiği anlaşılıyor.

Bu gelişme, makine öğrenimi teknolojisinden geliyor. Makine öğrenimi sistemi, Alexa'dan önce oluşan binlerce iletişim engelini yeniden inceledi ve iyileştirmeler yaptı. Sistem, kullanıcının gerçekte hangi şarkıyı dinlemek istediğini öğrenebilir ve bu şarkıyı konuşmanın ilk bölümünde tanıyabilir. MIT konuşma dili sistemi ekibinin başkanı James Glass şunları söyledi: "Başlangıçta, insanların hangi soruları soracağını varsayarak bazı varsayımlar yapmanız gerekir. Ardından verileri toplar ve modelinizi ayarlarsınız."

James Glass, bu makine öğrenimi yönteminin geniş çapta tanındığını söyledi, Ancak bu yöntemi kullanmak için gerekli veri miktarı üniversite araştırmacılarının elindeki verileri çok aşıyor. Alexa kullanımındaki artışla birlikte, Amazon artık genişletilmiş bir insan-makine arayüzü sesli etkileşim havuzuna erişime sahip ve bu da onu, Google'ın metin arama sorgularında lider bir konuma sahip olması gibi ince ayarlı ses teknolojisinde lider yapıyor.

Amazon, gelecek nesil yapay zeka ve konuşma araştırmacılarıyla olan bağı güçlendirmek için dünyanın dört bir yanından bir düzineden fazla üniversiteden mühendislik öğrencilerini de 20 dakika dayanabilen sesli robotlar yapmaya davet etti. Bu yıl Kasım son tarihinden önce en fazla ilerlemeyi kaydeden ekip 500.000 $ ödül kazanacak.

Dış verilerin eklenmesi de faydalıdır. Örneğin, 2016'da Amazon, Alexa'ya devasa bir şarkı sözü veritabanı ekledi, böylece kullanıcılar "Chevy'imi uçağa sürdüm" şarkı sözlerini söylediklerinde, Alexa otomatik olarak Don Mclean'ın "American Pie" şarkısını ilişkilendirecek.

Prasad ekibinin en son projelerinden biri, bu yaklaşımın esnekliğini vurgulamaktadır. Bu, kullanıcının ilk isteğine pişman olup olmadığının nasıl çözüleceğini içerir. Farklı kullanıcıların talimatları çok farklı olabilir. Bazıları "Hayır, hayır, hayır" der, diğerleri "İptal" demeyi tercih eder ve diğerleri, "Bekle, aslında istediğim budur" vb. Alexa'nın her cümleyi deşifre etmesi gerekmiyor. Büyük örnekler ve yarı denetimli makine öğrenimi, bir dizi olası olumsuz konuşma belirtecini genelleştirmeyi ve ardından söylem değişikliklerinden sonra tutarlı yeni istekleri çıkarmayı mümkün kılar.

Kısacası, Alexa daha iyi bir dinleyici olmak için çok çalışıyor.

Söylenecek çok şey var

Pek çok insan, ses yapay zekasının en hevesli kullanıcılarının cep telefonlarını veya tabletleri kolayca kullanamayanlar olduğunu tahmin edebilir. Bu ayrıca Alexa'da da doğrulandı.

Engelli insanlara barınma ve hizmet sağlayan Philadelphia Inglis'in icra kurulu başkanı Gavin Kerr, sekiz engelli sakinin evlerine Amazon Echo ve Dot cihazları kurdu. İlk testler tamamlandığında, sonunda bunları 300 konutun tamamına eklemeyi umuyor. "Engelli sakinler için bu inanılmaz bir müjde. Daha rahat yaşayabilirler. Onlara bağımsızlık getiriyor."

Örneğin, yatalak veya tekerlekli sandalye kullananlar için ulaşılamayan bir duvar termostatı çok büyük bir işkence olacaktır. Bu bağlamda Kerr, Vücutlarının sıcaklığa alışması zor. 72 ° F'lik bir oda, onları ilk bir saat için sıcak ve sonraki bir saat tekrar soğuk hissettirebilir dedi. Hareket güçlüğü nedeniyle, oda bir çıngırak sağlamazsa Acil insan bakımı ile bu engellilerin kendilerini daha rahat hissetmeleri zordur.

Bazı ayarlamalardan sonra, Alexa yazılımı, sınırlı dil becerisine sahip olanlara da hizmet edebilir. Kerr, rehabilitasyon hastanesinden ayrılıp günlük topluma dönmek isteyen 30 yaşındaki dil bozukluğu olan bir adamdan bahsetti. Kerr, "Bize Alexa'nın komutlarını kullanamayacağını söyledi. Biz de sorduk, ne diyebilirsiniz? Ardından, Alexa'nın istediği gibi çalışmasını sağlamak için yazılımı değiştirdik. Şimdi, Mutfak ışığını yakmak istediğinde 'John' diyecek, banyonun ışığını yakmak istediğinde ise 'Anne' diyecek.

Inglis, Echo kullanıcıları için dört saatlik eğitim sağlayacak olsa da, çoğu yeni kullanıcı kendi başlarına keşfetmeyi tercih ediyor. Echo'yu kutudan çıkardıktan sonra, müzik çalma, alarm ayarlama veya alışveriş listelerini güncelleme gibi bazı özellikle yaygın uygulamalar vurgulanacaktır. Birden fazla cihaza sahip kullanıcılar, akıllı telefonlarında veya dizüstü bilgisayarlarında Alexa kontrol panelini arayarak ayarlarını yapabilir, yeni uygulamaları keşfedebilir veya uygulamaların nasıl en iyi şekilde çalışmasını sağlayacakları konusunda rehberlik alabilir.

Microsoft ürün yöneticisi Darren Austin, Haziran ayında yayınlanan popüler bir blogda şunları yazdı: Alexa'nın yaygın başarısı, aşırı yüklü yaşamın stresini azaltmasıdır. Austin şunları yazdı: "Basit sesli sorgulama yoluyla, Alexa, insanların belirsizlik ve unutma korkusuyla ilgili olumsuz duygularını gideriyor." kullanım Kullanıcılar Alexa'ya her türlü karmaşa ve arzuyu anlattılar.Bu anlamda Alexa, kullanıcı ihtiyaçlarına cevap vermeye hazır bir yol arkadaşı oldu.

Her hafta, bazen daha sık, Alexa genel müdürü Rob Pulciani, Alexa ve Dot kullanıcılarının en yaygın kelimelerinin toplu verilerine göz atıyor. Genellikle en yaygın kelimeler müzik, haberler, hava durumu, trafik ve oyunlar hakkındadır. Ancak, bu bahardan başlayarak, yeni bir sıcak söz hızla yükseliyor: "Alexa, rahatlamama yardım et".

Kullanıcılar bu talebi yaptığında, çeşitli yatıştırıcı seslere - cıvıldayan kuşlar, kıyıya çarpan uzak dalgalar; geceleri gürleyen yük trenleri - yönlendirilecekler. Kullanıcı isterse, bu tür çevresel gürültü döngüsü birkaç saat oynamaya devam edebilir.

Bu içerikler 2015 yılında Alexa platformunda ilk ortaya çıktığında, ekip bir zamanlar bu uygulamaları daha az önemli görüyordu, ancak bu içerikler hızla popülerlik kazandı. Örneğin aşırı stresli bir yetişkin bu seslerde uyuyakaldı. Ebeveynler, bebeği ikna etmek için bu sesleri ninnilere dönüştürür.

Önümüzdeki birkaç hafta içinde ekip, Alexa'nın iç yapısında ince ayar yaptı, böylece yeni Echo alıcıları yeni bir uygulama denemek istediklerinde yatıştırıcı ses seçeneğini hızlıca keşfedebilirler.

çapraz Akış sürdürülebilirliği

Sesli yapay zekanın nihai zaferi, kaçınılmaz olarak kullanıcı ile gerçekçi, çok dakikalık bir konuşma olacaktır. Bu, kullanıcı net bir talepte bulunmasa bile, makinenin kullanıcının niyetini anlayabilmesi gerektiği anlamına gelir. Bu, makine yeteneklerinde büyük bir sıçrama olacak.

Hiç şüphe yok ki insanlar, "Birkaç haftadır spor salonuna gitmedim" derken, bir arkadaşının stres veya özgüven hakkında konuşmak isteyip istemediğini kolayca anlayabilir. Ancak AI yazılımı için bu zor bir adım olacak. Yapay zekanın ani geçiş veya eğik ipuçlarını anlaması son derece zordur.

Belirli bir hafta sonu, altı Echo robotu test ettik.Her robot için basit bir sorgulama ile başladık ve kademeli olarak çeşitli olası yanıtlara izin veren karmaşık bir açık soru ve cevaba dönüştük. Bir Echo bana "En son filmi izledin mi?" Diye sorduğunda, "Evet, Gizli Figürler izledim" diye cevap verdik. Robot bu filmin bir incelemesini sıkıcı bir şekilde atmadı ama Bana dedi ki: "Gizli Figürler (gizli rakamlar) aslında matematikte çok zayıf." Bu cümle film hakkındaki düşüncelerime uymuyor ama robottan söylendiğinde gerçekten çekici ve nezih.

Konuşmamızın durması uzun sürmedi ama en azından kısa ve güzel bir an yaşadık.

Ne yazık ki, başka hiçbir Echo bu kadar iyi performans göstermedi. En kafa karıştırıcı şey, robotlu bir internet sitesinden bahsettiğimi düşündüğümde, robotun "Park etmeyi ve yemek dağıtımını sever misin?" Gibi bir cümle açmasıdır. Robotun eksikliklerini eleştirmek için birkaç keskin söz söyledim, ancak robot açıklanamaz bir şekilde sordu: "Toplu olarak pazarlık yapabilir misin?"

Birkaç gün sonra, Amazon'un Prasad'ına sosyal robotlar hakkında ne düşündüğünü sorduğumda, erken başarısızlıkların onu rahatsız etmediğini düşündü.

Bana, "Bu çok önemli bir alan, Alexa'nın çok akıllı hale gelebileceği bir alan. Ancak bu, Go veya Satranç gibi oyunları oynamaktan daha zor. Bu oyunlarda birden fazla olası hamle olsa bile nihai hedefin ne olduğunu her zaman bilirsiniz. Bir sohbette, yargıda bulunmak şöyle dursun, karşı tarafın niyetini bile bilmiyorsunuz. "

Belki de Alexa bir gün muhatabın gerçek niyetini anlayabildiğinde, gerçek zekice konuşma bu olacaktır.

Karlı havada sebat edin, yarı yolda yağ verin, Sinopec Binzhou Bahar Şenliği servisi bahar kadar sıcak
önceki
Kuzey Kutup Dairesini geçmek ve buz ve kar dünyasında eğlenmek Binzhou bebekleri Finlandiya'da yeni bir yıl geçiriyor
Sonraki
4 askeri oyun gönüllülerinin hikayelerini dinleyerek, gönüllü hizmeti moda haline getirmesi
Huawei Mate10'un kamera performansı iPhoneX tarafından üçüncü sırada yer aldı
Wuhan Askeri Oyunları için gönüllü eğitim, yurt içinde iki ilke imza atıyor
Premier Lig: Doherty durma zamanı, Newcastle 1-2 Wolves
Haberler Mianyang polisi, aranan 7 kaçağa ödül veren bir "içki tepsisi" dolandırıcılık çetesini ortaya çıkardı
Bundesliga: Mainz Hannover ile berabere kaldı, Borussia Borussia 3 golle Stuttgart'ı yendi
Kasım ayında Sansu Tapınağı'ndaki Ginkgo, dönüş yolculuğunda ginkgo ağacının altına bir mektup yazmaya geldi.
Musk'ın "Alpha Dog" un OpenAI versiyonu en güçlü insan oyuncuyu yendi
90'larda doğan genç bir besteci, tarihi soruları yanıtlamak için senfoniyi kullanarak "Kangxi Southern Tour" için müzik besteledi.
OPPO R11S satışları, erkek kullanıcıların yarısından fazlasıyla birden fazla e-ticaret platformunda gerçekten en çok satan satışları kazandı
Dördüncü nesil Tucson'un fiyatı açıklandı, seçimimi iyileştirecek mi?
Odriozola Bell'in golü atmasına yardım etti, Real Madrid 1-0 Huesca
To Top