Erişilebilirliğin yeni bir tanımı, kullanıcının niyetinin anlaşılmasını sağlayan bir etkileşim

İşitme engellilerin telefona cevap vermesine nasıl izin verilir, dil engellilerin dış dünya ile konuşmasına nasıl izin verilir? Beyin-bilgisayar arayüz teknolojisinin olgunlaşmadığı bu aşamada, bunu başarmak için yapay zeka ve makine öğrenimi gerekiyor.

Canlı Altyazı

Bu yılın Şubat ayında Google, Android telefonlarda Canlı Altyazı uygulamasını başlattı ve ardından Mayıs ayında Google I / O, ses / metin desteği çağrılarını gerçek zamanlı olarak yazabilen ve dil engelli kişiler için ses transkripsiyonunu gerçekleştirebilen Live Relay'i piyasaya sürdü. Euphonia Projesi.

"İnsanların daha iyi iletişim kurmasına yardımcı olma" konusunda, bunlar yapay zekanın ve yaygın olarak kullanılabilecek ilerlemenin ön safları olmalıdır.

Dünyadaki en gelişmiş konuşma tanıma uygulama ürünü olmalı

Canlı Altyazı

Canlı Altyazı, sağır ve işitme güçlüğü çeken kişiler için Google tarafından geliştirilen ücretsiz bir Android erişilebilirlik hizmetidir. Otomatik Konuşma Tanıma (ASR) ile ilgili önceki araştırmaya dayanarak, Canlı Altyazı, mobil cihazlara otomatik olarak altyazı oluşturma işlevini tanıttı.

Daha parlak iç eşmerkezli daireler gürültü tabanını temsil eder ve dış eşmerkezli daireler konuşmacının sesinin telefon mikrofonu tarafından alım durumunu temsil eder.

Canlı Altyazı kullanma sahnesi şu şekildedir: Canlı Altyazı yazılımını açtıktan sonra, dış dünyanın sesini gerçek zamanlı olarak okuyacak ve ses gerçek zamanlı olarak metne dönüştürülecek ve telefon ekranında görüntülenecektir. Konuşmacı gülse, ıslık çalsa ve diğer ayrıntılar olsa bile, karşılık gelen metin uyarıları olacaktır.

Diğer bir deyişle, yalnızca İnternete bağlı bir cep telefonu gerçek zamanlı sesten metne işlevini gerçekleştirebilir. Yazılım şu anda 70'den fazla dili desteklemektedir.

Bununla birlikte, Live Transcribe'ın gerçek zamanlı transkripsiyonu, sesleri sınıflandırmak için yalnızca mobil cihazdaki sinir ağını değil, aynı zamanda sesi metne dönüştürme sürecini tamamlamak için buluttaki üç sinir ağı modelini de gerektirir.

Sagar Savla, Canlı Altyazı gösteriyor

Ai Faner, Google AI Araştırma Grubu ürün müdürü Sagar Savla'ya Canlı Altyazı'nın bulut ağlarına güvenmeden tamamen yerel olarak ne zaman çalışabileceğini sorduğunda bize şunları söyledi:

Bu tür çalışmalar yapıyoruz, ancak şu anda kesin bir zaman çizelgesi yok. Örneğin Çince gibi bir dil, büyük bir model gerektirir, büyük bir modeli terminal cihazına entegre etmek ve doğruluğunu sağlamak çok zordur.

Canlı Röle

Google, bu yılki geliştirici konferansında Live Relay'in yeteneklerini gösterdi: işitmeden veya konuşamadan nasıl kolayca arama yapılabilir.

Dil engelleri, sosyal korkular, diş çekimleri vb. Nedeniyle konuşamıyorsanız, Canlı Aktarma sayfasına bir kelime girin, metin hızlı bir şekilde sese dönüştürülecek ve başka bir kişinin cep telefonuna gönderilecektir.

İşitme bozukluğu, gürültü vb. Nedeniyle sesi duyamıyorsanız, Live Relay arayanın sesini metne de dönüştürebilir.

Şu anda Live Relay hala araştırma aşamasındadır ve yalnızca belirli Pixel telefonlarda kullanılabilir ve şimdilik yalnızca İngilizce'yi desteklemektedir.

Live Relay, cihazdaki ses tanıma ve metinden sese tanıma işlevlerini kullanarak tamamen cihaz üzerinde çalışacaktır.

Anında yanıt ve tahmini giriş önerileriyle (akıllı geçiş ve akıllı yazma), telefon görüşmelerine ayak uydurmak için yazma hızı artırılabilir.

Kanımca, Live Relay Google'ın erişilebilirlik projesi olarak sınıflandırılmasına rağmen, özellikle işitme engelli kullanıcılar için yararlıdır, ancak aslında birçok kişi de kullanabilir. Örneğin, bir toplantı sırasında aniden önemli bir çağrı alırsanız ve bunu yanıtlamak için dışarı çıkamıyorsanız, Canlı Aktarım kullanışlı olabilir.

Euphonia Projesi

İstatistiklere göre, kademeli donma sendromu, multipl skleroz, beyin hasarı, felç gibi nörolojik hastalıkları olan hastaların da genellikle dil engelleri vardır.Dış dünya genellikle bu insanların ne dediğini ve nasıl ifade ettiklerini anlayamaz.

Euphonia projesi, dış dünya ile daha iyi iletişim kurmalarına ve ifade etmelerine yardımcı olmak için hareketleri, göz kırpmaları ve yüz ifadelerini tanıyabilen bilgisayar görüşü temelli modellerin yanı sıra, dil bozukluğu olan kişiler için konuşma tanıma modelleri oluşturuyor.

Kademeli donma sendromu organizasyonu ile işbirliği yaparak, kademeli donma sendromu olan hastaların seslerini öğrenmek ve tanımak için yapay zekayı eğitiyorlar, böylece telaffuzlarının transkripsiyonunu gerçekleştiriyorlar.

Aynı zamanda, belirli hastalar için kişiselleştirilmiş AI eğitimi almaya devam ediyorlar.

Örneğin, on yılı aşkın süredir donma teşhisi konulan Steve Saling'in spor etkinliklerini izlerken yüz ifadelerini tanıyarak ifade etmek istediği duyguları belirleyebilen özel eğitimli bir modeli var.

Neşelendirmek istediğinde, bilgisayar bir airhorn sesi çıkaracak; tezahürat yaptığında, bir yuhalama yapacak.

Euphonia projesinin ürün müdürü Julie Cattiau, karşılaştıkları en büyük zorluğun ses örnekleri toplamak olduğunu söyledi. Dil engelleri olan insanlar nüfusun büyük bir bölümünü oluşturmadıkları ve çoğu zaman özel ihtiyaçları olduğu için, bu tür bir dil tanıma araştırması için uygun olan insanları işe alıyorlar.

Erişilebilirliğin yeni bir tanımı: her kullanıcının niyetinin anlaşılmasını sağlamak

Halen yedek kapasiteye sahip teknoloji şirketleri, ürünleri tasarlarken ve geliştirirken az çok bilgi erişilebilirliğini dikkate alacaklardır.

Bir dereceye kadar, bilgi erişilebilirliği, akıllı ürünlerin etkileşimli tasarımında özel kişiler için bir işlevdir ve bu, insanların ürünün donanım ve yazılım işlevlerinden daha eşit bir şekilde yararlanmasını sağlar.

Teknolojik ürünlerdeki "engelsiz", İnternet dünyasındaki kör yol, tırabzanlar, işitme cihazları ve protezlere eşdeğerdir.

Erişilebilirlik menüsü, ekran okuma işlevi, büyüteç işlevi, Android ve iOS sistemlerinde kontrast renk ayarı veya bazı uygulamalardaki erişilebilirlik kitleri ve işlev düğmeleri için "etiketler" olsun, bunlar çok temel erişilebilirliktir kullanıcı deneyimi.

Temel engelsiz kullanıcı deneyimi, kullanıcıların cep telefonları, bilgisayarlar, uygulamalar ve diğer ürünler tarafından gönderilen bilgileri daha doğru bir şekilde almasını sağlamaktır.

Google, "kullanıcıların niyetlerinin makineler tarafından anlaşılmasını sağlamak" için "kullanıcıların makine bilgilerini doğru bir şekilde almalarından" engelsiz bir evrim gerçekleştirmek için yapay zeka ve makine öğrenimini kullanır.

Bu aynı zamanda "engelsiz" in gelecekte insan-bilgisayar etkileşiminin yeni bir yolu olacağı anlamına geliyor. Belirli insan grupları için daha fazla bilgi sağlayabilir ve ayrıca kullanıcıların daha rahat ve hızlı çalışmasına ve daha da önemlisi "tamamlamanıza yardım edeyim" şeklinde gelişmesine olanak tanır.

Teknolojinin gelişimi "erişilebilirliği" yeniden tanımlıyor ve aynı zamanda ürünlere ve teknoloji şirketlerine yeni gereksinimler getiriyor. İyi bir erişilebilirlik deneyimi sağlayabilen bir ürün, genellikle sıradan kullanıcılar için daha iyi bir deneyim de sağlayabilir.

Resmin kaynağı: searchenginejournal.com

Beyaz dengesini otomatik olarak ayarlayabilen akıllı ekrana sahip Google akıllı hoparlörler Eylül ayında satışa çıkacak.
önceki
Kola artık bir klasik değil mi? Yeni aromalar ve düşük şekerli versiyon Coca-Cola'nın hisse fiyat rekorunu yüksek yapıyor
Sonraki
Microsoft'un 1 milyar dolarlık OpenAI'si ile ne yapmak istiyorsunuz?
ASUS ROG Phone 2 ilk değerlendirme: yüzeydeki en güçlü Android telefon
Starbucks yiyecek içecek sektöründe bir "İnternet şirketi" olmak için ne yaptı?
Nintendo, oyuncular tarafından toplu dava davasına maruz kaldı Joystick kayması nedir?
Boeing, 737 MAX 8'i yeniden adlandırmalı mı?
5G cep telefonları kansere neden olabilir mi? Aptal olma
Luo Tianyi, Hatsune Miku, Kizuna Ai ... Sanal idolün konseri nasıl?
140 yıldır dünyanın en sıcak Haziran ayını mı yaşadınız? Endişelenme, sıcak günler gelecekte hala büyüyor
Bu robot bir karıncadan daha küçük ve elektriksiz çalışabilir
Büyük şirketler porno tarama geçmişinizi izliyor ve "gizlilik modu" duramaz
Yapay zekanın bir sonraki ahlaki sorunu: hayvanlara nasıl davranılmalı
Gelecekte McDonald's'ta mutlu yemekler için plastik oyuncaklar olmayabilir, çünkü çevre dostu değildir.
To Top