Microsoft'un en son konuşma tanıma sistemi insanlardan daha doğrudur

Son zamanlardaki sıcak HBO TV dizisi "Batı Dünyası" nda mühendisler, doğru ve yanlışı doğrudan genel dille ayırt etmenin zor olduğu robotlarla etkileşime girdiler. Belirli sistem şifreleri zaman zaman görünse de, genel olarak kötü değildir. İletişim çok doğal.

HBO resmi web sitesinden "Westworld" de mühendisler ve robotlar arasındaki etkileşim

Ancak Appleın Siri'si, Amazonun Alexa'sı veya Microsoftun Cortana'sı olsun, ses tanıma özelliklerine sahip mevcut sistemlere bakarken, kullanıcılar yine de genellikle yetkisiz kullanıcı kelimelerini "otomatik olarak düzelttikleri" için telefonlarını parçalamak isterler. Basitçe iyi bir "diktatör" olmak kolay değil.

17 Ekim'de Microsoft, "Konuşma Konuşmasında İnsan Eşitliğine Ulaşmak" (Konuşma Konuşmasında İnsan Eşitliğine Ulaşmak) adlı bir makale yayınladı. Gazete, konuşma tanıma teknolojilerinin profesyonel manuel stenograflardan daha yüksek olduğunu iddia ediyor.

Microsoft araştırma ekibi, resim Microsoft'un resmi web sitesinden geliyor

Karşılaştırma yapabilmek için, Microsoft araştırmacıları doğru komut dosyası içeren bir ses klibi buldular ve bir üçüncü taraf şirketi konuşmadan metne işleme gerçekleştirmeye davet ettiler. Bu üçüncü taraf şirketin çalışması iki bölüme ayrılmıştır: bir dönüştürücü, içeriği yazarken sesi dinlerken, diğeri birinci kişi tarafından sağlanan metni değiştirirken sesi dinler. Daha sonra standardın doğru metni ile yapılan karşılaştırmaya göre üçüncü şahıs firmaların hata oranları sırasıyla% 5,9 ve% 11,3 olmuştur.

Microsoftun tanıma sistemi, 2000 saat insan konuşma materyallerini öğrendikten sonra, aynı ses materyali için konuşma tanıma gerçekleştirdi. Hata oranları sırasıyla% 5,9 ve% 11,1 idi. Miktar olarak, insan kontrol grubuna göre yaklaşık on daha azdı. Hatalar.

Microsoft'un resmi web sitesinden resim

Bu testin sonuçları iyi olsa da, işlenmiş ses materyallerinin gerçek hayat sahnelere yakınlığı hala çok uzak. Ve Microsoft araştırmacıları ayrıca, bir sonraki adımın sistemi, otoyollarda giden partiler veya arabalar gibi bazı arka plan gürültüsü olan sahnelere yerleştireceğini belirtti. Aynı zamanda, insan kontrol grubunun referans alınabilirliğinin de araştırılması gerekir. Ancak her halükarda, konuşma tanımadaki bu atılımın, bir kez rapor edildikten sonra kaybolan türden bir bilgi haline gelmeyeceğini umuyorum.

Resim QUARTZ'dan

"Injustice 2" ilk karakter tanıtımı Süpermen'in saç çizgisi gittikçe yükseliyor
önceki
LOL: Uzi yumruk destanıyla mı zayıflatıldı? Terk edilmiş ADC, şimdi bile destekliyor
Sonraki
Ölümlü Yetiştirme Biyografisi: Han Li'nin Gri Diyar'dan, Samsara Taocu atasından veya ruhun ağlamasından kaçmasına kim yardım etti?
Tarihin en büyük dönüşü, yorumcu SKT'yi tebrik etti, ancak GRF bir sonraki saniyeyi kazandı
Project Racing 2'nin yeni ekran görüntüleri duyuruldu, dünya çapında 170 lüks otomobil dolaşıyor
Bir hava kamerasına benzemiyor: Kutudan çıktığı gibi Hover Camera Passport
DNF'de en çok abartılan meslekler olan Soul of Sword, evrenin hükümdarları listesinde ikinci sırada yer alıyor
Ölümlü Yetiştirme Biyografisi: Han Li, Daluo ile tek başına savaşabilir, gök gürültüsü ve şimşek yasası, zaman yasasının kusurlarını telafi eder
Riot yasaklandı, Silas yarışmadan men edildi ve Lig 9.5 lansmanı yapıldı.
Geniş gövdeli ve akıllı ara bağlantıya odaklanın Brilliance China V6 test sürüşü deneyimi
Sıcak gönderi arkadaş çevresini mi kaydırıyordu? WeChat'in yeni test işlevi sizi endişelerden kurtarır
Beşinci kişilik: Kasaplar için en sinir bozucu davranış.Bu tür bir davranışla karşılaştığınızda, ağaca tutunmalısınız.
Ölümlü Yetiştirme Biyografisi: Dao Atasının arka eli var, Gan Jiuzhen ve Shi Chuankong'un hepsi yedek
Nintendo Switch dayanıklılık testi: "The Legend of Zelda: Breath of the Wild" 3 saat oynanabilir
To Top