Şehir merkezindeki bilimsel sorunlar

Lütfen böyle bir senaryo hayal edin:

Sıradan güneşli bir öğleden sonra, sokakta tek başınıza yürüyorsunuz Önünüzde iki kişi var. Yakınlarda yeni bir marketten bahsediyorlar. Aniden, arkanızda havlayan bir köpek dalgası oldu, "havlıyor", hızla geriye bakıp neler olduğunu anlıyorsunuz. Bu sırada caddenin diğer tarafından bir polis arabasının kornası geldi, "Vay canına, vay canına".

Bir süre sonra başınızı salladınız ve köpeğin havlamasının durmadığını ve yayaların tartışmasının hala kulaklarınızda olduğunu ve polis arabasının düdüğünün uzaklaştığını gördünüz.

Farkında olmayabilirsiniz Aslında, yarım yüzyıldan fazla bir süredir bilgisayar bilimini rahatsız eden bir problemle karşılaştınız ve kolayca tamamladınız - kokteyl partisi problemi.

Şekil 1. Bir sokaktaki işitsel bir sahne, resim IEEE Spectrum'dan alınmıştır

Kokteyl partisi problemi, İngiliz bilişsel bilimci Edward Colin Cherry tarafından 1953'te dikkat mekanizmasını incelerken önerildi. Karmaşık bir işitme ortamında insan işitme seçimi yeteneğini ifade eder.

Birden fazla sesin varlığında, insanlar belirli bir ses uyaranına odaklanabilir ve diğer arka plan seslerini görmezden gelebilir. Başka bir deyişle, insanlar bir kişinin konuşmasına konsantre olabilir ve arka plandaki diğer konuşmaları veya sesleri görmezden gelebilir.

Az önce varsaydığımız senaryoyu hatırlayın: Bir polis arabasının kornası göründüğünde, yayaların sesi ve köpek havlaması gibi diğer seslerin parazitini görmezden gelerek bu sese hızlıca odaklanabiliriz. Tabii ki, işitsel davranışınızı istediğiniz zaman birden fazla ses kaynağında test edebilirsiniz. Gerçekler size her zaman duymak istediklerinizi doğal ve mükemmel bir şekilde duyabileceğinizi, ancak aynı anda birden fazla kişiye her zaman dikkat edemeyeceğinizi söyleyecektir. Ses kaynağı.

İnternetten resim

Aslında, karmaşık ortamlar karşısında işitsel dikkat seçimi yeteneği, insan işitme sistemi tarafından sergilenen inanılmaz bir yetenektir. Kokteyl partisinin etkisinin mekanizması karmaşık olsa da, biz insanlar için dikkati çoklu ses kaynakları arasında değiştirmek o kadar kolaydır ki, bu sürecin varlığını bile hissedemeyiz. Ancak bilgisayarlarımız veya çeşitli akıllı cihazlarımız için karmaşık bir ortamda dinlemek istediğiniz sesi nasıl seçeceğiniz büyük bir sorundur.

Bu soruna yanıt olarak, bilim adamları analiz ve araştırma yapıyorlar. Geçtiğimiz 60 yılda bilim adamları kokteyl partisi problemi için birçok yöntem önerdiler. Bu üç farklı okul kabaca oluşturulabilir: sinyal işleme tabanlı yöntemler, kural tabanlı yöntemler ve ayrıştırma tabanlı yöntemler. Bununla birlikte, bu yöntemler, ilgili ideal varsayımları veya nispeten kararlı veri koşulları ile hala sınırlıdır. Hesaplama sistemi için, gerçekten daha karmaşık bir ortamda işitsel seçim için ideal etkiyi elde etmek hala zordur.

Neyse ki, teknolojinin gelişmesi ve veri birikimi ile birlikte, derin sinir ağı yöntemleri, kokteyl problemlerini çözme alanında yeteneklerini göstermeye başladı.

Kokteyl partisi problemi, yararlı sinyalleri rahatsız edici konuşma sinyalinden ayırmayı amaçlamaktadır.Bu süreç doğal olarak denetimli bir öğrenme problemi olarak ifade edilebilir. Mevcut denetimli öğrenmenin en güçlü yöntemi olan derin sinir ağları, gürültülü ham veri sinyallerinden ayırma hedeflerine (ideal maskeleme veya ilgi konusu konuşmanın genlik spektrumu gibi) bir haritalama işlevini öğrenmek için kullanılabilir.

Son zamanlarda, Çin Bilimler Akademisi Otomasyon Enstitüsü'nün işitsel modeli ve bilişsel hesaplama ekibi bu konuda yeni bir ilerleme kaydetti. Araştırmacılar, kokteyl partisi problemini "dikkat" in anahtarına ve başlangıç noktasına odaklayan bir işitsel dikkat seçimi modeli önerdiler.

İnternetten resim

Araştırmacılar, bu modelin sırasıyla "aktif dinleme" ve "pasif uyarım" olmak üzere iki görevi tamamlamasına izin verdiler. Görevi gerçekleştirme sürecinde, model birkaç hoparlörün ses izi özelliklerini kaydeder ve bu sesleri aynı frekans kanalı üzerinde karıştırır ve üst üste getirir. Öyleyse, makinenin bu özellikleri öğrenmeye ve çıkarmaya devam etmesine, zengin bilgi ve deneyim biriktirmesine ve makinenin bu bilgilere dayanarak kendi içinde "ilgilenen" sesleri tanımlamasına ve çıkarmasına izin verin.

İşitsel dikkat seçiminin şematik diyagramı. (A) Modelin genel çerçevesi; (b) Konuşmacının ses izi özelliklerini saklamak için kullanılan uzun süreli bellek biriminin yapısı.

Çince ve İngilizce olarak iki halka açık konuşma veri seti üzerinde yapılan karşılaştırmalı deneyler, bu işitsel dikkat seçme modelinin gürültülü çok konuşmacılı işitsel sahnelerde daha sağlam olduğunu göstermektedir.

Bu araştırma, gelecekte karmaşık ortamlarda konuşma ile ilgili çeşitli sorunların üstesinden gelmek için yeni bir kanal sağlar.

Yakın gelecekte gürültülü bir metroda, varış noktasını bildirdiğimiz sürece bilet satış makinesinde bilet alımını doğru ve hızlı bir şekilde tamamlayabileceğimizi hayal edin; yüksek TV sesi altında, akıllı robotu uzaktan kolayca yönlendirebiliriz. Sesle çalışın; gürültülü kalabalığın içinde cep telefonundaki sesli asistanı hala engelsiz kullanıyoruz ... Tüm heyecan verici ve heyecanlı "ses" operasyonları artık engelimiz olmayabilir.

Bu çalışmanın ayrıntıları için, lütfen "Orijinal metni okuyun" bölümüne bakın.

Sizi kırla aynı gün romantik bir düğün için "Maldivler" e götürmek ister misiniz?
önceki
İyi olmayanlar gelmeyecek, modern ve yeni Sonatı statik olarak deneyimleyecektir.
Sonraki
Kadınların statüsü sıralaması: Suudi Arabistan dünyada 141. sırada, Çin ise 99. sırada ...
Dongda Tıp Fakültesi Müdürü: Hobim avukat olmak
2019 Shanghai Auto Show: Zotye EZ500 resmi olarak piyasaya sürüldü
Barış-Longquanyi kamu güvenliği cephesinde kurtarma sicilini koruyan özverili figürler
Çörek otu yakalamak, böcek yemek, biber tatmak ve pirinç şarabı içmek, Çin'deki Miao Köyü'nde Fransızları takıntı haline getiren yaşam
Sonunda neden bu kadar çok yiyebileceğinizi bilen bilim adamları, kilo vermenin yeni bir yolunu geliştirdiler!
2019 Şangay Otomobil Fuarı: Toyota RHOMBUS açıklandı
Guoan'ın altı maçlık galibiyet serisi, şampiyon görünümünü gösteriyor! SIPG ruhunu kaybetti, Luneng geride kaldı ve Jingsui'nin hegemonya savaşı başladı mı?
Sanat filmi kolektifi "baharda" mı? Ama "çemberin dışına çıkmak" o kadar kolay değil
Chengdu Qingyang Bölgesi sel önleme ve kurtarma çalışmalarında iyi bir iş çıkarıyor
Hala spor salonunda demir mi pompalıyorsunuz? Sizin için daha güçlü yapay kaslar
2019 New York Otomobil Fuarı: Yeni AMG GLC63 S'nin dünya prömiyeri
To Top