Dünya çapında 300 milyondan fazla insan depresyondan muzdarip. % 60'ı herhangi bir tedavi görmedi.
Depresyondan muzdarip, hatta intihar eden ünlüler hakkında haberler duyduk, ancak çevremizdeki bazı sıradan insanların hasta olduğunu ve hasta olmadığını bilmiyoruz.
AI bu hastalıkla yüzleşmek için ne yapabilir?
Bir zamanlar "AI'nın sınırları yoktur ve AI'nın refahının sınırları yoktur" diyen öğretmen Li Feifei, depresyondan muzdarip olduklarından şüphelenenler için refah yaratacak. Bu sefer, kendisi ve ekibi depresyonun AI teşhisi yönünü hedefledi:
Birleştirmek Konuşma tanıma , Bilgisayar görüşü ile Doğal dil işleme İfadeler ve dil aracılığıyla teknoloji Bir kişinin depresyonu olup olmadığını teşhis edin .
Şu anda, bu araştırma ilk sonuçlara ulaştı ve depresyonu teşhis etmek için makine öğrenimi modeli şu anda doğru % 83.3 , Geri çağırmaya ulaşıldı % 82.6 .
Dahası, bu model cep telefonlarına yerleştirilebilir, böylece daha fazla insan depresyonu kolayca teşhis edebilir ve artık "parasızlık", "zaman yok" ve "depresyonu kontrol etmeye gittiğimi bildiklerinde başkaları benim hakkımda nasıl konuşacak?" Engelde.
Ayrıca, bu araştırmanın sonuçları NIPS NeurIPS 2018 Medikal ve Sağlık Makine Öğrenimi (ML4H) Çalıştayı'na seçildi.
Aşağıda qubit, Li Feifei'nin yeni çalışmasının belirli içeriğini ayrıntılı olarak tanıtıyor.
Çünkü doktorun yaptığı bu.
Mevcut depresyon teşhisi sürecinde, doktorların, kişinin hasta olup olmadığını belirlemek için hasta ile yüz yüze sohbet etmesi gerekmektedir.
Bir doktorun gözlemlemesini gerektiren unsurlar şunları içerir:
Karşı tarafın üslubunun bekar olup olmadığı ve hiç kuşatılmış olup olmadığı;
Konuşma sesinin nispeten düşük olup olmadığı;
Normal insanlardan daha az hareket var mı?
Her zaman aşağıya bakmayı sever misin;
...
Ek olarak, geçmeniz gerekiyor Hasta Sağlığı Anketi (PHQ, Hasta Sağlığı Anketi) daha detaylı bilgi için araştırmak.
Depresyonu teşhis etmek için yapay zekayı kullanmak, hastayla konuşan doktorun yerini alacak bir makine öğrenimi modeli kullanmaya, doktorun önündeki hastanın performansını verilere dönüştürmeye ve bunu makine öğrenimi modeline girmeye eşdeğerdir.
Bu nedenle, Li Feifeinin ekibinin benimsediği çözüm, önce modele girmektir. 3D yüz kilit noktası videosu , Hastanın konuşma sesi ile Görüşme kayıtları metne dönüştürüldü Üç veri türü, aşağıdaki şekilde üç abc satırına karşılık gelir.
Bundan sonra, kişinin depresyonu olup olmadığını belirlemek için PHQ puanını veya depresyon sınıflandırma etiketini çıkarın.
Bu modeli eğitmek için kullanılan şey DAIC-WOZ veri seti 142 hastanın PHQ puanları ve 189 klinik görüşme dahil olmak üzere toplam 50 saatlik veri.
Modelin tamamı iki bölümden oluşmaktadır.
İlk bölüm denir Cümle düzeyinde yerleştirme (Cümle Düzeyinde Gömmeler).
Sadece birkaç yüz milisaniyeyi yakalayabilen bir hece veya kelime yerleştirmek için kullanılan önceki gömme yöntemleri. Li Feifeinin ekibi tüm cümlenin çok modlu yerleştirilmesini kullanıyor ve bu da ses, görsel ve dil öğelerini daha uzun süre yakalayabiliyor.
Aşağıdaki şekil, çok modlu cümle düzeyinde yerleştirmenin bir örneğidir:
İkinci bölüm denir Nedensel Evrişimli Ağ (C-CNN, Nedensel Evrişimli Ağlar).
Nedensel evrişimli ağların kullanılmasının nedeni, depresyonlu insanların yavaş konuşmasıdır.
Sıradan insanlarla karşılaştırıldığında, depresyon hastaları konuşurken farklı kelimeler arasında daha uzun süre dururlar, bu nedenle tüm cümlenin sesi ve görüntüsü daha uzundur. Bu kadar uzun cümlelerle uğraşırken, nedensel evrişimli ağ RNN'den daha güçlüdür.
Deneysel sonuçlara bir göz atalım.
Bunlar arasında, A, giriş verilerinin ses olduğu, V giriş verilerinin video olduğu ve L, giriş verilerinin metin olduğu anlamına gelir.
Önceki deneysel sonuçlarla karşılaştırıldığında, Li Feifei'nin yeni araştırması nispeten yüksek verilere sahip. Bununla birlikte, öncekilerden farklı olarak, bu yeni çalışma önceden yapılmış bazı görüşme kayıtlarına dayanmamaktadır, bu nedenle daha az arka plan bilgisi vardır. Dahası, bu yeni araştırma, özellik mühendisliği gerektirmez ve girdi ham verilerini doğrudan kullanabilir.
Bu deneysel sonuçlar tablosu, farklı gömme yöntemleri kullanmanın sonuçlarını karşılaştırmaktadır. Bunlar arasında, ilk iki satır manuel gömme, 3. ila 6. satırlar eğitim öncesi gömmeler ve son iki satır da kullandığımız cümle düzeyinde gömmelerdir.Giriş log-mel spektrogram, 3D yüz tuş noktası videosu ve Word2Vecs dizisidir.
kağıt:
Konuşulan Dil ve 3B Yüz İfadelerinden Depresyon Belirti Şiddetinin Ölçülmesi
Albert Haque, Michelle Guo, Adam S Madenci, Li Fei-Fei
https://arxiv.org/abs/1811.08592
- Bitiş -
Samimi işe alım
Qubit, editörleri / muhabirleri işe alıyor ve merkezi Pekin, Zhongguancun'da bulunuyor. Yetenekli ve hevesli öğrencilerin bize katılmasını dört gözle bekliyoruz! İlgili ayrıntılar için lütfen QbitAI diyalog arayüzünde "işe alım" kelimesini yanıtlayın.
Qubit QbitAI · Toutiao İmzalayan Yazar
' ' Yapay zeka teknolojisi ve ürünlerindeki yeni eğilimleri takip edin