İletişim dinamiklerinin aktif izlenmesi: grup seyrek Bayes öğrenme yöntemi

Leifeng.com AI teknolojisi yorum notu: Bu makalenin yazarı, Jilin Üniversitesi'nde doktora öğrencisi Pei Hongbin'dir. Bu makale, onun AAAI 2018'de yayınlanan makalesinin özel bir yorumudur ve izinsiz olarak yeniden basılamaz.

Salgın Dinamikleri Üzerindeki Aktif Gözetim İçin Grup Seyrek Bayes Öğrenimi

İletişim dinamiklerinin aktif izlenmesi: grup seyrek Bayes öğrenme yöntemi

https://arxiv.org/pdf/1712.00328.pdf

Pei Hongbin, Jilin Üniversitesi'nden Profesör Yang Bo'nun vesayeti altında Jilin Üniversitesi'nde üçüncü sınıf doktora adayıdır. Son araştırması, insan bulaşıcı hastalıkların izleme, tahmin ve kontrol sorunlarını çözmek için makine öğrenimi teknolojisini kullanmak ve halk sağlığı için yapay zeka desteği sağlamaktır. Hong Kong Baptist Üniversitesi'nden Profesör Liu Jiming ile işbirliği yaptı ve ilgili çalışmalar TPAMI 2017 ve AAAI 2018'de yayınlandı.

İletim fenomeni, hastalık iletimi ve bilgi yayılımı gibi gerçek dünyada yaygın olarak var olan bir tür dinamik süreçtir. Tahmin dinamikleri (salgın dinamikler) yayılmayı anlamak ve kontrol etmek için çok önemlidir. Dinamik sistem modeline dayalı olarak, öngörücü yayılma dinamikleri sezgisel olarak şu şekilde tanımlanabilir: Sistemin mevcut durumunu bilmek ve gelecekteki durumunu tahmin etmek. görülebilir, Tahminin temeli izleme yani sistemin mevcut durumunun zamanında toplanması ve raporlanmasıdır.

Pratik uygulamalarda, iletişim dinamiklerinin izlenmesi çok zordur, çünkü gerçek iletişim olgusu genellikle çok büyük bir zaman ve mekan aralığı içerir ve sınırlı insan ve malzeme kaynakları ve diğer izleme kaynakları geniş ölçekli bir izleme aralığını kapsayamaz. Örneğin, Yunnan Eyaleti, Tengchong Şehri, Myanmar'a ve kendi coğrafi çevresine olan yakınlığı nedeniyle, Çin'in önemli bir sıtma bölgesidir. 2005 ile 2011 yılları arasında toplam 7,835 sıtma hastası doğrulandı. Ancak, Tengchong Hastalık Kontrol ve Önleme Merkezi'nin (CDC) günlük vaka araştırmalarını yürüten yalnızca birkaç personeli var! Tengchong Şehri, 18 ilçe, 221 köy ve 658.207 sakiniyle 5.845 kilometrekarelik (Şangay'dan biraz daha küçük) bir alanı kaplamaktadır. Açıktır ki, sınırlı insan gücü, sıtmanın zamanında ve kapsamlı bir şekilde izlenmesi talebini karşılayamaz. Diğer iletişim izlemelerinde, sınırlı kaynakların zorlukları da yaygındır, örneğin hava kalitesi testi, İnternet kamuoyu bilgisi ve kentsel trafik izleme gibi.

Aktif gözetim, yukarıda belirtilen sınırlı kaynak problemini çözmek için uygun bir stratejidir: Dinamik sistemdeki birkaç anahtar düğümü seçin ve izleyin ve ardından tüm sistemin gelecekteki yayılma dinamiklerini tahmin etmek için bu düğümlerin bilgilerini kullanın. . Aktif izleme stratejisi, yalnızca sistemdeki birkaç anahtar düğüme dikkat eder, sınırlı izleme kaynaklarının kısıtlamalarını karşılayabilir ve yayılma dinamiklerini doğru bir şekilde tahmin edebilir, bu nedenle önemli pratik değere sahiptir. Aktif izlemeyi gerçekleştirmek için temel soru şudur: sistemdeki yayılma tahmini için en kritik düğümler nasıl değerlendirilir ve belirlenir? Bu problem çok zordur çünkü sistemin çeşitli kısımları arasındaki etkileşim yapısı oldukça heterojen ve gizlidir.

Mevcut sensör yerleştirme çalışması, çoğunlukla sistemdeki etkileşimli yapının bilindiğini varsayar, böylece anahtar düğüm tanımlama problemi, sınırlı bir aday sette bir kombinatoryal optimizasyon problemine dönüştürülür ve daha sonra, en büyük alt modül gibi, sezgisel algoritmalar bu sorunu çözmek için kullanılır. (Alt modüler maksimizasyon). Bununla birlikte, gerçek aktarım olaylarında, bu etkileşimli yapının (bazen yayılan ağ olarak adlandırılır), gizli popülasyon iletişim ağlarında yayılan bulaşıcı hastalıklar gibi gözlemlenmesi genellikle imkansızdır. Diğer bir yöntem de Gauss sürecini gözlemlenmemiş düğümlerin durumunu tahmin etmek için kullanmak ve tahmin için en önemli düğümleri belirlemek için aktif öğrenme stratejilerini (bilgi entropisi, karşılıklı bilgi gibi) kullanmaktır. Gauss süreci bir kara kutu modelidir ve yayılma mekanizması gibi önceki bilgilerin dahil edilmesi kolay değildir.Yani, Gauss sürecinin parametre öğrenmesi büyük miktarda eğitim verisine dayanır. Bununla birlikte, gerçek iletişim fenomenlerinin birikmiş tarihsel verileri genellikle çok sınırlıdır.

Bu makale aktif izleme çerçevesi

İlk olarak, iletişim dinamiklerinin tahmini için aktif bir izleme çerçevesi öneriyoruz. Bu genel çerçeve üç adıma bölünmüştür:

  • Adım 1: N ilgili düğümde yayılma dinamikleri verilerini toplayın.

  • Adım 2: Nöbetçi düğümlerin sayısının bütçe tarafından belirlendiği toplanan verilerden nöbetçi ağın çıkarılması.

  • Adım 3: Sentinel ağı ve k sentinelleri üzerindeki izleme verilerine dayanarak, tüm N düğümlerinin gelecekteki yayılma dinamiklerini tahmin edin.

Son iki adım, aktif izleme çerçevesinin anahtarıdır ve bunları daha sonra ayrıntılı olarak tanıtacağız.

Problem tanımı

N ilgi noktasında gözlemlenen T süresi yayılımını ve gözlem verilerini düşünün. D T matrisinin N ile çarpımıdır. D'deki öğeler sürekli gerçek sayılar (belirli bir alandaki hava kirleticilerinin konsantrasyonu gibi) veya ayrı değerler (bir yolun tıkalı olup olmadığı gibi) olabilir. İzleme verilerini k sentinel düğümlerinde temsil etmek için matris D'yi kullanın, yani bir düğüm bir nöbetçiyse, o zaman Ds karşı D Sütundaki öğeler aynıdır, aksi takdirde sütun sıfır vektördür. f ( Ds , S ) İzleme verilerini kullanma anlamına gelir Ds Yayılma dinamiklerini tahmin etmek için dinamik sistem işlevi, burada N x N matrisi S Sentinel matristir. Sentinel matrisi, diğer düğümler üzerindeki sentinel düğümlerin etkisini tanımlayan dinamik sistem işlevindeki bir dizi anahtar parametredir. Diğer bir deyişle, aktif izlemeyi gerçekleştirmenin anahtarı dinamik sistem fonksiyonu f ( Ds , S ). Sırasıyla yukarıdaki çerçevede son iki adımın hesaplama problemlerini resmi olarak tanımlıyoruz.

Bir gözcü tanımlama problemi: veriden nasıl okunur D Sentinel düğümleri tanımlayın ve nöbetçi ağı araştırın S ?

Soru 2: Sentinel tahmini: Sentinel düğümde toplanan verilere dayalı Ds , Nöbetçi ağ nasıl kullanılır S Tüm N düğümlerinin gelecekteki yayılma dinamiklerini tahmin ediyor musunuz?

Sentinel tanıma

Temel fikrimiz çok sezgiseldir: dinamik bir sistemde, diğer düğümler üzerinde etkisi olmayan düğümler önemli değildir; aksine, önemli düğümler diğer düğümler üzerinde önemli etkiye sahiptir ve tüm sistemin gelecekteki durumuna hakim olabilir, bu nedenle bu tür Düğüm, bir sentinel düğüm olarak seçilmelidir. Sentinel matrisine karşılık gelen S (S, sentinel düğümlerin diğer düğümler üzerindeki etkisini kodlar), sıralı seyrek yapıyı çıkararak bir düğümün kritik olup olmadığını belirleyebiliriz. Başka bir deyişle, önemsiz düğümler S'deki seyrek satırlara karşılık gelmelidir, yani satırlardaki çoğu öğe sıfırdır; önemli düğümler seyrek olmayan satırlara karşılık gelmelidir. Şekil 1, bu temel fikri örnek olarak doğrusal bir dinamik sistemle göstermektedir.

Bu fikre dayanarak, düğümlerin önemini değerlendirmek için yeni bir indeks, değeri öneriyoruz: sentinel matrisin hem önceki yapısında hem de arka yapısında önemli olan düğümler, öngörücü yayılma dinamikleri için anahtar düğümlerdir. Spesifik olarak, değeri, önceki sentinel matrisinde bir hiperparametre olarak tanımlanır ve bu aynı zamanda sentinel matrisin posterior yapısını da gösterir. Matematiksel tanım aşağıdaki gibidir,

Formül, i-inci düğümün değeridir. Daha sonra, bu göstergeyi a priori ve posterior perspektiflerden tanıtacağız.

Önsel bir bakış açısı

Temel fikirden başlayarak, sentinel ağın seyrek bir sıra yapısına sahip olmasını bekleriz, yani sıfır olmayan elemanlar sentinele karşılık gelen satırlarda yoğunlaşır. Bu nedenle, sentinel ağın önceliği olarak sıfır ortalamalı çok değişkenli Gauss dağılımını kullanıyoruz:

Yukarıdaki modelleme yoluyla, i'inci sıranın tüm öğeleri (yani, ağdaki i-düğümü tarafından yayılan kenarlar), ortak hiperparametre tarafından yakından bağlanır ve kontrol edilir. Verilerden çıkarılan bu tür hiperparametre, otomatik alaka düzeyi belirleme mekanizması olarak adlandırılır. İ'inci sıraya karşılık gelen küçük olduğunda, i düğümü tarafından yayılan kenar zayıflayacak ve i düğümü önemsiz bir düğüm olacaktır, bu nedenle atılmasının tahminin doğruluğu üzerinde fazla bir etkisi olmayacaktır.

Arka perspektif

Yukarıda bahsedildiği gibi, değeri ayrıca sentinel matrisin arka yapısını yansıtır. Sentinel matrisleri doğrusal sürekli sistemler ve mantıksal ayrık sistemlerde modelledik.Bu iki tür sistem, gerçek dünyadaki yayılma olaylarını tanımlamak için yaygın olarak kullanılmaktadır. İki sistemdeki modellemeye karşılık gelen grafik modelleri aşağıdaki şekilde gösterilmiştir.

Sentinel matrisi gizli bir değişken olarak ele alırsak, hiperparametreleri çözmek için beklenti maksimizasyonu EM algoritmasını ve varyasyonel yaklaşım yöntemini kullanıyoruz. çözüm formülünü analiz ettikten sonra, değerinin aslında düğümün kendisinin diğer düğümler üzerindeki etkisini ve etkisinin belirsizliğini tanımladığını bulduk. Gözcü setini en iyi tahminlerle taramak için geriye dönük bir seçim algoritması olan SNMA'yı öneriyoruz. Algoritma, tüm N ilgi düğümleriyle başlar ve her yinelemeden sonra bir düğümü, yalnızca k düğümü sentinel düğümler olarak kalana kadar (k sayısı bütçe tarafından belirlenir) atar. Her yinelemede atılan düğüm, en küçük değerine sahip düğümdür.

Sentinel tahmini

Sentinel matrisinin posterior yapısı SNMA algoritması ile elde edildiğinde, tüm sistemdeki N düğümlerinin yayılma dinamiklerini tahmin etmek için izleme verilerini (yani, yalnızca k sentinel düğümlerinde toplanan veriler) kullanabiliriz. Yeni bir izleme örneğini belirtmek için yıldız işaretini kullanın ve sistemin gelecekteki durumu aşağıdaki tahmini dağıtım ile verilebilir.

Deneysel sonuçlar

Yöntemi yapay sentetik veri setleri ve gerçek veri setleri üzerinde doğruladık. İki karşılaştırma algoritması kullanılır; karşılıklı bilgiye dayalı Gauss süreci (GPs-MI) ve grup kementi. GPs-MI, popüler bir sensör yerleştirme yöntemidir ve etkisi, A-, D- ve E-optimize tasarım gibi deneysel tasarım yöntemlerinden daha iyidir. Grup kementi, tasarladığımız Bayesian grup seyrek yöntemine benzer tipik bir grup seyrek öğrenme yöntemidir. Algoritmanın kendisi aktif izleme yeteneklerine sahip değildir, ancak önerdiğimiz aktif izleme çerçevesine yerleştirilebilir.

Algoritmanın etkisini ölçmek için başarısızlık oranını ve kök ortalama kare hatası RMSE'yi kullanıyoruz. Manuel veri deneylerinde, başarısızlık oranı, doğru sentinel düğümün bulunup bulunmadığını karakterize eder. RMSE, gözlemcinin tahmin sonuçları ile gerçek iletişim dinamikleri arasındaki hatayı ölçer. 5 kat çapraz doğrulama yöntemini benimsedik. Şekil 3'ten görülebileceği gibi yapay sentetik verilerde, ister doğrusal bir sürekli sistem ister mantıksal bir ayrık sistem olsun, önerdiğimiz SNMA algoritması en düşük hata oranına ve RMSE'ye sahiptir.

Gerçek veri deneyi

Deneysel doğrulama için ilk olarak 2009 Hong Kong H1N1 grip verilerini kullanıyoruz. Bu salgın Hong Kong'da 36.000 kişiyi enfekte etti, 290 kişi ağır hastalandı ve 80 kişi öldü. 1 Haziran 2009'dan 105 gün sonra influenza enfeksiyonu vakalarını inceledik. Hong Kong, 18 idari bölge içerir, bu nedenle Hong Kong, 18 düğümlü dinamik bir sistem olarak modellenmiştir. 2009 yılında H1N1 gribinin enfeksiyon süresi üç gün olduğundan, üç günlük toplama verilerine dayanarak N = 18 ve T = 35 grip dinamiklerini elde edebiliriz.

Yukarıdaki şekil, farklı algoritmaların sentinel tahmin sonuçlarını göstermektedir Yatay eksen, kullanılan sentinel düğümlerin sayısıdır ve dikey eksen, yayılmanın tahmin hatasıdır. Yöntemimiz SNMA, çoğu durumda en iyi tahmin sonuçlarına sahiptir. Aşağıdaki şekil, farklı algoritmaların tahmin eğrilerini daha sezgisel olarak göstermektedir.Farklı algoritmaların performansını karşılaştırmak için bir vaka çalışması olarak 8 sentinel durumunu seçiyoruz. Siyah yıldız, 2009'da Hong Kong'da H1N1 gribinin gerçek yayılımını gösteriyor. Üç yöntem için, modeli daha sonra yayılma dinamiklerini tahmin edecek şekilde eğitmek için 15 Ağustos'tan önceki verileri kullanırız.

2009'da H1N1'i tahmin etmek için SNMA algoritması tarafından seçilen en önemli 8 sentinel düğümün uzamsal dağılımı aşağıdaki şekilde gösterilmektedir. Kırmızı balon sentinel düğümü tanımlar, balonun altındaki kırmızı daire düğümün izleme önemini gösterir ve siyah nokta, izlenmesi gerekmeyen alandır. Sezgilerimize uygun olarak, nöbetçi düğümlerin çoğu yoğun nüfuslu Hong Kong Adası ve Kowloon bölgesinde yoğunlaşmıştır. Sai Kung ve çevresindeki adalar gibi uzak ve seyrek nüfuslu alanların da daha yüksek izleme önemine sahip olması ilginçtir.Bunun nedeni, H1N1 gribinin buradaki bulaşma modelinin Hong Kong Adası ve Kowloon'dan farklı olması olabilir.

Benzer şekilde, bu yöntemi Tengchong Şehrindeki 2005-2009 sıtma salgını verilerinde ve 2015 yılında Çinli bir çevrimiçi toplulukta bilgilerin yayılmasına ilişkin gerçek verilerde de doğruladık. Deneyler, önerilen SNMA yöntemimizin GPs-MI ve grup kementinden daha iyi olduğunu göstermektedir. SNMA algoritmasının temel avantajları şunlardır:

1. Algoritma model tabanlıdır, bu da ön bilginin entegre edilmesini kolaylaştırır ve eğitimi daha verimli hale getirir;

2. Bayes çerçevesi veri ve parametrelerdeki belirsizliği modellemek için kullanıldığından, algoritma yüksek gürültü ve yetersiz eğitim verisi problemleriyle etkili bir şekilde başa çıkabilir.

Referanslar

Hsieh, Hsun-Ping, Shou-De Lin, ve Yu Zheng. 2015. Kentsel büyük verilere dayalı olarak istasyon konumu önerisi için hava kalitesinin çıkarılması. 21. ACMSIGKDD Uluslararası Bilgi Keşfi ve Veri Madenciliği Konferansı Bildirilerinde. Sidney, Avustralya: ACM.

Yan Chen, Hadi Amiri, Zhoujun Li, ve Tat-Seng Chua. Mikro bloglardan kuruluşlar için ortaya çıkan konu tespiti. 36. Uluslararası ACM SIGIR Bilgi Erişiminde Araştırma ve Geliştirme Konferansı'nın İşlemleri. ACM, 2013.

Natali Ruchansky, Mark Crovella ve Evimaria Terzi Sorgularla matris tamamlama 21. ACMSIGKDD Uluslararası Bilgi Keşfi ve Veri Madenciliği Konferansı Bildirilerinde. ACM, 2015.

Bo Yang, Hongbin Pei, Hechang Chen, Jiming Liu ve Shang Xia.Sağlık hizmetleri için uzay-zamansal sosyal temas modellerini karakterize etme ve keşfetme. Model analizi ve makine zekası üzerine IEEEtransactions, 2017, 39 (8): 1532-1546.

MacKay DJC: Olası ağlar ve makul tahminler - denetimli sinir ağları için pratik Bayes yöntemlerinin bir incelemesi. Network, 1995, 6 (3): 469-505.

Andreas Krause, Ajit Singh ve Carlos Guestrin Gauss süreçlerinde optimal sensör yerleşimleri: Teori, verimli algoritmalar ve deneysel çalışmalar. Journal of Machine Learning Research, 9 (Şubat): 235284, 2008.

AI kalp ve sanat kıyafetlerini TV TCL'nin sıkıntı ve değişim yöntemine yerleştirin
önceki
Bu ilk ders yüz milyarlarca değerinde
Sonraki
Hem kavisli yüzey hem de yüksek yenileme hızı deneyimi Philips Mengteng 242M7 oyun monitörü
IFLYTEK Wu Xiaoru: Yapay Zeka, her çocuğun yeteneklerine göre öğretmesine olanak tanır
"Alpha: Homecoming with Wolf", tarihteki ilk köpeğin doğumunu ortaya çıkaran "prangalar" kavram haritasını yayınladı
Hibrit otomobil pazarında hangi otomobil şirketleri tüketiciler arasında daha popüler?
Lehman'ın çöküşünün onuncu yıldönümü, bundan sonraki risk noktası nerede?
"One Piece: Seeking the World" Boss Savaşı ve Açık Dünya Keşfi Demosu
Sınırlı yerel altın HyperX Cloud Alpha Gold oyun kulaklığı incelemesi
Simüle edilmiş robotların birden fazla resimle gökyüzüne karşı büyümesine tanık olun: Pekiştirmeli öğrenmede evrimsel stratejilerin uygulanması hakkında
Bu makale size zaman röleleri hakkında bilgi verir
Şangay'daki "Kod Çözme Oyunu" toplantısı Tomohisa Yamashita Çin'e veda etti, hayranlar daha fazla film çağrısında bulundu
Yeni planlanmış ekonomi mi yoksa yeni pazar ekonomisi mi? Örnek olarak "iyi bir araba satmak" ı ele alalım Qin Shuo röportajı
"Gerçekleştirin" Dell Teknoloji Grubu Dijital Geleceği Hayal Ediyor
To Top