% 100 doğru seçmenizi söyleyin, sonuç doğru mu?

Her gün çeşitli seçeneklerle karşı karşıyayız. Sabahları çalar saat çalıyor. Hemen kalkmayı ya da beş dakika daha uyumayı seçmemiz gerekiyor. Uyandıktan sonra kahvaltıyı evde mi yemeyi yoksa dışarı çıkıp kahvaltı etmeyi mi seçmemiz gerekiyor. Dışarı çıktıktan sonra işe mi yoksa metroya mı bineceğimizi seçmemiz gerekiyor. Bunlar sadece günlük önemsiz konulardır, ancak istatistikçilerin gözünde bu seçimler daha derin bilgiler içerebilir.

Model seçimi, istatistikte temel bir sorundur. Model seçimi nedir?

Model seçimi, doğa bilimleri ve sosyal bilimlerin çeşitli alanlarında yaygın olarak kullanılmaktadır. Makul varsayımlardan sonra oluşturulan bazı istatistiksel modeller karşılaştırmalı modeller olarak adlandırılır ve tüm karşılaştırmalı modeller model uzayını oluşturur. Basit bir ifadeyle, model seçimi, verilerle en iyi eşleşen istatistiksel modeli seçmek için model alanındaki her bir modeli kullanarak gözlem verilerinin analiz edilmesi sürecidir. Bayes istatistiği, istatistikte çok önemli bir yöntemdir. Modelin posterior olasılığını hesaplayarak modelleri karşılaştırır. Sözde arka olasılık, sonuçlardan olası nedenleri aramaktır.Örneğin, bir yudum kırmızı hünnap lapası içtikten sonra, yulaf lapasının tatlılığına göre, yulaf lapasının içinde şeker bulunmaması olasılığını değerlendiriyoruz. Bayes istatistiklerinde, modelin son olasılığı, modele olan güvenimizi yansıtan rastgele bir değişkendir.

Gerçek model çoklu karşılaştırma modellerinden biri olduğunda, Bayes model seçimi her zaman gerçek modele yakınlaşabilir. Veri miktarı arttıkça, doğru modelin arka olasılığı% 100'e çıkma eğiliminde olacaktır, yani bu modele olan güven derecesi artmaktadır. Buna istatistiksel olarak tutarlılık denir.

Ancak karşılaştırma modeli tamamen yanlışsa, Bayes yöntemini kullanmanın sonucu ne olacaktır? ? Bunun için aslında bilim adamları çok net değil.

Bu nedenle, Bayes model seçiminin asimptotik davranışını inceliyoruz. Karşılaştırma modelinin aynı yanlış veya aynı doğru olduğu durumlara odaklanıyoruz. Örneğin, bir bozuk para tek tip ise, yazı tura atıldığında tura gelme olasılığı% 50'dir. İki karşılaştırma modelinin% 40'lık bir head-up olasılığı ve% 60'lık bir head-up olasılığı varsa, bu iki model eşit derecede yanlıştır.

Model parametreler içerebilir.Parametreleri optimize ettikten sonra, model doğru modele en yakın olanıdır.Bu zamandaki parametrelere optimal parametreler ve modele optimal model denir. Örneğin, yetişkin erkeklerin belli bir bölgedeki boyu normal dağılıma N (1.75, 0.04) uymaktadır. İki karşılaştırma modeli N (, 0,04), 1,75 ve N (, 0,04), 1,75 ise, ortalama yükseklik parametresi 1,75'in gerçek değerini aldığında, model en uygun modeldir. Karşılaştırma modellerinin optimal modeli aynı ve doğrudur. İki karşılaştırma modeli N (, 0,06), 1,75 ve N (, 0,06), 1,75 ise ve ortalama yükseklik parametresi = 1,75 olduğunda, optimal modele ulaşılır, iki modelin optimal modeli Aynıdır, ancak doğru model değildir çünkü varyans gerçek varyanstan daha büyüktür.

Karşılaştırma modellerinin avantajları ve dezavantajları arasında bir fark olmadığında, model seçiminin daha "aklı başında" bir davranış göstermesini, yani k modellerinin arka olasılığının 1 / k olmasını bekliyoruz. Ne yazık ki, çalışmanın sonuçları durum böyle değil.

Bayesçi model seçim problemini, her biri farklı aşırı davranışlar sergileyen üç kategoriye ayırıyoruz. İlk soru türü, esasen aynı olan iki modeli karşılaştırmaktır Bu tür soruların çok az araştırma değeri vardır.

İkinci problem türü, iki durumu aynı doğruluk veya aynı hata ve aynı optimal modelle karşılaştırmaktır. Bu durumda, modelin arka olasılığı dejenere olmayan bir dağılıma yakınsar. Bu dağılımdan alınan örnekler her seferinde farklıdır, yani sonuçlar dalgalanmaktadır.

Şekil 1 Bayes model seçim davranışının sınıflandırılması

Üçüncü tip problem ise iki durumu aynı hata ve farklı limit modelleriyle karşılaştırmaktır.Bu durum bizim en büyük endişemiz, çünkü bir anlamda gerçek dünya modeli her zaman yanlıştır. Bu durumda, Bayesian model seçimi son derece "irrasyonel" bir davranış sergiler: rastgele oluşturulmuş veriler kullanılırken, bazı veriler çok yüksek posterior olasılığa sahip belirli bir modeli desteklerken, modellerin geri kalanı posteriordur. Olasılık 0 eğilimindedir; diğer verilerde, diğer model son derece yüksek posterior olasılıkla desteklenmektedir. Bu durum bizim beklenen "aklı başında" davranışımızdan uzaktır.

Böyle bir örneğe bakabiliriz: Gerçek dünyanın gri olduğunu varsayarsak, bir azize dünyanın beyaz mı yoksa siyah mı olduğunu sorarız. Dikkatli bir değerlendirmeden sonra, dünyanın% 100 siyah olduğunu söyledi. Ama bir dahaki sefere aynı soruyu sorduğumda verdiği cevap dünyanın% 100 beyaz olduğuydu. Böyle bir davranış kafa karıştırıcıdır.

Bayes tarafından seçilen bu "aşırı güven" bilim adamlarının ilgisini çekti. Birkaç gün önce, Çin Bilimler Akademisi Matematik ve Sistem Bilimi Enstitüsü ve Londra Üniversitesi'nden araştırmacılar tarafından PANS'ta yayınlanan bir araştırma, Bayes model seçiminin patolojik asimptotik davranışının Bayes yöntemlerini kullanırken yanlış evrim ağaçlarından kaynaklanabileceğini buldu. Posterior destek oranının 1'e yakın olmasının temel nedeni.

Bu araştırmanın çıkış noktası moleküler sistematiğidir. Moleküler sistematiği, türler arasındaki soyağacı ilişkilerini ortaya çıkarmak için moleküler verileri (genomik veriler) kullanan bir disiplindir.Bu soy ağacı ilişkisi evrim ağaçları tarafından tanımlanmaktadır. Bayes yöntemini kullanırken, her evrim ağacı bir karşılaştırma modeline karşılık gelir. Aşağıdaki şekildeki ağaç T0 doğru modeldir, T1, T2 ve T3 üç özdeş doğru veya yanlış karşılaştırma modelidir.Doğruluk, evrimsel modelle ilişkili dal uzunluğu parametresinin (t) maksimum olasılık tahminine bağlıdır. .

Şekil 2 Üç türe (A) sahip köklü ağaçlar ve dört türe (B) ait köksüz ağaçlar

Şekil 3, sıra uzunlukları 103 ve 105 olduğunda elde edilen üç ikili ağacın arka yoğunluk fonksiyonlarını göstermektedir. Şekildeki üçgenin üç köşesi sırasıyla üç modelin (1, 0, 0), (0, 1, 0) ve (0, 0, 1) son olasılıklarını temsil eder Üçgenin merkezi, üç modelin arka olasılığına karşılık gelir. Test olasılığı (1/3, 1/3, 1/3). Kırmızı, yüksek bir değeri, sarı, düşük bir değeri temsil eder ve gri kısım, 0 değerine sahiptir. Üçgenin merkezi kısmı, araştırmacıların beklediği "mantıklı" davranıştır.

Şekil 3 Üç ikili ağacın ortak arka dağılımı

A ve A 'Şekil 2 (A)' daki üç türün köklü ağaçlarını karşılaştırmalı modeller olarak kullanırken, gerçek model yıldız şekilli bir ağaçtır. Üç ikili ağacın iç dal uzunluğu t0, 0 olan maksimum olasılık tahminini aldığında, üç ikili ağaç aynı doğru modele karşılık gelir.

B ve B ', simülasyon ve analizde kullanılan modellerin farklı olması dışında A ve A' ya benzer. Bu zamanda, iç dal uzunluğunun maksimum olasılık tahmini t00'dır, ancak t1'in maksimum olasılık tahmini t'ye eşit değildir Bu durumda, üç ikili ağaç aynı hataya karşılık gelir ve sınır modeli eşittir. Her iki durumda da arka dağılımın dejenere olmadığı görülebilir.

C ve C ', karşılaştırma modeli olarak Şekil 2 (B)' deki üç köksüz ağacı kullanır. Gerçek model, dört türe sahip yıldız şekilli bir ağaçtır. Üç karşılaştırma modelinde, iç dal uzunluğunun t0 maksimum olasılık tahmini 0 değildir. Bu durumda, üç ikili ağaç aynı hataya karşılık gelir ve optimal modeller eşit değildir. Şu anda, Bayes model seçimi aşırı "irrasyonel" davranış gösterdi ve arka yoğunluk yalnızca üç köşede yoğunlaştı.

Bu araştırmadan önce, bazı bilim adamları Bayes modelinin seçim davranışını belirleyen olası faktörlerin model parametrelerinin sayısı ve limit modelinin doğru olup olmadığı olduğuna inanıyorlardı. Ancak bu çalışmanın sonuçları bunların belirleyici olmadığını göstermektedir Belirleyici faktör, karşılaştırma modelinin optimal modelinin aynı olup olmadığıdır (sınır modelinin doğru olup olmadığına bakılmaksızın).

Aynı zamanda araştırmacılar, Bayes model seçiminin bir baş ağrısı olduğunu da keşfettiler. Karşılaştırmalı modeller arasında küçük bir fark olduğunda ve veri miktarı sonsuza eğilimli olduğunda, teorik olarak daha doğru modelin arka olasılığı 1'e yakınsamalıdır. Ancak veri miktarı çok büyük (ancak sınırlı) olsa bile, daha yanlış bir modelin büyük bir posterior olasılık elde etme olasılığı hala vardır.

Önceki çalışmalarda, evrimci biyologlar, evrim ağacını tahmin etmek için Bayes model seçim yöntemini kullanırken, evrim ağacı doğru olsun ya da olmasın, arka olasılığın her zaman% 100 veya 0 olduğunu defalarca gözlemlediler. Bu çalışmanın araştırma sonuçları, bu fenomen için bir açıklama sağlar.

Bayes model seçimi bilimin çeşitli alanlarında yaygın olarak kullanılmaktadır. Teorik olarak, Bayes model seçim yönteminin tutarlılığı nedeniyle iyi bir yöntemdir. Bu aşırı davranış, karşılaştırma için kullanılan modelin doğru modeli içermemesi nedeniyle oluşur; bu, bu aşırı davranışın sistem hatası yerine kullanıcı hatasından kaynaklandığı anlamına gelir. Ancak ister Bayesci yöntem ister Bayes olmayan yöntem olsun, bu tür araştırma sonuçlarının farklı test modellerinin uygulanmasının değerlendirilmesindeki felsefi önemi daha fazla araştırmaya ihtiyaç duyar.

Kapanıyor! "Baba" denen bu Hintli amcayı 700'den fazla kız takip etti!
önceki
İlk kez 3.0 dizel motor + 48V ile yeni Audi S5'in resmi görüntüsü
Sonraki
"Yağmur bağımlılığı" denen yaygın bir "hastalık" var, siz misiniz?
2019 New York Otomobil Fuarı: Cadillac CT5 Dünya Prömiyeri
Forbes'a 19 yaşında aday gösterilen, evli olmayan ve 20 yaşında hamile olan bu dudak büyütme kızı harika!
2019 Şangay Otomobil Fuarı: Zotye ES330 konsept otomobili tanıtıldı
Chengdu, ünlü bir internet şehrinin AB tarafı
5 yaşında bir köpek para biriktirebilir ve parayı yönetebilir mi? ! İnsanlar köpekler kadar iyi değil ...
Cep Telefonu · Yeni Telefon Samsung Galaxy A serisi, 2499 yuan'dan başlayan fiyatlarla Changsha'da
19'da yayınlanan ilk C-NCAP sonuçları grubu: beş yıldızlı olmayan arabalar bile var
Mutlu yıllar Efendi Malfoy! Sarışın çocuk olgun yakışıklı amca karşı saldırıya geçti
Wu Yifan büyük bir kase erişte getirdi, Messi de futbolda malların kralı olan kırmızı mate çayı getirdi?
530 milyon yıl öncesine ait bir "çikolata topunuz" var, lütfen kontrol edin!
Çiçek kollu yakışıklı bir keşiş, 27 yıldır uyuşturucu satıcısı, sırf çocukları için bir cennet parçası dikmek için
To Top