Bu makale herkese açık hesaptandır " Bilimi eve götür "Sağlamak
Çocuklara en iyi fen eğitimini verin
Yazar Seven Jun
Okulları veya ana dalları seçmek gibi genellikle büyük kararlar aldığımızda, her zaman bu karşılaştırma nesnelerinin kabul oranı, istihdam oranı vb. Gibi sert göstergelerine başvururuz. Örneğin, hangi okulun istihdam oranı yüksekse, bu okula başvuracağız.
İstatistikler, bu karşılaştırma nesnelerinin artılarını ve eksilerini anlamamıza yardımcı olabilir ve akıllıca kararlar almamızı sağlayabilir. Sadece bireyler değil, şirketler ve ülkeler de böyle kararlar alıyor. Peki yapılacak doğru şey bu mu?
Onun ... aslında ... hayır ... doğru
Bugün çok baş ağrısına rağmen çok faydalı bir paradoks sunacağız: Size çoğu kez istatistiklerin oldukça güvenilmez olduğunu ve özellikle yanıltılmasının kolay olduğunu söyleyecektir.
Önce varsayımsal bir örneğe bakalım.
Xiaoming, kronik miyelojenöz lösemiyle doğdu ve uzun süredir kayıp olan erkek kardeşi, Xiaoming'in tıbbi tedaviyi seçmesi için A ve B Hastanesi olmak üzere 2 daha iyi hastane buldu.
Xiao Ming'in erkek kardeşi bu iki hastaneyi araştırdı ve topladı. Bunlar şöyle:
A Hastanesine yakın zamanda kabul edilen 1000 hastadan 900'ü hayatta ve 100'ü ölü.
Yakın zamanda B Hastanesine kabul edilen 1000 hastadan 800'ü hayatta ve 200'ü ölü.
İstatistiklerden habersiz sıradan insanlar için en mantıklı seçim Hastane A olmalı, doğru, hasta sağkalım oranı çok yüksek,% 90! B Hastanesi'ni seçmek imkansızdır. Hayatta kalma oranı sadece% 80'dir.
Ha ha, Xiao Ming'in seçimi Hastane A ise, o zaman mağlup edilecek.
Şu şekilde söyleyelim, A Hastanesine yeni başvuran 1000 hasta arasında 100 hastanın durumu ağır, 900 hastanın durumu ciddi değil.
100 ağır hasta arasında 30'u hayatta kaldı ve diğer 70'i öldü. Bu nedenle, Hastane A'daki ağır hastaların hayatta kalma oranı% 30'dur.
Ağır hasta olmayan 900 hastadan 870'i hayattaydı ve 30'u öldü. Bu nedenle A Hastanesi'nde ağır hasta olmayan hastaların sağkalım oranı% 96,7'dir.
Yakın zamanda B Hastanesine gelen 1000 hastadan 400'ü çok ağır hastaydı ve 210'u hayatta kaldı, bu nedenle B Hastanesinde ağır hasta olanların hayatta kalma oranı% 52,5'tir.
Ağır hasta olmayan 600 hasta var ve 590 kişi hayatta kalıyor, bu nedenle B Hastanesinde ağır hasta olmayan hastaların hayatta kalma oranı% 98,3.
Bir masaya çiz, işte bu ...
Hastane A:
Durum
ölüm
Hayatta kal
Toplam
Hayatta kalma oranı
ciddi
70
30
100
% 30
Önemli bir şey değil
30
870
900
% 96.7
Toplam
100
900
1000
% 90
B Hastanesi:
Durum
ölüm
Hayatta kal
Toplam
Hayatta kalma oranı
ciddi
190
210
400
% 52.5
Önemli bir şey değil
10
590
600
% 98.3
Toplam
200
800
1000
% 80
Gördüğünüz gibi, ciddi ve ciddi olmayan hastalar arasında ayrım yaptıktan sonra, nasıl bakarsanız bakın, en iyi seçim Hastane B'dir. Ancak genel sağkalım oranına bakıldığında Hastane A daha iyi bir seçimdir. Uzaktan Wang Feng denen, Bai Yansong daha yakından bakınca gerçek bu.
Bu çıldırtıcı. Ya gerçekten hastalanırsak ve bu tür benzer bir durumla tekrar karşılaşırsak, kendimizi çukura düşürmez miydik? Kore Cumhuriyeti'nde çok sayıda Xiaoming bu yüzden mi öldü? Burada neler oluyor?
Aslında, az önce gördüğümüz örnek, istatistikteki ünlü kara büyüden biri olan Simpson paradoksu. Simpson Paradoksu ilk olarak 1951'de İngiliz matematikçi Edward H. Simpson (Edward H. Simpson) tarafından keşfedildi.
Simpson'ın paradoksu, verileri parçalara ayırıp ona baktığınızda, ayrıntılar ve genel eğilim tamamen farklıdır.
Simpson'ın Paradoksu: Aynı veri kümesinde, genel eğilim gruplandırılmış eğilimden tamamen farklıdır.
Bir istatistikçinin bakış açısına göre, Simpson Paradoksunun nedeni, bu verilerde gizli bir şeytanın bulunmasıdır - pusuda yatan değişken Örneğin, yukarıdaki örnekte, gizli değişken, farklı hastalık şiddetine sahip hastadır. Sorumlu.
Simpson paradoksu, günlük yaşamda sonsuz bir şekilde ortaya çıkar.
Simpson'un paradoksunun en ünlü örneği, 1973'te Berkeley'deki California Üniversitesi'ndeki cinsiyet ayrımcılığı vakasıdır.
California Üniversitesi, Berkeley
Tablodan da görebileceğiniz gibi, yalnızca genel kabul oranına bakarsanız, o zaman erkekler için kabul oranı% 44 ve kızlar için bu% 35'tir.
Anlamazsanız, çoğu insan kesinlikle kızların ayrımcılığa uğradığı sonucuna varacaktır. Bu ünlü üniversiteye başvurmak isteyen kızlar böyle verileri görürlerse ciğerlerinin% 80'i havaya uçacak.
Erkek
Kızlar
Başvuranların sayısı
Kabul sayısı
Başvuranların sayısı
Kabul sayısı
Toplam
8442
% 44
4321
% 35
Endişelenmeyin, şimdi yukarıdaki verileri fakülteye göre bölün ve ardından her bölümün kabul oranına bakın.
Fakülte
Erkek
Kızlar
Başvuranların sayısı
Kabul oranı
Başvuranların sayısı
Kabul oranı
Bir
825
% 62
108
% 82
B
560
% 63
25
% 68
C
325
% 37
593
% 34
D
417
% 33
375
% 35
E
191
% 28
393
yirmi dört%
F
373
% 6
341
% 7
Gördüğünüz gibi, 6 fakültenin 4'ünde kızların kabul oranı erkeklerinkinden daha yüksek ve kızların sadece 2 fakültede dağılma olasılığı daha yüksek. Berkeley'deki California Üniversitesi'nde istatistik profesörü olan Peter Bickel, daha sonra, bu sınıflandırmaya uyarsanız, kızların kabul oranının aslında erkeklerden biraz daha yüksek olduğunu keşfetti.
Bickel, bu durumda Simpson paradoksunun kızların yüksek rekabet baskısı olan bölümlere (İngilizce bölümleri gibi) başvurmaya daha istekli olmaları, ancak erkeklerin girmesi nispeten kolay bölümlere (mühendislik gibi) başvurmaya daha istekli olduğuna inanıyor. Bölüm). Simpson Paradoksu gerçekten tuhaf.
Bir başka örnek, bu klasik Florida ölüm cezası paradoksudur.
1991'de, Colorado Üniversitesi'nde istatistikçi olan Michael L. Radelet ve Northeastern Üniversitesi Sosyoloji Enstitüsü müdürü Glenn Pierce, Florida'daki cinayet davasının 1976'dan 1987'ye kadar olan duruşma verilerini gözden geçirdi ve önemli adli adaletsizlikleri keşfettiler.
Birleştirilmiş verilere bakılırsa, Florida yargıçları yargılandıklarında beyazları tercih etmediler çünkü beyaz şüpheliler için ölüm cezası oranı siyahlara göre daha yüksek.
Şüpheli yarış
Ölüm cezası
Ölümsüzlük cezası
Ölüm cezası%
Beyazlar
53
430
11
Zenci
15
176
7,9
Ancak verileri kurbanın ırkına göre bölersek çok farklı sonuçlar göreceğiz - siyahların ölüm cezasına çarptırılma olasılığı beyazlara göre daha yüksek.
Kurban Yarışı
Şüpheli yarış
Ölüm cezası
Ölümsüzlük cezası
Ölüm cezası%
Beyazlar
Beyazlar
53
414
11.3
Beyazlar
Zenci
11
37
22.9
Zenci
Beyazlar
0
16
0
Zenci
Zenci
4
139
2.8
Şimdi, kurban hangi ırktan olursa olsun, siyahların ölüm cezasına çarptırılma olasılığının beyazlara göre daha yüksek olduğunu açıkça görebilirsiniz.
Bu sayılmaz. Gizli veriler, mağdur beyaz ise şüphelinin ölüm cezasına çarptırılma olasılığının daha yüksek olduğunu gösteriyor. Kurban siyah ise, şüphelinin ölüm cezasına çarptırılma olasılığı çok düşüktür. Irk ayrımcılığı açıktır.
Öyleyse, Simpson'ın paradoksundan nasıl kaçınabiliriz?
Cevap ... zor. Pek çok istatistikçi, Simpson paradoksunun varlığının, yalnızca istatistikleri kullanarak doğru nedensellik sonucunu çıkarmamızı imkansız kıldığına inanıyor.
Veriler çeşitli şekillerde sınıflandırılıp karşılaştırılabildiğinden, potansiyel değişkenler teoride sonsuzdur ve belirli bir sonuca ulaşmak için her zaman belirli bir potansiyel değişkeni kullanabilirsiniz.
Ve kötü niyetli olanlar için, başkalarını şaşırtmak veya manipüle etmek için verileri bölmek veya toplamak ve kendileri için faydalı bir indeks almak onlar için kolaydır. Tıp ve sosyoloji alanındaki araştırmacılar sıklıkla Simpson Paradoksuyla karşılaşır ve yanlış sonuçlar çıkarır.
Simpson Paradoksu, bu kadim felsefi masalın mükemmel bir örneğidir: "Bir ormana bir ağaç düşerse ve onu duyacak yakınlarda kimse yoksa, ses çıkarır mı?" Öyleyse istatistiklerin çıkardığı sonuçlar hala inandırıcı mı?
Yapabileceğimiz şey, çeşitli etkileyen faktörleri dikkatlice incelemek ve analiz etmek, soruna genel ve yüzeysel olarak bakmamaktır.
Ne, Simpson paradoksunu başkalarını manipüle etmek için kullanmanın bir örneğini vermemi mi istiyorsunuz?
Çok basit. Sık sık "Ben zeki çocuklar arasında en güzelim ve güzel çocuklar arasında en akıllıyım" diyen çocuklar genellikle _____ veya _____ değildir.
Bağımlılık yapmaz, lütfen dürt
Bilimi eve götür
ID: steamforkids
Çocuklara en iyi fen eğitimini verin
Yeniden yazdırmak için lütfen kids@huanqiukexue.com ile iletişime geçin
Bizi takip etmek için QR koduna uzun basın
Aksi belirtilmedikçe resimler internetten alınmıştır.
Orijinali korumak için referans malzemeler grafit içinde saklanır:
https://shimo.im/docs/oPcMnwi1M7QQQ3C5/