Bu meşhur istatistiksel paradoks, onu ilk duyan insanlar muhtemelen hayattan şüphe edecek

Bu makale herkese açık hesaptandır " Bilimi eve götür "Sağlamak

Çocuklara en iyi fen eğitimini verin

Yazar Seven Jun

Okulları veya ana dalları seçmek gibi genellikle büyük kararlar aldığımızda, her zaman bu karşılaştırma nesnelerinin kabul oranı, istihdam oranı vb. Gibi sert göstergelerine başvururuz. Örneğin, hangi okulun istihdam oranı yüksekse, bu okula başvuracağız.

İstatistikler, bu karşılaştırma nesnelerinin artılarını ve eksilerini anlamamıza yardımcı olabilir ve akıllıca kararlar almamızı sağlayabilir. Sadece bireyler değil, şirketler ve ülkeler de böyle kararlar alıyor. Peki yapılacak doğru şey bu mu?

Onun ... aslında ... hayır ... doğru

Bugün çok baş ağrısına rağmen çok faydalı bir paradoks sunacağız: Size çoğu kez istatistiklerin oldukça güvenilmez olduğunu ve özellikle yanıltılmasının kolay olduğunu söyleyecektir.

Önce varsayımsal bir örneğe bakalım.

Xiaoming, kronik miyelojenöz lösemiyle doğdu ve uzun süredir kayıp olan erkek kardeşi, Xiaoming'in tıbbi tedaviyi seçmesi için A ve B Hastanesi olmak üzere 2 daha iyi hastane buldu.

Xiao Ming'in erkek kardeşi bu iki hastaneyi araştırdı ve topladı. Bunlar şöyle:

A Hastanesine yakın zamanda kabul edilen 1000 hastadan 900'ü hayatta ve 100'ü ölü.

Yakın zamanda B Hastanesine kabul edilen 1000 hastadan 800'ü hayatta ve 200'ü ölü.

İstatistiklerden habersiz sıradan insanlar için en mantıklı seçim Hastane A olmalı, doğru, hasta sağkalım oranı çok yüksek,% 90! B Hastanesi'ni seçmek imkansızdır. Hayatta kalma oranı sadece% 80'dir.

Ha ha, Xiao Ming'in seçimi Hastane A ise, o zaman mağlup edilecek.

Şu şekilde söyleyelim, A Hastanesine yeni başvuran 1000 hasta arasında 100 hastanın durumu ağır, 900 hastanın durumu ciddi değil.

100 ağır hasta arasında 30'u hayatta kaldı ve diğer 70'i öldü. Bu nedenle, Hastane A'daki ağır hastaların hayatta kalma oranı% 30'dur.

Ağır hasta olmayan 900 hastadan 870'i hayattaydı ve 30'u öldü. Bu nedenle A Hastanesi'nde ağır hasta olmayan hastaların sağkalım oranı% 96,7'dir.

Yakın zamanda B Hastanesine gelen 1000 hastadan 400'ü çok ağır hastaydı ve 210'u hayatta kaldı, bu nedenle B Hastanesinde ağır hasta olanların hayatta kalma oranı% 52,5'tir.

Ağır hasta olmayan 600 hasta var ve 590 kişi hayatta kalıyor, bu nedenle B Hastanesinde ağır hasta olmayan hastaların hayatta kalma oranı% 98,3.

Bir masaya çiz, işte bu ...

Hastane A:

Durum

ölüm

Hayatta kal

Toplam

Hayatta kalma oranı

ciddi

70

30

100

% 30

Önemli bir şey değil

30

870

900

% 96.7

Toplam

100

900

1000

% 90

B Hastanesi:

Durum

ölüm

Hayatta kal

Toplam

Hayatta kalma oranı

ciddi

190

210

400

% 52.5

Önemli bir şey değil

10

590

600

% 98.3

Toplam

200

800

1000

% 80

Gördüğünüz gibi, ciddi ve ciddi olmayan hastalar arasında ayrım yaptıktan sonra, nasıl bakarsanız bakın, en iyi seçim Hastane B'dir. Ancak genel sağkalım oranına bakıldığında Hastane A daha iyi bir seçimdir. Uzaktan Wang Feng denen, Bai Yansong daha yakından bakınca gerçek bu.

Bu çıldırtıcı. Ya gerçekten hastalanırsak ve bu tür benzer bir durumla tekrar karşılaşırsak, kendimizi çukura düşürmez miydik? Kore Cumhuriyeti'nde çok sayıda Xiaoming bu yüzden mi öldü? Burada neler oluyor?

Aslında, az önce gördüğümüz örnek, istatistikteki ünlü kara büyüden biri olan Simpson paradoksu. Simpson Paradoksu ilk olarak 1951'de İngiliz matematikçi Edward H. Simpson (Edward H. Simpson) tarafından keşfedildi.

Simpson'ın paradoksu, verileri parçalara ayırıp ona baktığınızda, ayrıntılar ve genel eğilim tamamen farklıdır.

Simpson'ın Paradoksu: Aynı veri kümesinde, genel eğilim gruplandırılmış eğilimden tamamen farklıdır.

Bir istatistikçinin bakış açısına göre, Simpson Paradoksunun nedeni, bu verilerde gizli bir şeytanın bulunmasıdır - pusuda yatan değişken Örneğin, yukarıdaki örnekte, gizli değişken, farklı hastalık şiddetine sahip hastadır. Sorumlu.

Simpson paradoksu, günlük yaşamda sonsuz bir şekilde ortaya çıkar.

Simpson'un paradoksunun en ünlü örneği, 1973'te Berkeley'deki California Üniversitesi'ndeki cinsiyet ayrımcılığı vakasıdır.

California Üniversitesi, Berkeley

Tablodan da görebileceğiniz gibi, yalnızca genel kabul oranına bakarsanız, o zaman erkekler için kabul oranı% 44 ve kızlar için bu% 35'tir.

Anlamazsanız, çoğu insan kesinlikle kızların ayrımcılığa uğradığı sonucuna varacaktır. Bu ünlü üniversiteye başvurmak isteyen kızlar böyle verileri görürlerse ciğerlerinin% 80'i havaya uçacak.

Erkek

Kızlar

Başvuranların sayısı

Kabul sayısı

Başvuranların sayısı

Kabul sayısı

Toplam

8442

% 44

4321

% 35

Endişelenmeyin, şimdi yukarıdaki verileri fakülteye göre bölün ve ardından her bölümün kabul oranına bakın.

Fakülte

Erkek

Kızlar

Başvuranların sayısı

Kabul oranı

Başvuranların sayısı

Kabul oranı

Bir

825

% 62

108

% 82

B

560

% 63

25

% 68

C

325

% 37

593

% 34

D

417

% 33

375

% 35

E

191

% 28

393

yirmi dört%

F

373

% 6

341

% 7

Gördüğünüz gibi, 6 fakültenin 4'ünde kızların kabul oranı erkeklerinkinden daha yüksek ve kızların sadece 2 fakültede dağılma olasılığı daha yüksek. Berkeley'deki California Üniversitesi'nde istatistik profesörü olan Peter Bickel, daha sonra, bu sınıflandırmaya uyarsanız, kızların kabul oranının aslında erkeklerden biraz daha yüksek olduğunu keşfetti.

Bickel, bu durumda Simpson paradoksunun kızların yüksek rekabet baskısı olan bölümlere (İngilizce bölümleri gibi) başvurmaya daha istekli olmaları, ancak erkeklerin girmesi nispeten kolay bölümlere (mühendislik gibi) başvurmaya daha istekli olduğuna inanıyor. Bölüm). Simpson Paradoksu gerçekten tuhaf.

Bir başka örnek, bu klasik Florida ölüm cezası paradoksudur.

1991'de, Colorado Üniversitesi'nde istatistikçi olan Michael L. Radelet ve Northeastern Üniversitesi Sosyoloji Enstitüsü müdürü Glenn Pierce, Florida'daki cinayet davasının 1976'dan 1987'ye kadar olan duruşma verilerini gözden geçirdi ve önemli adli adaletsizlikleri keşfettiler.

Birleştirilmiş verilere bakılırsa, Florida yargıçları yargılandıklarında beyazları tercih etmediler çünkü beyaz şüpheliler için ölüm cezası oranı siyahlara göre daha yüksek.

Şüpheli yarış

Ölüm cezası

Ölümsüzlük cezası

Ölüm cezası%

Beyazlar

53

430

11

Zenci

15

176

7,9

Ancak verileri kurbanın ırkına göre bölersek çok farklı sonuçlar göreceğiz - siyahların ölüm cezasına çarptırılma olasılığı beyazlara göre daha yüksek.

Kurban Yarışı

Şüpheli yarış

Ölüm cezası

Ölümsüzlük cezası

Ölüm cezası%

Beyazlar

Beyazlar

53

414

11.3

Beyazlar

Zenci

11

37

22.9

Zenci

Beyazlar

0

16

0

Zenci

Zenci

4

139

2.8

Şimdi, kurban hangi ırktan olursa olsun, siyahların ölüm cezasına çarptırılma olasılığının beyazlara göre daha yüksek olduğunu açıkça görebilirsiniz.

Bu sayılmaz. Gizli veriler, mağdur beyaz ise şüphelinin ölüm cezasına çarptırılma olasılığının daha yüksek olduğunu gösteriyor. Kurban siyah ise, şüphelinin ölüm cezasına çarptırılma olasılığı çok düşüktür. Irk ayrımcılığı açıktır.

Öyleyse, Simpson'ın paradoksundan nasıl kaçınabiliriz?

Cevap ... zor. Pek çok istatistikçi, Simpson paradoksunun varlığının, yalnızca istatistikleri kullanarak doğru nedensellik sonucunu çıkarmamızı imkansız kıldığına inanıyor.

Veriler çeşitli şekillerde sınıflandırılıp karşılaştırılabildiğinden, potansiyel değişkenler teoride sonsuzdur ve belirli bir sonuca ulaşmak için her zaman belirli bir potansiyel değişkeni kullanabilirsiniz.

Ve kötü niyetli olanlar için, başkalarını şaşırtmak veya manipüle etmek için verileri bölmek veya toplamak ve kendileri için faydalı bir indeks almak onlar için kolaydır. Tıp ve sosyoloji alanındaki araştırmacılar sıklıkla Simpson Paradoksuyla karşılaşır ve yanlış sonuçlar çıkarır.

Simpson Paradoksu, bu kadim felsefi masalın mükemmel bir örneğidir: "Bir ormana bir ağaç düşerse ve onu duyacak yakınlarda kimse yoksa, ses çıkarır mı?" Öyleyse istatistiklerin çıkardığı sonuçlar hala inandırıcı mı?

Yapabileceğimiz şey, çeşitli etkileyen faktörleri dikkatlice incelemek ve analiz etmek, soruna genel ve yüzeysel olarak bakmamaktır.

Ne, Simpson paradoksunu başkalarını manipüle etmek için kullanmanın bir örneğini vermemi mi istiyorsunuz?

Çok basit. Sık sık "Ben zeki çocuklar arasında en güzelim ve güzel çocuklar arasında en akıllıyım" diyen çocuklar genellikle _____ veya _____ değildir.

Bağımlılık yapmaz, lütfen dürt

Bilimi eve götür

ID: steamforkids

Çocuklara en iyi fen eğitimini verin

Yeniden yazdırmak için lütfen kids@huanqiukexue.com ile iletişime geçin

Bizi takip etmek için QR koduna uzun basın

Aksi belirtilmedikçe resimler internetten alınmıştır.

Orijinali korumak için referans malzemeler grafit içinde saklanır:

https://shimo.im/docs/oPcMnwi1M7QQQ3C5/

Bir ömür bu kadar kısa, neden denemek için yüzyıllar harcıyorlar?
önceki
Çocuklar öğrenmede yetişkinlerden daha iyidir çünkü beyinleri çok fazla düşünmez
Sonraki
8 yaşındaki kız, CCTV Ulusal İngiliz Yarışması şampiyonluğunu kazandı, bu babanın yaklaşımı kesinlikle gerekli Promosyon
Sihir olmadığına emin misin? Bu büyülü animasyonlar sizi bilime aşık edecek ~
En iyi tıp dergileri: Çocuklarınız için satın aldığınız tüm reçetesiz öksürük ve soğuk algınlığı ilaçları işe yaramaz
Zhang Quanling: Dokuz yaşındaki oğlumun IQ'su tarafından ezilmek gerçekten korkunç! Promosyon
Yumurtadan yeni çıkan civcivler boyutlarını bilir ve yetişkin tavuklar mantığı anlar.
Anne, neden sigorta almamanı tavsiye ediyorum? Promosyon
DEHB ve depresyonun önemi insanlığın devamı için olabilir
Bu özel çorap yöntemi, gecekondu çocuklarının asil okul öğrencilerine yetişmesine izin verdi.
Zeng ve Hawking, AI kuralı alarmını yaptı, üniversiteden mezun olan 19 yaşındaki Nobel Ödülü sahibi bilim için Çin'e geldi!
Dünyayı beyaz çöplerle doldurduktan sonra, insanlar sonunda plastik içeren kakaları çıkardılar.
Gizli ajanın şekil değiştirme bilimi filmde mi? CIA'nın eski Kılık Değiştirme Görevlisi şöyle cevapladı
Neden açık kırmızı, yeşil ve mavinin üç ana rengi ve resmin üç ana rengi kırmızı, sarı ve mavi oluyor?
To Top