"AI VS İnsana" Doktorların büyük bir PK'si var: Yapay Zeka dört galibiyet, üç beraberlik ve bir mağlubiyetle başı çekiyor

1 Xinzhiyuan raporu

IEEE Spectrum, birkaç gün önce, tıp alanının çeşitli alt kategorileri arasında, yapay zeka ve insan doktorlarının daha baskın olduğunu gösteren bir "skor tahtası" duyurdu. IEEE Spectrum'un sözleriyle, "AI, tıp alanındaki doktorlara meydan okuyor ve biz puanlama yapıyoruz."

Bu puan tablosu gösteriyor ki ...

AI'nın açık bir avantajı var Kalp hastalığı, inme ve otizm

AI'nın belirli avantajları vardır Alzheimer, ameliyat

Yapay zeka ve insan doktorlar birbirine bağlı Beyin tümörü, oftalmoloji, cilt kanseri

İnsan doktorlarının açık bir avantajı var Genel teşhis .

Kalp hastalığı: Standart tahmin yöntemiyle karşılaştırıldığında, AI sistemi 355 hastanın durumunu doğru bir şekilde tahmin etti

İngiltere'deki Nottingham Üniversitesi'ndeki araştırmacılar, 10 yıl içinde hangi hastaların kalp krizi veya felç riski altında olduğunu tahmin etmek için hastaların rutin tıbbi verilerini tarayan bir sistem oluşturdu. Standart tahmin yöntemleriyle karşılaştırıldığında, AI sistemi 355 daha fazla hastayı doğru tahmin etti.

Araştırmacı Stephen Weng ve meslektaşları, Birleşik Krallık'taki 378.256 hastanın tıbbi kayıtları üzerinde birkaç farklı makine öğrenimi aracını test etti. Bu kayıtlar, 2005 ile 2015 yılları arasındaki hastaların sağlık durumunu kaydeder ve bazı demografik bilgileri, tıbbi koşulları, reçeteli ilaçları, tıbbi kayıtları, laboratuvar sonuçlarını ve diğer bilgileri içerir.

Araştırmacılar, tıbbi kayıtların% 75'ini, 10 yıl içinde kalp krizi veya felç geçiren hastaların özelliklerini bulmayı amaçlayan makine öğrenimi modellerine aktarmışlardır. Araştırma ekibi daha sonra modeli, kalp krizi ve felçlerini ne kadar doğru tahmin ettiklerini görmek için kayıtların% 25'i üzerinde test etti. Ayrıca, kayıtların bir alt kümesini kullanarak standart tahmin yöntemlerinin doğruluğunu da test ettiler.

% 100 doğruluğu temsil etmek için 1,0 puanı kullanılır ve standart yöntem puanı 0,728'dir. Makine öğrenimi modelinin doğruluğu 0,745 ile 0,764 arasında değişmektedir ve sinir ağı makine öğrenimi modeli en yüksek puana sahiptir.

Başka bir deyişle, sinir ağı modeli, 7,404 gerçek kalp hastalığı veya inme vakasından 4,998 hastayı doğru bir şekilde tahmin etti, bu standart yöntemden 355 daha fazla. Bu tür tahminlerle doktorlar, kolesterolü düşürmek için ilaç reçete etmek gibi önleyici tedbirler alabilirler.

Otizm: Yalnızca üç değişken kullanarak, algoritma otizmli 10 çocuktan 8'ini tespit etti

Kuzey Carolina Üniversitesi'nden bir araştırma ekibi, 6 aylık çocuklarda otizmle ilişkili beyin gelişimi değişiklikleri tespit etti. Derin öğrenme algoritmaları, otizm geliştirme riski yüksek olan bir çocuğun 24 ay içinde teşhis edilip edilmeyeceğini tahmin etmek için bu verileri kullanabilir.

Algoritma, yüksek riskli çocukların kesin teşhisini% 81 doğruluk ve% 88 duyarlılıkla doğru bir şekilde öngörür. Davranış anketleriyle karşılaştırıldığında, bu şüphesiz daha yararlı bir sonuçtur - bu anketler erken otizmi (yaklaşık 12 aylık) yalnızca% 50 doğrulukla teşhis eder.

UNC psikoloğu ve beyin gelişimi araştırmacısı kıdemli yazar Heather Hazlett, "Bu, önceki yöntemlerden daha iyidir ve teşhis daha genç yaşta yapılabilir."

Bu algoritma, yalnızca üç değişkeni kullanarak (beyin yüzey alanı, beyin kapasitesi ve cinsiyet (erkeklerin kızlara göre otizme sahip olma olasılığı daha yüksektir) iyi çalışıyor - yöntem otizmli 10 çocuktan 8'ini tespit etti.

Araştırma ekibinin bir üyesi ve UNC Nöral Görüntü Analizi ve Araştırma Laboratuvarı'nın eş direktörü Martin Styner'a göre, algoritmayı eğiten ekip başlangıçta verilerin yarısını eğitim için, diğer yarısını test için kullandı. Ancak, gözden geçirenlerin talebi üzerine, daha sonra verilerin 10 eşit parçaya bölündüğü daha standart bir 10-kat analizi gerçekleştirdiler. Daha sonra makine öğrenimi süreci 10 turdan geçer, her tur eğitmek için 9 parça kullanır ve bir kısım test için ayrılmıştır. Son olarak, 10 tur "yalnızca test" sonucu toplanır ve tahminleri için kullanılır.

Neyse ki, Styner, iki tür analizin - ilk 50/50 ve son 10 kat - neredeyse aynı sonuçları gösterdiğini söyledi. Ekip, tahminin doğruluğundan memnun.

Elbette Hazlett, projenin ilerlemesi ve yaygınlaşmasının biraz zaman alacağını söyledi. "Bu kadar pahalı teşhis testleri tüm aileler için uygun değil."

Alzheimer: Yeni yöntem eskisinden çok daha iyi olmayabilir, belki de sadece daha iyi veriler kullandığı için

Harvard Üniversitesi, Massachusetts Genel Hastanesi ve Huazhong Bilim ve Teknoloji Üniversitesi'nden araştırmacılar, fMRI beyin taramalarını tahmin için klinik verilerle birleştiren bir plan tasarlamak için işbirliği yaptı.

Massachusetts General Hospital'daki Clinical Data Science Center'da kıdemli bir araştırmacı olan QuanzhengLi şunları söyledi: "Alzheimerı erken keşfetmeye çalıştık. Birçok kişi bunu yapmak için geleneksel makine öğrenimi yöntemlerini kullanmaya çalıştı, ancak sonuçlar o kadar iyi değildi çünkü bu Çok zor bir soru. "

İlk testten sonra araştırmacılar, derin öğrenme programlarının özel bir fMRI veri seti ile eşleştirildiğinde, daha temel veri setleri kullanan diğer sınıflandırma yöntemlerinden daha doğru olduğunu belirttiler. Bununla birlikte, bu geleneksel sınıflandırıcılar özel veri kümeleri de kullandıklarında, doğruluk açısından da benzer kazanımlar elde ederler.

Edinburgh Üniversitesi'nde biyomedikal mühendisi olan Javier Escudero, bu yeni yöntemin belki de daha iyi veriler kullandığı için eskisinden çok daha iyi olmayabileceğini söyledi.

Öyleyse, Alzheimer hastalığını teşhis etmek için derin öğrenmeyi kullanmak isteyen diğer uzmanlar, analizlerine ekledikleri verileri dikkatlice gözlemlemek isteyebilirler. Bu son çalışmaya göre, beyin bölgeleri arasındaki ilişkiyi gösteren fMRI taramaları, zaman içinde ölçümleri kaydetmekten daha ayrıntılı bir görünüm sağlıyor.

Araştırma ekibi, Alzheimer hastalığını tahmin etmek için fonksiyonel bağlantıdaki bu değişiklikleri kullanıp kullanamayacaklarını görmek istedi. Alzheimer Hastalığı Nörogörüntüleme Programı tarafından sağlanan 93 MCI hastasından ve 101 normal hastadan alınan verilerle başladılar. Araştırmacılar, katılımcıların beyinlerinin 90 bölgesinden alınan 130 fMRI ölçümünün zaman serisine dayanarak, sinyalin belirli bir süre boyunca nerede titreştiğini bilebilir.

Daha sonra, önemli bir adımda araştırmacı, ilgili beyin bölgesindeki sinyal gücünün ikinci bir ölçümünü yapmak için veri setini işledi. Başka bir deyişle, hangi alanların ve sinyallerin birbiriyle en yakından ilişkili olduğunu gösteren işlevsel bir bağlantı grafiği oluşturdular.

Son olarak ekip, bu kalıpları yorumlayabilen ve bir kişinin Alzheimer hastalığı geliştirip geliştirmeyeceğini tahmin etmek için yaş, cinsiyet ve genetik risk faktörleri gibi klinik verileri birleştirebilen bir derin öğrenme programı oluşturdu.

Son olarak ekip, veri setlerini bağlamak için özel işleme fonksiyonları kullanan programının, hastaların veri setlerinde Alzheimer hastalığı olup olmayacağını tahmin etmede yaklaşık% 90 doğruluk oranına sahip olduğunu söyledi.

Cerrahi: Denemelerin% 60'ında STAR, ameliyatın planlamasını ve icrasını tamamen özerk olarak tamamladı

Akıllı cerrahi robot, operasyonu planlıyor ve gerçekleştiriyor, ancak süpervizör ara sıra yardımcı olacaktır.

Robotlar, domuzların ince bağırsaklarını dikmek için zaten kendi vizyonlarını, araçlarını ve zekalarını kullanabilirler. Daha da önemlisi, SmartTissue Otonom Robotu (STAR) operasyonda insan cerrahlardan daha iyi performans gösteriyor.

STAR'ın mucidi, robotların ameliyatta insanların hızla yerini alabileceğini iddia etmiyor. Bunun yerine, "denetimli otomasyon" kavramını kullandılar.

Araştırmacılardan biri olan pediatrik cerrah Peter Kim, doktorun çalışmasının tehdit altında olmadığını söyledi. "Operasyonun sonucunu ve güvenliğini iyileştirmek için bizimle çalışabilecek bir makine varsa harika olur" dedi.

Araştırmacılar, robotlarını bağırsağın kesilen bölümlerini birbirine bağlayan sütür dikişi adı verilen bir işlem gerçekleştirecek şekilde programladılar. Ekipte kıdemli bir mühendis olan Ryan Decker, sızıntıyı önlemek için dikişlerin yakın ve düzenli aralıklarla yerleştirilmesi gerektiğini söyledi. Deneyimli insan cerrahlar da aynı görevi yaptı. Ortaya çıkan sütürler karşılaştırılırken, STAR dikişleri daha tutarlıdır ve sızıntıyı önler.

Deneylerin yaklaşık% 40'ında araştırmacılar müdahale ettiler ve bir tür rehberlik sağladılar. Denemelerin diğer% 60'ında STAR bu işi tamamen özerk olarak tamamladı.

İnsan cerrahlar operasyonları gerçekleştirebilir ve makinenin daha rutin veya sıkıcı operasyonlar yapmasına izin verebilir.

STAR, birkaç farklı teknolojiyi entegre ederek yumuşak dokunun yarattığı zorlukları çözer. Görüş sistemi, bağırsak dokusuna yerleştirilen yakın kızılötesi floresan (NIRF) etiketlerine dayanır; özel bir NIRF kamera bu etiketleri takip ederken, bir 3D kamera tüm cerrahi operasyonun görüntülerini kaydeder. Tüm bu verileri birleştiren STAR, hedeflerine odaklanabilir. Robot, dikiş görevi için kendi planını yapar ve operasyon sırasında organizasyon hareket ettikçe planı otomatik olarak ayarlar.

Beyin tümörü: IBM Watson'ın hastanın genomunu analiz etmesi ve bir tedavi planı önermesi yalnızca 10 dakika sürdü, uzman ise 160 saat sürdü

Beyin tümörlerini tedavi ederken zaman çok önemlidir. Yeni bir çalışmada, IBM Watson'ın beyin tümörü hastalarının genomunu analiz etmesi ve bir tedavi planı önermesi yalnızca 10 dakika sürdü. Bununla birlikte, insan uzmanlar plan yapmak için 160 saat harcamış olsalar da, çalışmanın sonuçları makinenin insanlara karşı tam bir zafer kazandığını göstermiyor.

Hasta, baş ağrısı ve yürüme güçlüğü nedeniyle doktora şikayette bulunan 76 yaşında bir erkek. Beyin taraması bir tümörü ortaya çıkardı ve cerrah hızla tedavi etti. Adam üç hafta radyasyon tedavisi aldı ve uzun süreli kemoterapiye başladı. En iyi bakıma rağmen bir yıl içinde vefat etti. Watson ve doktor hastanın genomunu analiz etmesine ve bir tedavi planı önermesine rağmen, doku örnekleri sıralandığında hasta daha da kötüye gitmişti.

Watson genom ekibine liderlik eden LaxmiParida, kanser hastalarının çoğunun tüm genomlarını (3 milyar DNA biriminden oluşan) taramadığını açıkladı. Bunun yerine, genellikle yalnızca kanserde rol oynadığı bilinen bir gen alt kümesini saptayan bir "grup" testi yaparlar.

Araştırmacılar, bir hastanın tüm genomunun taranmasının, bir "grup" testi yürütmekten daha pahalı ve zaman alıcı olmasına rağmen, doktorlara tedavi planlarını tasarlamak için gerçekten yararlı bilgiler sağlayıp sağlamayacağını bilmek istiyor.

Bu sorunun cevabı evet. NYGC klinisyenleri ve Watson, panel testinde tespit edilmeyen gen mutasyonlarını ve işe yarayabilecek ilaçlar ve klinik deneyler önerdiler.

İkinci olarak, araştırmacılar IBM Watson ve NYGC'de tıp uzmanları tarafından gerçekleştirilen genom analizlerini karşılaştırmak istediler.

Watson ve uzman ekip, hastanın genom bilgilerini aldı. Mutasyonları gösteren genleri belirlediler. Bu mutasyonların diğer kanser vakalarında bulunup bulunmadığını tıbbi literatürden öğrendiler, başarılı ilaç tedavilerinin raporlarını aradılar ve hastalar için klinik olarak uygun olup olmadığını kontrol ettiler. Ölçek. İnsanlar tavsiye vermek için "160 saat" harcadı ve Watson yukarıdaki süreci 10 dakikada tamamladı.

Ancak Watson'ın çözümü en hızlı olsa da en iyisi olmayabilir. NYGC klinisyenleri, iki gendeki mutasyonları belirledi ve bunları kapsamlı bir şekilde değerlendirdi.Son olarak, doktor, hastanın kombinasyon ilaç tedavisi için bir klinik araştırmaya katılmasını önerdi. Hastanın sağlık durumu hala izin veriyorsa, en umut verici hayatta kalma şansı olan bu denemeye katılacaktır. Watson, bilgileri bu şekilde sentezlemedi ve bu nedenle klinik araştırmalar için tavsiyelerde bulunmadı.

Göz hastalıkları: Sun Yat-Sen Üniversitesi ve Xidian Üniversitesi, şu anda doktorlarla aynı seviyede olan CC-Cruise'u ortaklaşa geliştirdi.

Çin'de bir araştırma ekibi, yüksek kaliteli veriler mevcut olduğunda yapay zekanın oftalmik hastalıkların tıbbi teşhisine yardımcı olabileceğini gösterdi. Yapay zekaları, kataraktın ciddiyetini belirlemek ve tedavi önerileri sağlamak için yalnızca 410 konjenital katarakt görüntüsünü (geri döndürülemez körlüğe neden olan nadir bir hastalık) ve ayrıca 476 hastalıksız göz görüntüsünü eğitti.

DeepMind'in 2015 araştırma raporundan esinlenen bu araştırma, minimum aktivasyon bilgisine dayalı bir makine öğrenimi algoritmasının bir dizi atari oyununda profesyonel oyuncuları nasıl mağlup ettiğini açıklıyor - Sun Yat-sen Üniversitesi göz doktoru Haotian Lin ve meslektaşları madencilik için bir yapay zeka ajanı oluşturdu Çocukluk çağı katarakt klinik veri tabanı.

Xidian Üniversitesi'nden Xiyang Liu ekibiyle işbirliği içinde, hastalığın ciddiyetini tahmin etmek ve tedavi kararları vermek için doğuştan kataraktı teşhis edebilen bir AI programı olan CC-Cruiser'ı oluşturdular. Program derin öğrenme algoritmaları kullanılarak oluşturulmuş ve yukarıdaki görüntülerle eğitilmiştir.

Ardından, araştırmacılar CC-Cruiser'ı beş kez test etti. İlk olarak, bilgisayar simülasyonunda, AI programı hastalar ve sağlıklı bireyler arasında% 98,87'lik bir doğrulukla ayrım yapabilir. Hastalığın ciddiyetini tahmin etmek için üç göstergenin her birinin doğruluğu - lens opak alanı, yoğunluğu ve konumu -% 93'ün üzerindedir. Program aynı zamanda% 97,56 doğruluk oranıyla tedavi önerileri sunmaktadır.

Daha sonra ekip, klinik denemeler için Çin'deki üç kooperatif hastanesinden çocukların gözlerinin 57 görüntüsünü kullandı. Seçilen hastanelerin hiçbirinde bu hastalığın tanı veya tedavisi için uzmanlaşmış bölümler bulunmamaktadır. Çünkü araştırma ekibi, platformun sonunda uzmanları olmayan hastanelere yardımcı olacağını umuyor. Testte, CC-Cruiser iyi performans gösterdi:% 98,25'lik bir tanıma doğruluğuna ulaştı; üç ciddiyet göstergesinin hepsinin yargı doğruluğu% 92'yi ve tedavi önerilerinin doğruluğu% 92,86'yı aştı.

Gerçek dünyadaki kullanımı simüle etmek için, prosedürü bir göz doktorunun çalışmasıyla karşılaştırdılar. Üç oftalmolog - bir uzman, bir omurga ve daha az deneyimli bir çığlık - 50 klinik vakada CC-Cruiser ile bir PK gerçekleştirdi. Bilgisayar ve doktor eşit şekilde performans gösterdi.

Deneyde, AI birkaç yanlış işaretleme yaptı ve Lin, daha büyük bir veri kümesinin performansını artırabileceğini umuyordu. Ekip, işbirliğine dayalı bir bulut platformu oluşturmayı planlıyor, ancak Lin, teknolojinin en iyi tedavi sürecini% 100 doğrulukla belirlemek için "yeterli olmadığını" vurguladı. Bu nedenle, doktorlar, olası yanlış sınıflandırmaları belirlemek ve önlemek için makinenin tavsiyelerinden tam olarak yararlanmalı ve kendi kararlarını tamamlamalıdır.

Cilt kanseri: otomatik cilt kanseri sınıflandırması için en büyük veri setinin oluşturulması

Stanford Üniversitesi'ndeki araştırmacılar, fotoğraflardaki cilt kanserini tanımlayabilen bir algoritma geliştirdiler. Deri lezyonlarını tanımlayan ilk otomatik sistem değildir, ancak en güçlüsü olabilir.

Araştırma ekibi, evrişimli sinir ağı algoritması olan GoogleNet Inception v3 mimarisinde bir dizi derin öğrenme algoritması oluşturdu. Stanford Üniversitesi'ndeki araştırmacılar, otomatik cilt kanseri sınıflandırmasında en büyük veri seti olabilecek 2.000'den fazla hastalık için yaklaşık 130.000 cilt lezyonu görüntüsüne ince ayar yaptı.

Çalışmada bu algoritmanın sonuçları 21 dermatoloğun tanıları ile karşılaştırıldı. Doktor, yüzlerce deri lezyonu görüntüsünü inceledi ve daha ileri testler yapıp yapmayacağına veya hastanın iyi huylu olup olmadığına karar verdi. Algoritma aynı görüntüyü algılar ve teşhisini verir. Görüntüyü ne doktor ne de algoritma daha önce görmedi.

Sonunda bilgisayar uzmanlarla aynı fikirde. Örneğin, program, en yaygın insan cilt kanseri olan keratinosit karsinomu ile seboreik keratoz adı verilen iyi huylu cilt büyümesi arasında ayrım yapabilir.

Gerçek başvurudan önce, Stanford Üniversitesi'nin sisteminin daha ciddi şekilde test edilmesi gerekecektir. Araştırmacılar, zor bir nokta olabilecek seboreik keratoz ve melanomu ayırt etmek için algoritmaya ihtiyaç duymadılar.

Genel teşhis: Zamanın yaklaşık% 72'sinde doktor doğru teşhisi koydu. AI, zamanın% 34'ünde doğru teşhisi verir

Yapay zekanın ve doktorların PK'sında, doktorların hala kazanabilecekleri alanlar var. JAMA Internal Medicine ile ilgili daha önce yayınlanan bir rapor, otomatik olarak teşhis edilen bir grup uygulamanın teşhis doğruluk oranının doktorlarınkinden çok daha düşük olduğuna işaret etti.

Mehrotra ve ekibi tarafından BMJ'de (daha önce British Medical Journal olarak biliniyordu) 2015 yılında yayınlanan bir çalışmada, 45 hastanın semptomları, sonradan astım ve sıtma teşhisi konanlar da dahil olmak üzere 23 semptom tespit sistemine beslendi. hasta. Ekip, dedektörlerin üçte birinden fazlasının doğru tanı koyduğunu buldu.

Yeni deneyde, araştırmacılar dedektörün yarı eğriliğini 234 doktorla karşılaştırdı. Her durum için, en az 20 doktor ilk üç tanının doğruluğunu verebilir.

Zamanın yaklaşık% 72'sinde doktor doğru tanı koydu. Uygulama, zamanın% 34'ünde doğru tanı koydu.

Mehrotra, "Doktorlar hiçbir şekilde mükemmel değildir" dedi. "Yine de hatayı% 10 ila% 15 oranında teşhis edebilirler. Ancak, kendi kendine teşhis uygulamasının doktoru geçmesi zaman alacaktır."

Orijinal adres: https://spectrum.ieee.org/static/ai-vs-doctors

İş ayrıntılarını görüntülemek için orijinal metni okumak için tıklayın ve katılmanızı dört gözle bekleyin ~

Buffett tahliyede başı çekti, Çinli alıcılar peşin sattı ve Fed tarafından basılan saadet zinciri ifşa olabilir.
önceki
Harvardın en popüler kişilik psikolojisi dersi: Kendinize sınır koymazsanız, hayatın daha fazla olasılığı olacaktır
Sonraki
Lüks bir araba sürmekle lüks bir araba sürmek arasındaki fark nedir? Eski sürücü: Kimlikte büyük bir fark var
Ningbo'da seyahat ederken mutlaka yenmesi gereken lezzetlerin en iyi listesi Çeşitli egzotik atıştırmalıklar ve yerel spesiyaliteler!
Kanadalı iflasların sayısı hızla arttı. 55 milyar dolar silindikten sonra, Kanadalı çiftçilerin gelirinin% 40'ı kaybedilebilir
Ali halkı neden fazla mesai yapmak istiyor?
169.800'den! Yakıt tasarruflu, çok güçlü ortak girişim SUV modelleri, bu 4 model görülmeye değer!
"Derinlik" Çin'in en iyi AI Laboratuvarı ziyareti: Toutiao, Xunfei, Ali, Tencent ve Yaoban ne yapıyor
Kötü çevrimiçi kumarhanelerde yer alan eğlenceli "Prodigal Terminal". Kumarla uğraşan yaklaşık 400 kişi var ...
Kendinizin daha iyi bir versiyonu olmak gerçekten bu kadar zor mu?
İran resmen yuanın ABD dolarının yerini alacağını açıkladı ve İran ham petrolü için yeni alıcılar var ve işler hareket ediyor
Çin, Rusya, Almanya, Fransa ve diğer 26 ülke dolardan arındırıldıktan sonra işler ilerledi, yabancı medya: petrodolar çiviler çekilebilir
Miami'ye yapılan bir geziden sonra ne gibi sorunlar ve hayal kırıklıkları giderildi!
Polisin ruhuna bir tutku | Jiangxi Kamu Güvenliği'nin 40. reform ve açılma yıldönümüne dair izleri
To Top