Wu Enda'nın en son tıbbi AI başarısı: Serebral anevrizma tespitinin doğruluğunu artırmak ve klinisyenlerin teşhis koyma süresini önemli ölçüde azaltmak için AI kullanmak

Baidu'dan ayrıldıktan sonra Enda Wu, akademik araştırmalarına devam etmek için Stanford Üniversitesi'ne döndü. Tıp, en değerli dikey uygulamalarından biridir. İki yıl içinde Enda Wu ve ekibi, pnömoniyi tanımlamak için CNN algoritmasının kullanılması dahil olmak üzere bir dizi sonuç yayınladı. , En büyük tıbbi görüntüleme veri setini MURA, vb. Duyurun.

Lei Feng.com, geçtiğimiz günlerde Stanford Üniversitesi'nin resmi web sitesinin Wu Enda'nın ekibinin yeni bir sonucunu yayınladığını öğrendi: Radyologların serebral anevrizmaların teşhisini iyileştirmesine yardımcı olmak için yapay zeka algoritmalarının yardımıyla. Bu başarının raporu "JAMA Network Open" da yayınlandı.

Rüptüre olmayan anevrizmaların teşhisi çok önemli bir klinik görevdir - serebral anevrizmalar, beyin kan damarlarında sızıntı yapabilen veya yırtılabilen ve felç, beyin hasarı veya ölüme yol açabilen çarpmalardır.

Bilgisayarlı tomografi anjiyografi (BTA) şu anda intrakraniyal anevrizmaların teşhisi, izlenmesi ve preoperatif planlanması için kullanılan ana, minimal invaziv görüntüleme yöntemidir. Ancak profesyonel bir nöroradyologun bile tanı koyması uzun zaman alır. Değerlendiriciler arası anlaşma ayrıca tanının güvenilirliği için ek zorluklar ortaya çıkarır.

Son yıllarda yapay zeka dalgasında, Convolutional Neural Networks (CNN), bir dizi görsel görevde (tıbbi görüntü analizi dahil) mükemmel performans gösterdi. Bununla birlikte, derin öğrenmeyi klinisyenlerin çalışma becerilerini geliştirmek için kullanmada pek çok başarı yoktur.

Bu nedenle, klinisyenlerin CTA'da klinik olarak önemli anevrizmaları güvenilir bir şekilde tanımlamasına yardımcı olmak için AI kullanılması, radyologlara, beyin cerrahlarına ve diğer klinisyenlere kullanışlı ve kullanımı kolay bir tanı destek aracı sağlayacaktır.

Wu Enda'nın ekibi, bu hususlara dayanarak, CTA'daki intrakraniyal anevrizmaları otomatik olarak tespit etmek için derin bir öğrenme modeli oluşturdu ve klinisyenlerin intrakraniyal anevrizmaları CTA incelemeleri yoluyla teşhis etmelerine yardımcı olmak için belirli alanları segmentlere ayırdı.

Aşağıda, AI Nuggets Academic Group tarafından derlenen makalenin ayrıntılı içeriği yer almaktadır. Orijinal PDF'yi almak için "AI Nuggets" genel hesabını takip edin ve iletişim kutusundaki "Wu Enda" anahtar kelimesini yanıtlayın .

Özet

önem: Derin öğrenme, klinisyenlerin tıbbi görüntüleme yorumlamasındaki performansını artırma ve otomatik segmentasyon yoluyla tanı süresini kısaltma potansiyeline sahiptir. Bugüne kadar, birkaç çalışma bu konuyu araştırdı.

amaç: Klinisyenlerin intrakraniyal anevrizmaları teşhis etme becerisini geliştirmek için kafa bilgisayarlı tomografi (CTA) görüntülemede intrakraniyal anevrizmaların doğru voksel tahminlerini oluşturabilen bir sinir ağı segmentasyon modeli (HeadXNet modeli) geliştirin ve uygulayın.

Tasarım, kurulum ve katılımcılar: Bu teşhis çalışmasında, anevrizma segmentasyonu oluşturmak için 611 kafa CTA incelemesinden oluşan bir eğitim seti kullanarak üç boyutlu bir evrişimli sinir ağı yapısı geliştirdik. 115 incelemeden oluşan test setinde modelin segmentasyon sonuçları klinisyenlere sunuldu.

13 Ağustos 2018 ile 4 Ekim 2018 arasında, model geliştirme olsun veya olmasın, 8 klinisyen, rastgele bir sıra ve 14 günlük bir yıkama süresi kullanarak bir çapraz tasarımda test setinde bir anevrizma varlığını teşhis etti. Modeli eğitmek, doğrulamak ve test etmek için 3 Ocak 2003 ve 31 Mayıs 2017 tarihleri arasındaki baş ve boyun muayenesi kullanıldı. Klinik olarak anlamlı en az bir anevrizma vakası vardır ve yırtılmamış intrakraniyal anevrizma pozitiftir. Kanama, yırtılmış anevrizma, travma sonrası veya enfeksiyöz psödoanevrizma, arteriyovenöz malformasyonlar, cerrahi klipsler, sarmallar, kateterler veya diğer cerrahi donanımların muayenesinden hariç tutulmuştur. Diğer tüm CTA incelemeleri kontrol grubu olarak kabul edilir.

sonuç: Veri 662 bağımsız hastadan 818 tetkik içerir, bunlardan 328 BTA incelemesinde (% 40.1) en az bir intrakraniyal anevrizma ve 490 incelemede (% 59.9) intrakraniyal anevrizma yoktu. Test setini okuyan 8 klinisyen 2 ila 12 yıllık bir deneyime sahiptir. Klinisyenlerin yeteneği, yapay zeka tarafından üretilen segmentasyon tahminleriyle artırılmıştır. Hiçbir geliştirme ile karşılaştırıldığında, klinisyenler duyarlılık, doğruluk ve puanlayıcı güvenilirliğinde istatistiksel olarak önemli gelişmeler elde etmiştir:

Klinisyenlerin ortalama duyarlılığı 0,059 (% 95 CI, 0,028-0,091; ayarlanmış P = 0,091), ortalama doğruluk 0,038 (% 95 CI, 0,014-0,062; ayarlanmış P = 0,02) arttı ve ortalama değerlendiriciler arası fark (Fleiss ) 0,799'dan 0,859'a 0,060 arttı (ayarlanmış P = 0,05).

Ortalama özgüllük değerleri (0.016;% 95 CI, -0.010-0.041; ayarlanmış P = .16) ve tanı süresi (5.71 saniye;% 95 CI, 7.22-18.63 saniye; ayarlanmış P = .19) istatistiksel olarak Önemli değişiklikler.

Sonuç ve önemi: Kurduğumuz derin öğrenme modeli, BTA'da klinik olarak önemli intrakraniyal anevrizmaları başarıyla tespit etti. Bu, yapay zeka destekli tanı modellerinin entegrasyonunun, güvenilir ve doğru tahminlerle klinisyenlerin performansını artırabileceğini ve böylece hasta bakımını optimize edebileceğini göstermektedir.

yöntem

veri

Stanford Üniversitesi Tıp Merkezi'nde 3 Ocak 2003 ile 31 Mayıs 2017 tarihleri arasında gerçekleştirilen baş veya baş boyun 9455 ardışık CTA inceleme raporunu geriye dönük olarak inceledik. Muayeneler arasında önemli kanama, subaraknoid kanama, travma sonrası veya enfeksiyöz psödoanevrizma, arteriyovenöz malformasyonlar, iskemik inme, intrakraniyal ateroskleroz veya diğer vasküler hastalıklar gibi spesifik olmayan veya kronik vasküler bulgular, Cerrahi klipsler, sarmallar, kateterler veya diğer cerrahi donanımların yanı sıra. 12 yıllık deneyime sahip bir nöroradyolog, travma veya spor dejenerasyonuna bağlı yaralanmaları dışladı. Muayene raporu ayrıca önemli rüptüre olmayan anevrizmaları da içerir ( > 3 mm).

Radyolog

Test setindeki tüm muayeneler için referans standartlar, 12 yıllık deneyime sahip sertifikalı bir nöroradyolog tarafından belirlenir. CTA incelemesi, bir anevrizmanın varlığını doğrulamak için orijinal radyoloji raporu incelenerek iki kez kontrol edilir. Ek olarak, mümkünse, anevrizmayı tanısal serebral anjiyografi ile doğrulayın. Nöroradyologlar, etiketleme için en iyi referans standardını belirlemek için tüm tıbbi dijital görüntüleme ve DICOM serilerine, orijinal raporlara ve klinik geçmişe ve ayrıca açıklama süreci sırasında ön ve takip incelemelerine erişebilirler.

Her anevrizma muayenesinde radyolog ayrıca her anevrizmanın yerini belirledi. Her dilimde tanımlanan anevrizmaları manuel olarak bölümlere ayırmak için açık kaynak açıklama yazılımı ITK-SNAP'yi kullanın.

Model oluşturma

Bu çalışmada, intrakraniyal anevrizmaları BT taramalarından ayırmak için HeadXNet adlı üç boyutlu bir CNN geliştirdik. CNN, görüntü verilerini işlemek için kullanılan bir sinir ağıdır ve 3D CNN, özellikle görüntü dizilerini veya hacimlerini işlemek için uygundur.

HeadXNet, kodlayıcının hacmi soyut bir düşük çözünürlüklü kodlamaya eşlediği ve ardından kod çözücünün kodlamayı tam çözünürlüklü bölümlenmiş bir hacme genişlettiği kodlayıcı-kod çözücü yapısına sahip bir CNN'dir (ekte Şekil 1). Segmentasyon sonucu, her voksel anevrizmasının olasılık değeridir ve boyutu, orijinal görüntü ile aynıdır. Kodlayıcı, 50 katmanlı bir SE-ResNeXt ağından uyarlanmıştır ve kod çözücü, bir 3x3 transpoze konvolüsyon serisidir.

UNet'e benzer şekilde atlama bağlantısı, kodlama işlemi sırasında çıktıyı doğrudan kod çözücüye iletmek için 3 katmanlı kodlayıcıda kullanılır. Kodlayıcı, insan davranışıyla işaretlenmiş bir dizi YouTube videosu olan Kinetics-600 veri seti üzerinde önceden eğitilmiştir; kodlayıcı ön eğitiminden sonra, son 3 evrişimli blok ve 600 yollu softmax çıktı katmanı kaldırılır, Karşılık gelen konuma devasa bir uzaysal piramit havuzlama katmanı ve kod çözücü eklenir.

Eğitim süreci

Eğitim sırasında, hacimden rastgele 16 örnek alt hacmi örnekliyoruz. Veri seti, kafatasının ana hatlarını bulmak için ön işlemden geçirildi ve her örnek 208 × 208 piksele yeniden örneklenmeden önce, her örnek enine kesitte kafatasının çevresinde kırpıldı. Daha sonra dilim 192 × 192 piksele kırpılır (eğitim sırasında rastgele kırpma kullanılır ve test sırasında merkez kırpma kullanılır) Son giriş boyutu 16 × 192 × 192; aynı dönüşüm segmentasyon etiketine uygulanır. Eğitim süreci, voksel tabanlı ikili çapraz entropi ve Zar kaybının ağırlıklı bir kombinasyonunu kullanır.

Model eğitimine girmeden önce, giriş görüntüsü Hounsfield birimlerine yakalanır ve veriler sıfır merkeze normalleştirilir. Eğitim, 3 TitanXp GPU (NVIDIA) kullanır ve her GPU'daki mini grup 2'dir. Modelin parametrelerini optimize etmek için stokastik gradyan iniş optimize ediciyi kullanın, momentum 0,9, rastgele başlatma ağırlığının en yüksek öğrenme oranı 0,1 ve eğitim öncesi ağırlık 0,01'dir. Öğrenme hızı, doğrusal ısınma tepe öğrenme oranıyla 0 ila 10.000 yineleme arasında ayarlanır ve ardından 300.000'den fazla kosinüs tavlama yinelemesi gerçekleştirilir.

Ek olarak, önceden eğitilmiş kodlayıcının ilk 10.000 yinelemesi için, öğrenme oranı 0'da sabitlenmiştir. Düzenlemeyle ilgili olarak, tüm eğitilebilir parametrelerin kaybına 0,001 değerinde bir L2 ağırlık zayıflaması eklenir ve kodlayıcı bloğunda rastgele derinlik düşüşü kullanılır. Standart bırakma kullanılmaz.

Sınıf dengesizliğini kontrol etmek için 3 yöntem kullandık.

Her şeyden önce, olumlu yanlış sınıflandırma örnekleri, kodlayıcılar ve odak kaybı yoluyla daha büyük parametre güncellemelerini teşvik eder ve ardından yardımcı kayıp eklenir.

İkincisi, anormal eğitim örneklerinin örnekleme sıklığı normal örneklerinkinden daha yüksektir, bu nedenle anormal örnekler eğitim yinelemelerinin% 30'unu oluşturur.

Son olarak, eğitim yinelemesinde, bölümleme etiketi tamamen arka plan (normal) voksellerden oluştuğunda, kod çözücünün parametreleri güncellenmez.

Tüm hacim için bölümleme tahminleri üretmek için, 16 ardışık dilimden oluşan alt hacimlerin bölümleme çıktıları basitçe bağlanır. Dilimlerin sayısı 16'ya bölünemezse, son giriş hacmi 0 ile doldurulur ve karşılık gelen çıktı hacmi, orijinal boyutuna geri kesilir.

Araştırma tasarımı

Model geliştirme olan ve olmayan klinisyenlerin performans göstergelerini karşılaştıran bir tanısal doğruluk çalışması yürüttük. Çalışmaya katılan sekiz klinisyenin tanısal test setindeki 115 vakanın her biri modelden yarısına sahipken, diğer yarısı almadı. Klinisyenin orijinal rapor, klinik geçmiş ve takip görüntüleme incelemeleri hakkında bilgisi yoktur.

Çapraz tasarım kullanılarak klinisyenler rastgele iki gruba ayrıldı. Her grupta kontrol, grubun yarısını sabit rastgele sırayla sıralar ve diğer yarısı ters sırada sıralanır. İlk grup önce model geliştirme olmadan kontrolü okur ve ikinci grup ilk olarak model geliştirme ile kontrolü okur. 14 günlük bir temizlik süresinden sonra, geliştirme ayarları tersine çevrildi, böylece grup 1 model geliştirme kontrolleriyle okur ve grup 2 model geliştirmeleri olmadan okur (Şekil 1A).

Klinisyen, klinik açıdan önemli en az bir anevrizma (çap 3 mm'den büyük) olup olmadığını işaretler. Klinisyenler, hepsi aynı yüksek çözünürlüklü monitörü (3840 × 2160 piksel) kullanarak ve standart açık kaynak DICOM görüntüleyicide (Horos) CTA incelemesini görüntüleyerek tanı okuma odasında tek tek okur. Klinisyenler etiket giriş verilerini, önceki muayene ile mevcut muayene arasındaki zaman farkını otomatik olarak kaydeden bir yazılım uygulamasına girer.

Okuma için model geliştirmeyi kullanırken, klinisyenler doğrudan CTA incelemesinin üzerine yerleştirilmiş ilgi bölgesi (ROI) segmentasyonu biçiminde model tahminleri sağlar. Tüm klinisyenlerin tanıdık görüntü görüntüleme arayüzünü kullanmasını sağlamak için, model tarafından tahmin edilen ROI standart DICOM görüntüleme yazılımında görüntülenir.

0.5'ten büyük tahmini olasılığa sahip her vokselde, doktor eksenel, sagital ve koronal dilimler üzerinde yarı saydam kırmızı bir kaplama görebilir (Şekil 1C). Muayeneyi yüklerken, doktor ROI'ye hemen erişebilir ve ROI'yi değişmemiş CTA görüntüsünü (Şekil 1B) görüntülemek için değiştirebilir.

Kırmızı kaplama, modelin belirli bir CTA incelemesinin bir anevrizma içerdiğini tahmin ettiğinin tek göstergesidir. Bu modellerin sonuçları ışığında, doktorlar klinik yargıya dayanarak bunları dikkate almayı veya görmezden gelmeyi seçebilirler.

Bir doktor model geliştirmeden tanı koyduğunda, herhangi bir muayene ROI olmadığını gösterir. Aksi takdirde teşhis aracı, gelişmiş ve geliştirilmemiş okumalar için aynıdır.

A, çapraz çalışma tasarımı. Klinisyenler 2 gruba ayrıldı ve 2 haftalık yıkama periyodunun olduğu rastgele sırayla model geliştirmeli ve model geliştirmesiz görüntüleri okudu.

B, Eksenel, koronal ve sagital görünümlerde orijinal CTA taramasını kullanarak model geliştirme olmadan okuma.

C, CTA eksenel, koronal ve sagital görünümlerde model segmentasyon sonuçlarını kapsayan Model geliştirilmiş görüntü okuma. Doktor, Şekil B'de gösterildiği gibi kaplamayı kapatmayı ve taramayı görüntülemeyi seçebilir. AI, yapay zeka anlamına gelir; CTA, bilgisayarlı tomografi anjiyografi.

İstatistiksel analiz

Muayenenin bir anevrizma içerip içermediğini belirlemeye yönelik ikili görevde, model geliştirme olan ve olmayan klinisyenlerin performansını değerlendirmek için duyarlılık, özgüllük ve doğruluk kullanılır. Duyarlılık, gerçek pozitif sonuçların sayısının toplam pozitif anevrizma sayısına bölünmesini, özgüllük gerçek negatif sonuç sayısının toplam anevrizma negatif vakalarına bölünmesini temsil eder ve doğruluk, test edilen tüm vakaların gerçek pozitiflerinin gerçek pozitiflerin sayısına bölünmesini temsil eder.

Tüm klinisyenler için bu istatistiklerin mikroskobik ortalaması, gerçek pozitif, yanlış negatif ve yanlış pozitif sonuçların toplam sayısı ile ilgili her istatistik tarafından da hesaplanır. Ayrıca, modelin segmentasyon çıktısını ikili bir tahmine dönüştürmek için, model en az bir vokselin bir anevrizmaya ait olduğunu ve diğerlerinin negatif olduğunu tahmin ederse, tahmin pozitif kabul edilir. Duyarlılık, özgüllük ve doğruluk tahminlerindeki değişikliği değerlendirmek için% 95 Wilson puanı güven aralığı kullanıldı.

Klinisyenlerin model geliştirme yoluyla önemli performans iyileştirmeleri elde edip etmediklerini değerlendirmek için, sekiz klinisyenin tümünün duyarlılık, özgüllük ve doğruluktaki farklılıkları üzerinde tek kuyruklu bir t-testi gerçekleştirdik. Araştırma sonuçlarının sağlamlığını ve sonuçların stajyer radyologları ve beyin cerrahlarını içerip içermediğini belirlemek için bir duyarlılık analizi yaptık: yalnızca sertifikalı radyologların duyarlılık, özgüllük ve doğruluklarındaki farklılıkları hesapladık t testi.

Model geliştirmesi olan veya olmayan klinisyenler tarafından ortalama tanı süresi, ardışık tanıların elektronik tablosundaki ortalama giriş süreleri arasındaki fark olarak hesaplanır;% 95 t-değeri güven aralığı, tahminlerin değişkenliğini değerlendirmek için kullanılır. Klinik okuma kesintisini veya zaman kaydetme hatasını göz önünde bulundurun ve her bir okumada her klinisyen tarafından teşhis edilen en uzun 5 ve en kısa 5 zamanı hariç tutun. Modelin artmasının tanı süresini önemli ölçüde kısaltıp kısaltmadığını değerlendirmek için, model güçlendirmesi olan ve olmayan 8 klinisyen arasındaki ortalama süre farkına tek kuyruklu t testi uygulandı.

Klinisyen ve radyolog alt kümesinin değerlendirmesinin güvenilirliği hassas Fleiss kullanılarak hesaplanır. Model geliştirmenin değerlendirmenin güvenilirliğini artırıp artırmadığını değerlendirmek için, klinisyenin test seti üzerindeki değerlendirme güvenilirliği üzerine tek kuyruklu permütasyon testi yapıldı. Değiştirme işlemi, daha önce geliştirilmiş okumaya sahip olarak işaretlenen test setinin rastgele bir alt kümesinin artık geliştirme olmadan okundu olarak işaretleneceği ve bunun tersi için, klinisyen etiketlerinin model geliştirme ile veya olmadan rastgele değiştirilmesini içerir; Yedek etiketlerle test setindeki tam Fleiss değerini (ve farkı) hesaplayın.

Bu değiştirme işlemi, Fleiss farklarının sıfır dağılımını (gelişmiş klinisyen ek açıklamasına sahip değerlendirme güvenilirliği, model geliştirmesiz olandan daha yüksek değildir) ve ayarlanmamış P değeri ile hesaplanan Fleiss farklarının oran oranını üretmek için 10.000 kez tekrarlanır. Gözlenen Fleiss k farkı daha büyüktür.

Ailevi hata oranını kontrol etmek için, birden fazla hipotez testini dikkate almak için Benjamini-Hochberg düzeltmesi uygulanır; Benjamini-Hochberg'e göre ayarlanmış P .05 istatistiksel önemi gösterir. Tüm testler tek kuyrukludur.

sonuç

Veriler 662 bağımsız hastadan 818 incelemeyi içeriyordu; bunlardan 328 BTA incelemesinde (% 40.1) en az bir intrakraniyal anevrizma vardı ve 490 incelemede (% 59.9) intrakraniyal anevrizma yoktu (Şekil 2). 328 anevrizma vakasından 15 özel hastadan 20'sinde 2 veya daha fazla anevrizma vardı. 148 anevrizma olgusunun anevrizma boyutu 3m-7 mm arasında, 108 anevrizma vakası 7 mm ile 12 mm arasında, 61 anevrizma vakası 12 mm ile 24 mm arasında ve 11 anevrizma vakası 24 mm'den büyüktü.

Anevrizmaların yerleşim yerleri şu şekilde dağıtılır: 99 vaka internal karotid arterde, 78 vaka orta serebral arterde, 50 vaka kavernöz internal karotis anevrizmalarında, 44 vaka baziler anevrizma, 41 vaka anterior komünikasyon arterinde ve 18 vaka posterior komünikasyon arterinde yer almaktadır. Arterlerin 16'sı vertebrobasiler sistemde ve 12'si ön serebral arterde yer alıyordu.

Tüm incelemeler, sefalik anjiyografi veya baş ve boyun anjiyografisi gibi standart klinik protokoller kullanılarak 1.0 mm veya 1.25 mm kesit kalınlığına sahip GE Discovery, GE LightSpeed, GE Revolution, Siemens Definition, Siemens Sensation veya Siemens Force tarayıcılarda yapıldı. Anevrizma ve anevrizmasız muayene arasında protokol ve dilim kalınlığı açısından fark yoktu. Bu çalışmada, eksenel dizi incelemeden çıkarıldı ve segmentasyon etiketleri, bir anevrizma içeren her bir eksenel dilim üzerine yerleştirildi. İnceleme başına görüntü sayısı 113 ile 802 (ortalama 373) arasındadır.

Muayene, modeli eğitmek için 611 vakalık bir eğitim setine (494 hasta; ortalama yaş, 55.8 yıl; 372 kadın) ayrıldı ve modelin eğitimi için 92 vakalık bir doğrulama grubu (86 hasta; ortalama yaş, 61.6 yıl; 59 kadın) kullanıldı. Model seçimi, 115 incelemeden oluşan bir test seti (82 hasta; ortalama yaş, 57.8 yıl; 74 kadın), klinisyenlerin ve modelin performansını değerlendirmek için kullanıldı (Şekil 2).

Katmanlı rastgele örnekleme yöntemini benimsiyoruz ve oluşturulan doğrulama ve test setlerinin her biri% 50 anevrizma vakası ve% 50 normal vakayı içeriyor; geri kalan tetkikler eğitim setleridir ve bunların% 36,5'i anevrizma tetkikleridir. Anevrizmalara yönelik takip incelemeleri nedeniyle veri setinde 43 hastanın birden fazla incelemesi vardı. Tekrarlanan bu hastalar dikkate alınarak muayene, farklı gruplar arasında hasta örtüşmesi olmayacak şekilde gruplandırılır. Şekil 2, her grubun patolojisini ve hasta demografik özelliklerini içerir.

Stanford Üniversitesi Tıp Merkezi'nde 2003-2017 yılları arasında gerçekleştirilen 9455 bilgisayarlı tomografi anjiyografi (CTA) incelemesinden 818 vaka seçildi ve profesyonel radyologlar tarafından doğrulandı. Bu testler, modeli eğitmek, en iyi modeli seçmek ve seçilen modeli değerlendirmek için kullanılan eğitim seti, geliştirme seti ve test setine ayrılmıştır.

Çalışmaya 6 lisanslı radyolog, 1 lisanslı beyin cerrahı ve 1 radyolog stajyer olmak üzere toplam 8 klinisyen katıldı. Bir radyoloğun deneyimi 3 ila 12 yıl arasında değişmektedir, bir beyin cerrahının 2 yıllık katılım tecrübesi vardır ve bir stajyer Stanford Üniversitesi Tıp Merkezi'nde ikinci yıl eğitim almaktadır. Grup 1 ve 2'nin her biri 3 radyologdan oluşur; stajyerler ve beyin cerrahları 1. gruptadır. Muayene için referans standardı oluşturmaya hiçbir klinisyen dahil değildir.

Güçlendirme olmadığında, klinisyen 0,831 (% 95 CI, 0,794-0,862) mikro-ortalama duyarlılık, 0,960 özgüllük (% 95 CI, 0,937-0,974) ve 0,893 (% 95 CI, 0,872) doğruluk elde etti. -0.912). İyileştirme durumunda, klinisyenin mikro ortalama duyarlılığı 0,890'a (% 95 CI, 0,858-0,915), özgüllük 0,975'e (% 95 CI, 0,957-0,986) ve doğruluk 0,932 (% 95 CI, 0,913- 0.946). Temel modelin duyarlılığı 0.949 (% 95 CI, 0.861-0.983), özgüllük 0.661 (% 95 CI, 0.530-0.771) ve doğruluk 0.809 (% 95 CI, 0.727-0.870). Modelin performansı, her klinisyen ve mikro ortalama performansı eTable 1'de verilmiştir.

İyileştirme durumunda, klinisyenlerin genel ortalama duyarlılığı ve ortalama doğruluğu sırasıyla istatistiksel olarak anlamlı bir artışa sahiptir (0,059;% 95 C, 0,028-0,091; ayarlanmış P = 0,01) ve (0,038;% 95 CI, 0.014-0.062; ayarlanmış P = .02). Ortalama özgüllükte istatistiksel olarak anlamlı bir değişiklik yoktu (0.016;% 95 CI, -0.010-0.041; ayarlanmış P = .16).

Tablo, klinisyenlerin genel performans gelişimini detaylandırmaktadır ve Şekil 3 her klinisyenin gelişimini listelemektedir. ETable 1 ekinde, model geliştirmeli ve geliştirmesiz bireysel performans gösterilmektedir. Duyarlılık analizi, kayıtlı radyologların bile istatistiksel olarak anlamlı ortalama duyarlılığa (0.059;% 95 CI, 0.013-0.105; ayarlanmış P = .04) ve doğruluğa (0.036;% 95 CI) sahip olduğunu doğruladı. , 0.001-0.072; P = .05) ayarlamadan sonra. Bir bütün olarak, kayıtlı radyologların performans iyileştirmeleri, ek bilgilerin eTable 2'sinde verilmiştir.

Klinisyenler tarafından yapılan her bir inceleme için mikro ortalama tanı süresi 57.04 saniyeydi (% 95 CI, 54.58-59.50 saniye). Her bir klinisyenin zamanı ek eTable 3'te gösterilmektedir ve her kişi için tanı süresinin değişmesi eFigure 2'de gösterilmektedir. İyileştirme ile ortalama tanı süresi istatistiksel olarak önemli ölçüde azalmadı (5.71 saniye;% 95 CI, -7.22-18.63 saniye; ayarlanmış P = .19). Modelin incelemeyi işlemek ve segmentasyon haritasını çıkarmak için ortalama 7,58 saniyeye (% 95 CI, 6,92-8,25 saniye) ihtiyacı vardır.

Her bir klinisyenin gerçek pozitif ve yanlış pozitif sonuçlarını ve gerçek negatif ve yanlış negatif sonuçlarını (model geliştirmeli veya geliştirmeden) raporlayan kafa karışıklığı matrisi ek eTable 4'te verilmiştir.

Klinisyenlerin görüşüne göre, 0,060'lık istatistiksel olarak anlamlı bir artış vardır (düzeltilmiş P = .05), güçlendirmesiz kesin Fleiss 0,799'dur ve artış 0,859'dur. Kayıtlı radyologlar için, puanlayıcı güvenilirlikleri 0,063 arttı, güçlendirmesiz kesin Fleiss 0,783 ve geliştirme 0,847 oldu.

tartışmak

Bu çalışmada, derin öğrenme modelini incelemek için klinisyenlerin serebral anevrizmaları tespit etmek için CTA kullanma becerisini geliştirmek için bir çapraz çalışma tasarımı benimsedik. Modelin geliştirilmesi ile klinisyenlerin duyarlılığı, doğruluğu ve puanlayıcı güvenilirliği önemli ölçüde artmıştır. Özgünlük ve tanı süresinde istatistiksel fark yoktu.

Anevrizma rüptürü riskini kaçırmanın potansiyel olarak yıkıcı sonuçları göz önüne alındığında, doktorların, klinisyen performansını güvenilir bir şekilde tespit edip artırabilen otomatik bir tespit aracına büyük ihtiyaçları vardır. Anevrizma rüptürü hastaların% 40'ında ölümcüldür ve hayatta kalan hastaların üçte ikisi geri dönüşü olmayan nörolojik disfonksiyona neden olur; bu nedenle, doğru ve zamanında tespit çok önemlidir.

CTA incelemelerini teşhis ederken klinisyenlerin doğruluğunu önemli ölçüde artırmanın yanı sıra, otomatik anevrizma tespit araçları (bu çalışmada sağlananlar gibi), iş akışına öncelik vermek için de kullanılabilir, böylece bunların pozitif olma olasılığı daha yüksektir. Muayene zamanında uzman tanı alabilir, bu da tedavi süresini kısaltabilir ve daha olumlu sonuçlar elde edebilir.

Anevrizmaların teşhisinde klinisyenler arasında önemli farklılıklar iyi belgelenmiştir ve genellikle deneyim eksikliği veya uzmanlık altı nöroradyoloji eğitimi, karmaşık nörovasküler anatomi veya anevrizmaları tanımlamanın emek-yoğun doğasına atfedilir. Çalışmalar, CTA tabanlı anevrizma tespitinin skorlayıcı güvenilirliğinin büyük ölçüde değiştiğini göstermiştir.Arası değerlendirme güvenilirlik indeksi 0.37 ile 0.856 arasında değişmektedir Değerlendirme seviyesi, anevrizmanın boyutuna ve bireysel radyologların deneyimine göre değişir.

Duyarlılığı ve doğruluğu önemli ölçüde iyileştirmenin yanı sıra, bu modelin klinisyenleri geliştirmek için kullanılması ayrıca puanlayıcının güvenilirliğini 0.799'dan 0.859'a önemli ölçüde artırdı. Bu, model geliştirme yoluyla, farklı deneyim ve uzmanlık düzeylerine sahip klinisyenlerin daha doğru ve tutarlı radyolojik yorumlar üretebileceği anlamına gelir.

Şu anda, CTA klinisyenleri tarafından anevrizmanın tespitini iyileştirmek için kullanılan araçlar arasında kemik çıkarma ve intrakraniyal vaskülatürün 3 boyutlu görüntülenmesi yer alır; bu, serebrovasküler sistemi daha iyi göstermek ve yardımcı olmak için 3B oluşturulmuş rekonstrüksiyonlar üretmek için kontrast eşiği ayarlarının uygulanmasına dayanır. Anevrizma tespiti. Bununla birlikte, bu araçları kullanmak klinisyenler için emek ve zaman yoğundur; bazı kurumlarda bu süreç, ek maliyetler gerektiren 3B laboratuvarlara taşınır.

Bu çalışmada geliştirilen araç, doğrudan standart DICOM görüntüleyiciye entegre edilmiştir ve yeni bir incelemede bir segmentasyon haritası oluşturmak yalnızca birkaç saniye sürer. Standart iş akışına entegre edilirse, teşhisin maliyeti ve süresi büyük ölçüde azaltılabilir, bu da daha etkili tedaviye ve daha olumlu hasta sonuçlarına yol açabilir.

Derin öğrenme, son zamanlarda klinik görüntülere dayalı çeşitli tanıma görevlerinde başarıya ulaştı. Çalışmalar, iki boyutlu sinir ağının intrakraniyal kanamayı ve CT kafa incelemesinde kitle etkileri veya kafatası kırıkları gibi diğer akut beyin belirtilerini tespit etmede güçlü bir performansa sahip olduğunu göstermiştir.

Yakın zamanda, bir çalışma, derin öğrenmenin manyetik rezonans anjiyografiye dayalı serebral anevrizmaların teşhisinde potansiyel rolünü inceledi.

Başka bir çalışma, diz MRG çalışmalarını yorumlarken, klinisyenlere ön çapraz bağ yırtıklarını tespit etme özgüllüğünü artıran derin öğrenme modeli tahminleri sağladığını gösterdi.

Bildiğimiz kadarıyla, bu çalışmadan önce, derin öğrenme, serebral anevrizmaları tespit etmek için birinci basamak bir görüntüleme modu olan CTA'ya uygulanmadı. Araştırma sonuçlarımız, derin öğrenme segmentasyon modellerinin güvenilir ve yorumlanabilir tahminler üretebileceğini, klinisyenleri geliştirebileceğini ve teşhis performanslarını iyileştirebileceğini göstermektedir. Bu çalışmada uygulanan ve test edilen model, klinisyenlerin duyarlılığını, doğruluğunu ve serebral anevrizmaları saptamak için CTA kullanımında farklı deneyime sahip profesyonel doktorlar tarafından yapılan incelemelerin güvenilirliğini önemli ölçüde artırmıştır.

Sınırlamalar

Elbette bu çalışmanın sınırlılıkları var. Birincisi, çalışma sadece rüptüre olmayan anevrizmalara odaklandığından, modelin anevrizma rüptüründen sonra anevrizma tespitindeki performansı, sarmal veya cerrahi klipslemeden sonra lezyonların nüksetmesi veya arteriyovenöz malformasyonlarla ilgili anevrizmalar üzerinde çalışılmamıştır.

İkinci olarak, cerrahi donanım veya ekipmanın etkisi hariç tutulduğundan, bu etkiler etkilendiğinde modelin performansı bilinmemektedir. Klinik ortamda, BTA genellikle sadece anevrizma tespiti için değil, birçok vasküler hastalığı değerlendirmek için kullanılır. Bu nedenle, test setindeki yüksek anevrizma prevalansı ve klinisyenin ikili görevi testte yanlılığa neden olabilir.

Ayrıca bu çalışma, tek bir üçüncü basamak hemşirelik akademik kurumundan gelen veriler üzerinde yapılmıştır.Farklı tarayıcılar ve görüntüleme protokolleri (farklı dilim kalınlıkları gibi) ile diğer kurumlardan gelen verilere uygulandığında iyi performans göstermeyebilir. verim.

sonuç olarak

Bu çalışma, intrakraniyal anevrizmaların otomatik tespiti için CTA tabanlı bir derin öğrenme modeli oluşturdu. Modelin klinisyenlerin duyarlılığını, doğruluğunu ve değerlendiriciler arası güvenilirliğini önemli ölçüde geliştirdiğini bulduk. Gelecekteki çalışmalar, bu modelin performansını daha fazla araştıracak ve diğer kurum ve hastanelerden gelen verileri uygulayacaktır. Lei Feng Ağı Lei Feng Ağı

PyTorch Hub: Turing Ödülü sahibi Yann LeCun şiddetle tavsiye edilir! Temel modelleri tek bir kod satırında kolayca yeniden oluşturun
önceki
Uber hava taksisini gösteriyor; Gree basın toplantısı tüm raporu geri getirecek; telefon kılıfı yeni iPhone'un görünümünü ortaya koyuyor Lei Feng Zaobao
Sonraki
Xiaomi, AI eğitim donanımına girdi: Xiao Ai sonunda "öğretmen" oldu
Perde arkasındaki iki Google kurucusu aniden ortaya çıktı
Polonya'daki Wroclaw Üniversitesi Konfüçyüs Enstitüsü ikinci Şakayık Festivali'ni düzenledi
"Çin 2019 Dünya Filateli Sergisi" ilk gün kapağı yayınlandı, Wuhan öğeleri tüm ülkeye uçtu
Temi robotu Asya Tüketici Elektroniği Fuarı'nda göründü, en çok istediğiniz kişisel robot olabilir
Kriz bir dönüm noktası, Tencent ve Ali LoRa'ya girdiklerinde ne yaptılar?
Kaybolan gradyan sorunu: sorunlar, nedenleri, anlamları ve çözümleri
Emniyet güçleri güzellik salonuna baskın düzenledi, kadın panik içinde pencereden tıbbi ekipmanı fırlattı.
Damadı 100 kilometreden fazla yol kat etti ve kayınpederini "kaybettiğini" gördü Netizen: Sen bitirdin.
Yangtze Nehri boyunca uzanan sekiz il ve iki şehirden uzman temsilcileri, Yangtze Nehri'nin korunması ve su teknolojisinin gelişimi hakkında görüşmek üzere Wuhan'da bir araya geldi.
ABD yetkilileri, Huawei üzerindeki yasağın uzatılmasını talep ediyor; Salesforce, 15,7 milyar dolarlık gişe rekorları kıran bir satın alma duyurdu; Tencent, rütbe sistemini yeniden düzenledi | Lei Fe
Şempanze eti Birleşik Krallık'ta bir lüks ve incelik haline geldi mi? Uzmanlar uyardı: Ayrım gözetmeyen yemek, AIDS enfeksiyonuna neden olabilir
To Top