Turing Ödülü sahibi LeCun, Google'ın meme kanseri AI tezini kullandı, bu kadar sıra dışı olan ne?

2020'nin ilk gününde Google, tıp alanında büyük bir haberi açıkladı: Google'ın sağlık departmanı ve DeepMind, en iyi akademik dergi "Nature" da yapay zeka meme kanseri tespit sistemini birlikte yayınladı.

Bu sistemin en önemli özelliği, önceki modele kıyasla, bu modelin meme kanserinin yanlış tanınmasını veya ihmalini etkili bir şekilde azaltması, yanlış pozitif meme kanseri tespit oranını% 5,7 ve yanlış negatif oranını% 9,4 oranında azaltmasıdır. .

Yazar, sistemin meme kanserini tespit etme becerisinin profesyonel radyologlarınkini aştığını ve meme kanseri taramasının doğruluğunu ve etkinliğini artırmaya yardımcı olabileceğini iddia ediyor.

Ancak bir gün sonra, derin öğrenmenin "Büyük Üçlüsü" nden biri olan LeCun, bu sonuca ateş açtı. Leifeng.com da konuyla ilgili olarak şunları bildirdi: "İstasyon bir gün sonra yıkıldı mı? LeCun, Google'ın "Nature" göğüs kanseri yapay zeka araştırma sonuçlarını "kamuoyuna sorguladı

Google'ın makalesinin sonuçlarının New York Üniversitesi ekibi tarafından Ekim 2019'da yapıldığını ve Google'ın New York Üniversitesi'nin araştırmasına atıf yapması gerektiğini, çünkü sonuçların daha iyi olduğunu söyledi.

Etkisi ne kadar iyi? Google Paper AI sistemindeki AUC 0,889 (İngiltere) ve 0,8107 (ABD) ve New York Üniversitesinin EAAı 0,895e ulaşır.

Başka bir bilim adamı Hugh Harvey de LeCun'u aradı. Google çalışmasının 6 radyolog içerdiğini, NYU çalışmasında ise 14 radyolog kullanıldığını söyledi.

Leifeng.com AI Nuggets Academic Group, bu küçük akademik "kargaşaya" odaklanan bu makaleyi New York Üniversitesi'nden derleyip düzenledi. Bu "bir adım önde" makalenin esasına bir göz atalım mı?

Aşağıdakiler, makalenin ayrıntılı içeriğidir: AI Nuggets resmi hesabını takip edin ve orijinal PDF'yi almak için iletişim kutusundaki "New York Üniversitesi" anahtar kelimesini yanıtlayın.

Özet

Göğüs kanseri tarama muayenelerinin sınıflandırılması için, 200.000'den fazla meme muayenesine (1.000.000'den fazla görüntü) dayalı olarak eğitilen ve değerlendirilen derin bir kıvrımlı sinir ağı öneriyoruz. Popülasyonu tararken, ağımızın meme kanseri varlığını tahmin etmede AUC'si 0,895'e ulaştı.

Yüksek doğruluk oranını aşağıdaki teknolojik gelişmelere bağlıyoruz:

1. Ağ, yenilikçi bir şekilde mimari ve eğitim sürecinin iki farklı aşamasına bölünmüştür.Piksel düzeyindeki etiketlerden öğrenmek için yüksek kapasiteli yama düzeyinde bir ağ kullanırken, göğüs düzeyinde etiketleri bir bütün olarak öğrenmek için başka bir ağ kurarız.

2. Modelimizin yapı taşı olarak kullanılan ResNet'e dayalı özel bir ağ ve derinlik ve genişlik dengesi yüksek çözünürlüklü medikal görüntüler için optimize edilmiştir.

3. Ağı, büyük etiket gürültüsü ile ilgili bir görev olan BI-RADS sınıflandırması konusunda önceden eğitin.

4. Birden çok girdi görünümünü, birçok olası seçenek arasından en iyi şekilde birleştirin. Modelimizi doğrulamak için filmi okumak üzere 14 radyolog organize ettik ve her doktor 720 mamografi görüntüleme görüntüsünü izledi. Sonuçlar, modelimizin deneyimli bir radyoloğun yargısı kadar doğru olduğunu göstermektedir.

Ek olarak, radyoloğun kötü huylu tümörler hakkındaki yargılarının ve sinir ağımızın tahmin sonuçlarının ortalamasını alan hibrit model daha doğrudur. Modeli https://github.com/nyukat/breast_cancer_classifier adresinde herkese açık olarak yayınlayacağız.

Giriş

Meme kanseri, Amerikalı kadınlarda kansere bağlı ölümlerin ikinci önde gelen nedenidir. 2014 yılında Amerika Birleşik Devletleri 39 milyondan fazla tarama ve mamografi tanı testi gerçekleştirdi. 2015 yılında 232.000 kadına meme kanseri teşhisi konduğu ve yaklaşık 40.000 kadına meme kanserinden öldüğü tahmin edilmektedir.

Mamografi, meme kanseri mortalitesini azaltabilen tek görüntüleme yöntemi olmasına rağmen, herkes bu taramanın olası zararlarını tartışıyor, yanlış pozitifler ve yanlış pozitiflerin neden olduğu biyopsiler de dahil. Kadınların% 10-15'inin daha fazla açıklama için belirtilmemiş bir mamogramdan sonra başka bir muayene ve / veya ultrasona girmesi gerekir. Ek görüntüleme testlerinden sonra birçok kadının iyi huylu olduğu belirlenir ve iğne biyopsisi için sadece% 10-20 önerilir. Bunların arasında, insanların sadece% 20-40'ına kanser teşhisi konmuştur.

Açıkçası, rutin meme kanseri taramasını daha doğru hale getirmemiz ve kadınların vücuduna verilen zararı azaltmamız gerekiyor.

Çok merkezli çalışmalar, geleneksel bilgisayar destekli teşhis prosedürlerinin teşhisi iyileştiremediğini göstermesine rağmen, radyologlar bunu görüntü yorumlamaya yardımcı olmak için hala kullanıyor. Derin öğrenmenin, özellikle de derin evrişimli sinir ağlarının (CNN) geliştirilmesi, yeni nesil CAD benzeri araçlar oluşturma olanağı sağlar.

Bu makalenin amacı, radyologların meme kanseri tarama görüntülerini yorumlamasına yardımcı olacak sinir ağları geliştirmektir.

(I) Küresel ve yerel bilgileri birleştiren ve uygun eğitim yöntemlerini benimseyen yeni bir iki aşamalı sinir ağı öneriyoruz. Bu, piksel düzeyindeki etiketleri öğrenmek için çok yüksek kapasiteli yama düzeyinde bir ağ kullanırken, göğüs düzeyinde etiketleri bir bütün olarak öğrenmek için başka bir ağ kullanmamıza olanak tanır. Bu strateji sayesinde, modelimiz yalnızca insanlarla karşılaştırılabilir rekabetçi sonuçlar elde etmekle kalmaz, aynı zamanda şüpheli keşiflerin yerini gösteren yorumlanabilir bir ısı haritası üretir. Ayrıca, çok sayıda görüntü düzeyinde etiketimiz olsa bile piksel düzeyindeki etiketlerin kullanışlılığını da kanıtladık.

(İi) 1.000.000'den fazla yüksek çözünürlüklü mamografi görüntüsü kullanarak ağı eğitmenin ve değerlendirmenin fizibilitesini kanıtladık (bu, yalnızca meme kanseri taraması için değil, tıbbi görüntülemede de çok büyük bir veri kümesidir) Seks. Bu, gelecekteki araştırma ve tasarım için ve bu yöntemin konseptini ve değerini göstermesi açısından büyük değer taşır.

(Iii) Ağımızın yapı taşı olarak kullanılmak üzere tıbbi görüntüleme için özel olarak tasarlanmış yeni bir ResNet varyantı öneriyoruz. Derinliği ve genişliği dengeleyerek modelin makul bellek tüketimini korurken çok büyük görüntüleri işlemesine izin veriyor .

(Iv) Daha yüksek gürültü ile ilgili görevler (BI-RADS sınıflandırması) ile ağın önceden eğitilmesinin faydasını değerlendirdik ve bunun boru hattının çok önemli bir parçası olduğunu ve modelimizin performansını önemli ölçüde artırdığını gördük. Bu, çoğu veri setinin küçük olduğu tıbbi görüntüleme çalışmalarında özellikle önemlidir.

(V) Farklı mamografi görünümlerini tek bir sinir ağında birleştirmenin birden çok yöntemini değerlendirdik. Tıbbi görüntüleme görevlerinin genellikle birden fazla girdisi olmasına rağmen, daha önce böyle bir analiz bulamadık.

veri

Retrospektif çalışmamız Kurumsal İnceleme Kurulu tarafından onaylandı ve Sağlık Sigortası Taşınabilirlik ve Sorumluluk Yasası ile uyumludur. Bu veri seti, önceki çalışmamızda kullanılan veri setinin daha büyük, daha ayrıntılı bir versiyonudur.

Veri seti, 141473 hastadan 229426 dijital mamografi taramasını (1001093 görüntü) içerir. Her muayene, mamografide kullanılan 4 standart görünüme karşılık gelen en az 4 görüntü içerir: R-CC, L-CC, R-MLO ve L-MLO. Veri setindeki görüntüler dört tip tarayıcıdan gelmektedir: Mammomat Inspiration (% 22,81), Mammomat Novation DR (% 12,65), Lorad Selenia (% 40,92) ve Selenia Boyutlar (% 23,62) Şekil 1 bazı inceleme örneklerini göstermektedir.

Hastanın her bir memesinin kötü huylu veya iyi huylu bulguları olup olmadığını belirlemek için biyopsi patoloji raporlarına güveniyoruz. Göğüs röntgeni taramasından sonraki 120 gün içinde en az bir biyopsiyi tamamlamış 5832 muayenemiz var. Biyopsi 985 vakanın (% 8.4) malign, 5556 vakanın (% 47.6) benign ve 234 vakanın (% 2.0) hem benign hem de malign olduğunu doğruladı.

Biyopsi ile eşleşen tüm incelemeler için, bir grup radyologdan biyopsi lezyonunun yerini piksel düzeyinde geriye dönük olarak göstermelerini istedik (ilgili patoloji raporlarını sağlayın).

İncelemelerin yaklaşık% 32,8'inin gizli olduğunu, yani biyopsi lezyonlarının mamografide görünmediğini ve diğer görüntüleme yöntemleri (ultrason veya MRI) kullanılarak tanımlandığını bulduk. Ayrıntılar için Tablo 1'e bakın.

Tümör sınıflandırması derin CNN ağı

Bazı memeler hem kötü huylu hem de iyi huylu lezyonlar içerir. Meme kanseri taramasını sınıflandırmak için çok görevli bir sınıflandırma modeli kullanıyoruz. Diğer bir deyişle, her meme için iki ikili etiket veriyoruz: memede malign bulguların varlığı / yokluğu (yR, m ve yL, m olarak belirtilir) ve memede iyi huylu bulguların varlığı / yokluğu (yR, b ve yL, b). Sol ve sağ memeleri ekleyerek, her muayene için 4 etiket vardır. Amacımız, her bir etikete karşılık gelen dört tahmin (yR, m, yL, m, yR, b ve yL, b ile gösterilir) üretmektir.

Esas olarak kötü huylu lezyonların varlığını veya yokluğunu tahmin etmekle ilgilenmemize rağmen, iyi huylu lezyonların varlığını veya yokluğunu tahmin etmek model öğrenme görevlerinin ayarlanmasına yardımcı olmada önemli bir rol oynar. Giriş olarak dört standart mamografi görünümüne karşılık gelen dört yüksek çözünürlüklü görüntü alıyoruz (xR-CC, xL-CC, xR-MLO ve xL-MLO ile temsil edilir).

CC görünümü için, her bir görüntüyü 2677 × 1942 piksellik sabit bir boyuta, MLO görünümü için ise 2974 × 1748 piksele kırpıyoruz. Şematik bir diyagram için, Şekil 3'e bakın.

Model yapısı ve eğitim

Geras ve diğerlerinin önceki çalışmasından esinlenerek, Şekil 5'te gösterilen dört farklı çoklu görüntülü CNN yapısını eğittik. Tüm bu ağlar, iki çekirdek modülden oluşur: (i) dört görünüme özgü sütun, her sütun, her mamografi görünümü için sabit boyutlu bir gizli katman vektörü gösterimi veren ResNet mimarisine dayanır; (ii) Tamamen bağlı iki katman, hesaplanan gizli katman vektörünü çıktı tahminiyle eşler. Bu modeller, nihai tahmini oluşturmak için orta katmanı tüm görünümlerden nasıl bir araya getirdiklerine göre farklılık gösterir.

Aşağıdaki 4 yolu düşündük.

1) "Görünüm açısından" model (Şekil 5 (a)) sırasıyla L-CC ve R-CC, L-MLO ve R-MLO'yu birbirine bağlar. CC ve MLO görünümleri için ayrı tahminler yapar ve son olarak karşılık gelen tahminlerin ortalamasını alır.

1) "Görüntü bazlı" model (Şekil 5 (b)), dört görünümün her birini bağımsız olarak tahmin eder. Karşılık gelen tahminlerin nihayet ortalaması alınır.

2) "Yan-bilge" modeli (Şekil 5 (c)) önce L-CC ve L-MLO ile R-CC ve R-MLO'yu birbirine bağlar ve ardından her memeyi ayrı ayrı tahmin eder.

3) 'Ortak' model (Şekil 5 (d)) dört görüşü birbirine bağlar ve iki memenin kötü huylu ve iyi huylu olasılıklarını birlikte öngörür.

Tüm modellerde, her görünüm için 256 boyutlu gizli katman vektörünü hesaplamak üzere orta katman olarak dört ResNet tabanlı 22 katmanlı ağ (ResNet-22) kullanıyoruz. Standart ResNets ile karşılaştırıldığında, bu ağ farklı bir derinlik ve genişlik oranına sahiptir ve çok yüksek çözünürlüklü görüntüler için kullanılabilir.

Doğrulama setinde "görünüm" modelinin kötü huylu / kötü huylu olmayanların en doğru öngörücüsü olduğunu bulduk. Aksi belirtilmedikçe, bundan sonra bahsettiğimiz şey bu modelin sonucudur.

A. Tek ResNet-22

ResNet-22'nin tam mimarisi Şekil 4'te gösterilmektedir. L-CC ve R-CC ResNets, L-MLO ve R-MLO ResNets ağırlıkları paylaşır. Modele girmeden önce L-CC ve L-MLO görüntülerini çevirdik, böylece tüm göğüs görüntüleri sağa dönük olacak ve paylaşılan ResNet ağırlıklarının görüntüler üzerinde aynı yönde çalışmasına izin verdik. Her ResNet'in ara çıkışı, H × W × 256 boyutlu bir tensördür, burada H ve W orijinal giriş boyutundan aşağı örneklenir, CC görünümü H = 42, W = 31, MLO görünümü H = 47, W = 28. Her görünüm için 256 boyutlu gizli vektörler elde etmek için vektörlerin uzamsal boyutlarda ortalamasını alıyoruz.

Referans için, Tablo 2'de her ResNet-22 katmanından sonra orta vektörün boyutluluğunu gösteriyoruz. Mamografiye standart Yeniden Ağları uygulamanın ana nedeni, görüntüleri ileriye dönük işlemlere ve gradyan hesaplamalarına uyacak şekilde GPU kısıtlamaları altında aşağı örneklemeye gerek kalmadan çok yüksek çözünürlükte işleme ihtiyacıdır.

B.Yardımcı yama seviyesi sınıflandırma modeli ve ısı haritası

Görüntünün yüksek çözünürlüğü ve GPU'nun sınırlı belleği, giriş olarak tam çözünürlüklü görüntüleri kullanırken modelde nispeten sığ bir resnet kullanmamızı sınırlar. Mamogramlarda ince ayrıntılardan daha fazla yararlanmak için, 256 × 256 piksel mamogramları sınıflandırmak ve belirli bir yamada kötü huylu ve iyi huylu lezyonlar olup olmadığını tahmin etmek için yardımcı bir model eğittik.

Bu yamaların etiketleri klinisyenler tarafından manuel olarak çizilir. Bu modele, önceki bölümde anlatılan tüm meme görüntüsünde çalışan meme seviyesi modelinden farklı olarak yama seviyesi modeli diyoruz.

Tam çözünürlüklü mamogram görüntüsünü, her bir görüntünün iki ısı haritasını oluşturmak için kayan pencere yönteminde yardımcı ağ ile tararız (Şekil 6 bir örnektir), biri her pikselde kötü huylu lezyon olasılığını, diğeri ise temsil eder. Piksel başına iyi huylu lezyon olasılığı. Toplamda sekiz ek görüntü elde ettik: Xm R-CC, Xb R-CC, Xm L-CC, Xb L-CC, Xm R-MLO, Xb R-MLO, Xm L-MLO, Xb L-MLO. Bu yama sınıflandırması ısı haritaları, tamamlayıcı ayrıntılı bilgi sağlamak için göğüs düzeyinde modeller için ek giriş kanalları olarak kullanılabilir.

B. BI-RADS sınıflandırması eğitim öncesi

Veri setimizde görece az sayıda biyopsi kontrolü olduğundan, modelin sağlamlığını ve performansını iyileştirmek için transfer öğrenimi uyguluyoruz. Transfer öğrenimi, hedef modeli eğitmek için başlangıç noktası olarak başka bir görevde önceden eğitilmiş modelin bir bölümünü yeniden kullanır.

Modelimiz için, BI-RADS sınıflandırma görevleri için önceden eğitilmiş bir ağdan öğrenmeyi aktarıyoruz. Değerlendirdiğimiz üç BI-RADS kategorisi şunlardır: kategori 0 ("anormal"), kategori 1 ("normal") ve kategori 2 ("zararsız"). Bazı çalışmalar bu etiketleri çıkarmak için kullanılan algoritmaları açıklamaktadır. Bu etiketler biyopsi sonuçlarından daha gürültülü olsa da (klinisyenin biyopsi yoluyla elde edilen bilgiler değil, mamogramlara dayalı değerlendirmesi), eğitim setinde biyopsi ile doğrulanan 4844 incelemeye kıyasla 99.528 Biyolojik İndikatörümüz var. -RADS etiketinin eğitim örnekleri.

Sinir ağlarının, gürültülü etiketlerle eğitildiğinde bile makul performans seviyelerine ulaştığı kanıtlanmıştır. BI-RADS etiketleriyle öğrenilen bilgileri kanser sınıflandırma modeline aktarmak için bu özelliği kullanıyoruz. Deneylerimiz, BI-RADS sınıflandırma eğitim öncesi ağının modelimizin performansına önemli bir katkısı olduğunu göstermektedir (bkz. Bölüm V-E). BI-RADS eğitim öncesi ağ yapısı Şekil 7'de gösterilmektedir.

deney prosedürü

Tüm deneylerde, model parametrelerimizi ayarlamak için eğitim setini ve modelin hiperparametrelerini ve eğitim sürecini optimize etmek için doğrulama setini kullanırız. Aksi belirtilmedikçe, tümü tarama popülasyonunun hesaplanan sonuçlarıdır. Sonuçlarımızı daha da iyileştirmek için, entegre bir genel tahmin üretmek için birkaç farklı modelin tahminlerinin ortalamasını almak için model entegrasyon teknolojisini kullandık.

Deneyimizde, her modelin beş kopyasını eğittik ve ağırlıklar tam bağlantılı katmanda farklı şekilde başlatıldı ve kalan ağırlıklar BI-RADS sınıflandırmasındaki önceden eğitilmiş modelin ağırlıklarıyla başlatıldı. .

A. Test popülasyonu

Aşağıdaki deneyde, farklı hipotezleri test etmek için modelimizi birkaç farklı popülasyon üzerinde değerlendiriyoruz: (i) alt örnekleme olmaksızın test setindeki tüm incelemeler dahil tarama popülasyonu; (ii) biyopsi alt popülasyonu , Bu, yalnızca biyopsi geçiren meme tarama popülasyonunun incelenmesini içeren tarama popülasyonunun bir alt kümesidir; (iii) Biyopsi alt grubu ve herhangi bir lezyon olmaksızın tarama popülasyonunun rastgele örnekleme alt kümesi dahil olmak üzere okuma çalışmasının alt grubu.

B.Değerlendirme göstergeleri

Modelimizin performansını esas olarak meme kötü huylu / kötü huylu olmayan ve iyi huylu / iyi huylu olmayan sınıflandırma görevleri için AUC'ye (ROC eğrisi altındaki alan) göre değerlendiriyoruz. Okuma araştırma modeli ve okuyucuların görüntü sınıflandırma performansı, radyologların performansını değerlendirmek için yaygın olarak kullanılan göstergeler olan AUC ve PRAUC'ye göre değerlendirilir.ROC ve PRAUC, tahmin modelinin farklı yönlerinin performansını temsil eder.

C. Tarama popülasyonu

Bu bölüm popülasyonun taranmasının sonucudur.Farklı modellerin sonuçları Tablo 3'te gösterilmiştir. Genel olarak, dört modelin AUC'si yüksektir ve temelde aynıdır. 'Görüş açısından' görüntü ve ısı haritaları topluluk modeli, yapı olarak eğitim öncesi aşamada kullanılan BI-RADS modeline en çok benzerdir ve kötü huylu / kötü huylu olmayanları tahmin etmede en iyi performansı gösterir. Tarama popülasyonunun EAA değeri 0.895'tir ve biyopsi popülasyonu AUC 0,850'dir.

Bununla birlikte, iyi huylu / zararsız tahmin açısından, diğer bazı modeller gerçekten de "görüş açısından" topluluk modelinden daha üstündür. Yalnızca görüntü girişi olan dört modelin performansı kabaca aynıdır ve bu, görüntü ve ısı haritaları modelinden daha düşüktür. Kötü huylu / kötü huylu olmayan sınıflandırmada, görüntü ve ısı haritaları modeli, iyi huylu / iyi huylu olmayan sınıflandırmaya göre daha güçlü bir gelişmeye sahiptir.

Ayrıca, birleştirme işleminin tüm modellerde faydalı olduğunu ve bunun da AUC'de küçük ve istikrarlı bir iyileşmeye yol açtığını gördük.

Görüntü ve ısı haritaları modelinin dört değişken modelinin entegrasyonundan sonra, tarama popülasyonundaki iyi huylu / iyi huylu olmayan tahmin görevleri için AUC 0.778 ve kötü huylu / kötü huylu olmayan tahmin için EAA 0.899'dur. Bu performans herhangi bir tek modelden daha iyi olsa da, pratikte 20 bağımsız modelden oluşan bu kadar büyük bir grubu çalıştırmak çok pahalı olacaktır.

D. Biyopsi alt popülasyonu

Biyopsi popülasyonundaki modelin değerlendirme sonuçlarını Tablo 3'ün sağ yarısında gösteriyoruz. Test setimizde 339'u iyi huylu, 45'i kötü huylu ve 17'si her ikisi de olmak üzere 401 göğüs var. Biyopsi alt popülasyonu, genel tarama popülasyonundan farklıdır Genel tarama popülasyonu, diğer görüntüleme veya biyopsi olmaksızın her yıl rutin taramaya giren sağlıklı bireylerdir. Tarama popülasyonunun sonuçlarıyla karşılaştırıldığında, biyopsi popülasyonundaki tüm modellerin AUC'si önemli ölçüde daha düşüktü.

Biyopsi alt grubunda, yalnızca görüntü modeliyle görüntü ve ısı haritaları modeli arasında tutarlılık farkı gözlemledik. Görüntü ve ısı haritaları topluluk modeli, 0,850 AUC ile kötü huylu / kötü huylu olmayan sınıflandırmada en iyi performansı gösterdi ve ayrıca 0,696'lık AUC ile iyi huylu / iyi huylu olmayan sınıflandırmada en iyi performansı gösterdi. Taranan popülasyonla karşılaştırıldığında, biyopsi alt grubu tarafından elde edilen AUC önemli ölçüde daha düşüktü ve bu, hem radyologlar hem de modelimiz için zorlayıcı olan daha fazla görüntüleme ve biyopsi meme görüntülerine duyulan ihtiyaçla açıklanabilir.

E. BI-RADS ön eğitiminin önemi

BI-RADS ön eğitiminin faydalarını, modelimizin performansını BI-RADS ön eğitim modelinin ağırlıkları olmadan eğitilmiş bir kanser sınıflandırma modeli ile karşılaştırarak değerlendiriyoruz Sonuçlar Tablo 3'te gösterilmektedir (* ile işaretlenmiştir).

Okuma Araştırması

Görüntü ve ısı haritaları topluluk modelimizin (bundan sonra model olarak anılacaktır) performansını radyologlarla karşılaştırmak için, farklı deneyim seviyelerine sahip 12 radyolog olmak üzere 14 hekim üzerinde bir görüntü okuma çalışması yürüttük. (2-25 yaş), bir asistan doktor ve bir tıp öğrencisi, test setinden 740 muayene okudu (1480 göğüs): biyopsi alt grubundan rastgele seçilen 368 muayene ve biyopsi grubundan 372 muayene Eşleşen kontroller arasından rastgele seçilen bir kontrol. Doktorların her meme için% 0-% 100 ölçeğinde malignite olasılığını tahmin etmeleri istenir.

Bazı memeler birden fazla şüpheli bulgu içerdiği için hekimlerden en şüpheli buldukları lezyonları değerlendirmeleri istenir. Modelimizin EAA değeri 0.876 ve PRAUC 0.318'dir. Hekimin EAA değeri 0,705 ile 0,860 (ortalama: 0,778, standart değer: 0,0435) ve PRAUC'ler 0,244 ile 0,453 arasında değişmiştir (ortalama: 0,364, standart sapma: 0,0496). Şekil 8 (a) ve Şekil 8 (c), tek bir ROC ve kesinlik-geri çağırma eğrisini ve ortalama değerini göstermektedir.

Ayrıca tahminleri radyolog ile modelin tahminlerinin doğrusal bir kombinasyonuna dayanan insan-makine hibrit modelinin doğruluğunu da değerlendirdik. Karışık modelin ortalama AUC'si 0,891 (standart sapma: 0,0109) ve ortalama PRAUC 0,431 (standart sapma: 0,0332) (bkz. Şekil 8 (b), Şekil 8 (d)).

Bu sonuçlar, modelimizin radyologların meme kanseri tarama muayenelerini okumalarına yardımcı olacak bir araç olarak kullanılabileceğini ve deneyimli meme radyologlarına kıyasla görevin farklı yönleri hakkında bilgi sağladığını göstermektedir. Ek materyalin I-G-1 bölümünde, modeli radyoloğun belirli bir muayene için tahminleriyle karşılaştıran kalitatif bir analiz bulunabilir.

Sonuç ve tartışma

Göğüs seviyesinde ve piksel seviyesinde etiketlere sahip geniş bir eğitim seti kullanarak, meme kanseri mamografisini doğru bir şekilde sınıflandırabilen bir sinir ağı oluşturduk. Bu başarıyı, meme seviyesi modeli için ek bir giriş kanalı olarak bir ısı haritası oluşturmak için giriş görüntüsüne uygulanan yama seviyesi modelinde kapsüllenmiş çok sayıda hesaplamaya bağlıyoruz. Halihazırda mevcut olan donanımı kullanarak bu modeli uçtan uca eğitmek imkansızdır.

Sonuçlarımız tatmin edici olsa da, deneylerimizde kullanılan test seti nispeten küçüktür ve sonuçlar daha fazla klinik doğrulama gerektirir.

Ek olarak, Modelimiz, görüntü okuma ve araştırmanın belirli görevlerinde radyologlardan daha iyi performans gösterse de, radyologlar tarafından gerçekleştirilen görevler bundan daha fazlasıdır. Normal şartlar altında mamografi tanı sürecinde sadece ilk adımdır ve radyolog ancak diğer görüntüleme incelemelerini birleştirdikten sonra nihai kararı verebilir.

ancak, Çalışmamızda, sinir ağı ve radyologların karma modeli bu iki modelden daha iyidir, bu da bu modeli kullanmanın radyologların meme kanseri tespitine duyarlılığını artırabileceğini göstermektedir.

Öte yandan, model tasarımımız nispeten basittir ve daha karmaşık ve doğru modeller hakkında daha fazla araştırma yapılması umudu vardır. Modelin klinik deneylerde meme mamografisini okumadaki yararlılığını test etmenin yanı sıra, bir sonraki net hedef, radyolog lezyonu görmeden bile meme kanserinin gelişimini tahmin etmektir. Lei Feng Ağı Lei Feng Ağı

2019 Zhiyuan · Zhihu Kanshan Kupası Algoritma Yarışması sonuçlandı: 7 takım öne çıkıyor ve tek takım tacı kazandı
önceki
Weifang ve Qingzhou: vatandaşlar kendiliğinden yas tutuyor
Sonraki
Kahraman ruh sonsuza kadar yaşayacak, ruh sonsuza kadar yaşayacak! Kahramanın hikayesini bugün dinleyin
Bugün Jinan hava savunma alarmını tekrar çaldı! Neden daha önce 22 kez ses çıkardı?
Jinan vatandaşları Ching Ming Festivali'nde 3 Mayıs Katliamı'nın kurbanlarına çiçek hediye etti
CES 2020'nin en "yararsız" teknoloji ürünleri: akıllı yükseklik kaydedici, tuvalet kağıdı teslim robotu, konuşan duş ...
Prospective Gene Industry Global Weekly Report No. 52: Filipinler, doğrudan tüketim için genetiği değiştirilmiş altın pirincin listelenmesini onayladı
OnePlusın ilk konsept telefonu CES 2020de görücüye çıktı: Kamera, tıpkı turuncu tayt giyen OnePlus 7T Pro gibi kayboluyor
"Aile" ve "şehir" üzerine oynanan bahis akıntıya veya çıkışa karşı mı? Coolpad'in iş fikirlerinin analizi
360, endüstriyel İnternet güvenliği pilotlarını ortaklaşa kurmak için Ecodi ile imzalandı
Today Paper | Stokastik Diferansiyel Denklemler; Akış Otomatik Konuşma Tanıma; Görüntü Sınıflandırma, vb.
Liaocheng'deki tüm birimler ve dönüm noktası binalar, salgınla mücadelede ölen şehitlerin ve ölen yurttaşların yasını tutmak için yarıya indirildi.
Bayrak, Jinan Bahar Şehir Meydanı'nda yarıya indirildi ve vatandaşlar ciddi bir an kaydetti.
Jinan'da önemli bir bina olan Hongjialou Meydanı yarıya indirildi
To Top