Yapay zeka tarafından yakalanan kağıt dolandırıcılığı: makine öğrenimi, yıllık 1 milyar ABD doları zararla 4.000'den fazla kağıt dolandırıcılığı tespit etti

Editör: Craig, Three Stones

Bitirme: Üç Taş

Xin Zhiyuan Rehberi Biyomedikal alanındaki makaleler arasında, AI, yüksek oranda tekrar eden görüntülerin% 9'unu aradı ve makalelerin% 0,59'u sahtekar olarak kabul edildi. Görüntü sahteciliği nedeniyle geri çekilen tıbbi kağıtlar, bir yılda araştırma ve geliştirme maliyetlerinde yaklaşık 1 milyar doları boşa harcayabilir.

"Yazıların tahrif edilmesine karşı savaşın ve bilimsel araştırma adaletini koruyun." Bu bir slogan değil.

Bu yılın Haziran ayında, Stanford Üniversitesi mikrobiyologları, Moleküler ve Hücre Biyolojisi'nde (MCB) 2009'dan 2016'ya kadar yayınlanan 960 makaleyi analiz ettiler ve 59'unun (% 6.1) "uygunsuz" kopya görüntüler içerdiğini tespit ettiler. % 2 görüntü sahteciliği için gitmeye değer .

Bununla birlikte, Stanford Üniversitesi'ndeki mikrobiyologların çalışmaları tamamen manuel çalışmaya dayanıyor ve beş araştırmacı, bu sonucu yaklaşık 1000 makaleden özetlemek için on ele güveniyor.

Şimdi, yapay zekanın müdahalesi, makalelerdeki şüpheli görüntülerin keşfedilme olasılığını büyük ölçüde artırdı. Dikkat çekici bir sonuç, yapay zekanın biyomedikal alandaki makaleleri aramış olmasıdır. Görüntülerin% 9'u son derece tekrarlı ve makalelerin% 0,59'u sahtekar olarak değerlendiriliyor .

Kağıtlardaki görüntü sahtekarlığıyla mücadele etmek için yapay zekayı kullanarak, hala 4000'den fazla tıbbi "sorunlu belge" var

Kağıt görüntü sahtekarlığıyla mücadele etmek için yapay zekayı kullanma çalışması, New York'taki Syracuse Üniversitesi'ndeki makine öğrenimi araştırmacıları tarafından geliştirildi. 760036 makale dahil olmak üzere, 2015 itibariyle PubMed Açık Erişim alt kümesinde (PMOS) yayınlanan tüm verileri analiz ettiler. Makaleler, 2 milyondan fazla veri.

Araştırmacılar, görüntünün yeniden kullanımına uygun olmayan adayları otomatik olarak tespit etmek için bir boru hattı oluşturdular.Ön tespitten sonra, sadece metin olabilecek görüntüleri veya görüntü olarak ifade edilen denklemleri silerek yaklaşık 2 milyon görüntü kaldı.

Daha sonra, araştırmacılar her görüntünün ortalama olarak yaklaşık 1K yüksek entropili anahtar noktaya sahip olduğunu buldular, bu da büyük bir benzerlik algılama problemi yaratıyor.Araştırmacılar bu sorunu çözmek için yaklaşık en yakın komşu algoritmasını kullanıyorlar. Bundan sonra, makine öğrenimi algoritması biyolojik görüntülerin gösterilip gösterilmeyeceğini tahmin eder.

Kopyala-taşı yeniden kullanımını algıla. A. Kanserli hücreler ve azaltılmış parçaların orijinal örneği. B. Anahtar noktaların hesaplanması (yüksek entropi alanı) C. En yakın komşu eşleşmesi. D

Son olarak, uygunsuz yeniden kullanımı değerlendirmek için insanları kullanın.

Algoritma, görüntü alanının yeniden kullanımını algılar ve döndürme, kırpma, yeniden boyutlandırma ve kontrast değişikliklerine karşı dayanıklıdır. Genel olarak, bu çalışma bir sonuca varmıştır: PubMed Açık Erişim hakkındaki makalelerin yaklaşık% 0,59'u oybirliğiyle aldatıcı kabul edilmektedir. Diğer bir deyişle 760036 makalede, Yaklaşık 4484 makalenin dolandırıcılık şüphesi var .

Kağıt görüntüsünün kurcalanması yılda 1 milyar ABD doları kayba neden olabilir

Akademik araştırma makalelerindeki görüntü sahtekarlığı belası çok yaygındır.

Science, iki hafta önce Geri Çekilme Gözlemi ile birlikte bir "geri çekme" raporu yayınladı.Birçok rakam şok edici: Akademik dergiler tarafından geri çekilen makale sayısı son 10 yılda on kat arttı ve en yüksek geri çekme oranına sahip ülke Çin yedinci sırada yer aldı. En çok geri çekme alan 10 yazar arasında Çin ikisini oluşturdu.

Geri çekilmiş ilk 10 yazar (Science'tan veriler)

Geri çekme gözlem veri tabanında, 18.000 araştırma makalesi geri çekildi (en eskisi 1970'lere kadar izlenebilir), bunlardan 317 geri çekilmiş makale tahrif edilmiş ve tüm makalelerin yaklaşık% 1,7'sini oluşturuyor.

Pennsylvania Üniversitesi'nde biyomühendislik profesörü olan Arjun Raj, 2012 gibi erken bir tarihte, ortalama bir biyomedikal araştırma makalesinin arkasındaki bilimsel maliyetin yaklaşık 300.000 ABD Doları ila 500.000 ABD Doları arasında olduğuna dikkat çekti. The Lancet, Amerikalı araştırmacıların o yıl yaklaşık 152.000 makale yayınladığını bildirdi.

Bu hesaplamaya göre, her bir makale 300.000 ABD dolarına mal olsa bile, 2012 yılında Amerikalı araştırmacılar tarafından yayınlanan tüm biyomedikal bilim makaleleri Maliyet de 50 milyar dolara yakın olacak .

Görüntü sahteciliği nedeniyle kağıtların% 2'sinin geri çekilmesi gerekiyorsa, Amerika Birleşik Devletleri 2012'de olabilir Bir milyar dolara yakın bir miktar israf edildi. Bu hesaplamaya dayalı olarak her dokuz yılda bir ikiye katlanan küresel bilimsel çıktıyla, 2012'den beri, geri çekilmelerden kaynaklanan negatif kar marjı daha da büyük olabilir.

Görüntü kurcalama her zaman çok mu kötü?

Bazı araştırmacılar, kağıt görüntülerle kurcalama sorununun yıllar içinde daha da kötüleştiğine inanıyor.

Amerika Birleşik Devletleri Araştırma Bütünlüğü Ofisi'nden (ORI) alınan veriler, Photoshop'un piyasaya sürülmesinden sonra, işledikleri görüntü işlemeyi içeren vakaların oranının arttığını gösterdi.

Kağıt sahtekarlığıyla mücadele sürecinde teknoloji her zaman bir "kedi fare oyunu" olmuştur. Yapay zeka, görüntü alanının yeniden kullanımını tespit etmenin yanı sıra Photoshop'a karşı da bir silah haline geldi.

Scientific Reports, bu yılın Eylül ayında, Rhus toxicondendron (toksik sarmaşık) bitkisinin çok yüksek seyreltilmesine dayanan homeopatik ilaçların en az ağrı kesici ilaçlar (gabapentin) kadar etkili olduğunu belirten bir makale yayınladı.

Ancak, kısa süre sonra homeopatiyi tanıtan bu makale, biyolog Enrico Bucci tarafından kullanılan bir yazılım tarafından bir hata olarak işaretlendi: iki farklı deneyde önerilen ilaç konsantrasyonu çok farklıydı ve grafik şaşırtıcı derecede farklıydı. Tutarlı.

Daha sonra, makalenin yazarı, ekibinin makaleyi hazırlarken kasıtsız bazı hatalar yaptığını ve bunun da yinelenen görüntüler ve yinelenen verilerle sonuçlandığını söyledi.

Yazar, metin ile sayılar arasındaki farkın yazım hatalarından kaynaklandığını belirtti. Ekip, Scientific Reports'tan makaleyi güncellemesini ve düzeltmeler yapmasını isteyecektir. Ancak, "Bu bilimsel sonuçları hiçbir şekilde değiştirmeyecek" dedi.

Yapay zeka, kağıt sahtekarlığını otomatik olarak engellemekten ne kadar uzakta?

Bununla birlikte, yazılım tabanlı yöntemler yaklaşık on yıldır yaygın olarak tartışılsa da, bu tür uygulamaları kullanan şirketler sonuçlarını nadiren yazılımda yayınlamaktadır.

Yazılım tabanlı yöntemler hala insan gözetimi ve desteği gerektiriyor. İnceleme görüntü işleme yazılımının geliştirilmesi, taranan görüntü günlüklerinin sayısını artırabilir. Ancak, yazılım kullanımının insan müdahalesi ihtiyacını ortadan kaldırmadığı unutulmamalıdır. Yazılımın çıktısı insanlar tarafından değerlendirilmelidir.

Alanlardan biri, yazılım geliştirmenin büyük makale veritabanlarının görüntü çoğaltma tespiti üzerinde büyük bir etkiye sahip olabileceği ve görsel inceleme teknolojisi kullanarak bu kadar büyük ölçekli karşılaştırmalar yapmanın imkansız olmasıdır.

Kağıtlardaki yanlış görüntüleri tespit etmek için AI Gelecekte iki form olabilir . Birincisi, şirketler dergi editörlerine özelleştirilmiş uygulamalar sağlayabilir ve ardından editörler bu uygulamaları, intihal önleme yazılımının çalışma şekline benzer olabilecek gelecek makaleleri analiz etmek için kullanabilir.

Diğer bir yöntem, görüntü bütünlüğü analiz şirketinin kendi insan ve bilgisayar kaynaklarını görüntü bütünlüğü incelemesi için dergiye tahsis etmesidir.

Otomatik görüntü analizi yazılımı bir işletmeye dönüşürken, sahtecilik yapan araştırmacılar ölçümlerini "omuzlamakta" zorlanabilirler. Daha sonra, sahte görüntülerin tespit edilmesini zorlaştıran daha karmaşık başka bir araç olabilir ve bu "kedi ve fare oyunu" büyük olasılıkla devam edecek.

Referans malzemeleri:

https://thenextweb.com/science/2018/11/06/meet-the-people-busting-scientists-who-fake-images-in-research-papers/

https://www.nature.com/articles/d41586-018-06967-0

https://www.biorxiv.org/content/biorxiv/early/2018/02/23/269415.full.pdf

Yeni nesil BYD Tang hala bir taklitçi mi? Korkarım bu sanat beden eğitimi öğretmeni tarafından öğretilmedi.
önceki
Bill Gates zenginler listesinin başında olmaya devam ediyor, Buffett ikinci sırada soyuldu
Sonraki
Ulaşılması en zor olan sınır karakolu, bize güvenlik duygusu "üreten" bir yer!
Gartner, IoT teknolojisinde on büyük trend yayınladı, yapay zekanın son aşaması uç bilgi işlem
Hong Kong'un halka arz aşırı satın alma kralı doğdu, aşırı abonelik 1178 kattan fazla!
Xinyinglang, patlayıcı tarz ve kişilik arasındaki en iyi dengeyi nasıl bulabilir?
Zhou Zhihua'dan Önsöz! Gaotu Wei Xiucan'ın yeni kitabı "Derin Öğrenmenin Analizi" nin deneme okuması
Weilai ilk yeni arabasını piyasaya sürdü: iş modeli üründen daha ilginç
Wells Fargo bankası müşteri hesaplarını çalınca Illinois 30 milyar ABD doları yatırımı askıya aldı
Kurucu General Chen Geng: Bir zamanlar devrimci bir evlilik için "Üç Whampoa" "Kağıt Önerisi" nden biri olarak selamlandı.
Kasım ayında Kuzey Amerika model satışlarının ilk on envanteri: Civic ateşli, kamyonetler ve şehirli SUV'ler satışları domine ediyor!
Demir kadın Brexit'i zorlamak istiyor
Sıcakkanlı adamın yepyeni Kai Chen T70'i olmak için hangi kartlar gösteriliyor?
Doğu Çin'deki ünlü Eski Sekizinci Tümen, Chen Yinin kolundaki küçük kaplan olarak bilinir. Si İlçesindeki fiyasko, Chen Yinin ebedi acısı haline geldi
To Top