Yapay zekanın sahte haberleri tanımasının ardındaki ilkeyi aydınlatmak

Su basmış bir bilgi çağında yaşıyoruz ve bazen internetteki yanlış bilgilerden kaçınılmaz olarak rahatsız oluyoruz. Çoğu zaman, netizenler sahte haberlerin doğrudan yaratıcıları değil, daha çok yayıcı rolünü oynarlar. Uydurma söylentiler gibi söylentilerin yayılmasının da ciddi sonuçları olacak. Örneğin, 2016 ABD seçimleri sırasında sosyal ağlarda viral oldu, kamuoyunu etkilemekle suçlanan yanlış haberler ya da bu yıl WhatsApp platformu aracılığıyla yayıldı ve bu da sonunda Hindistan'ın on Kalanların linç nedeniyle öldüğü yalan söylentileri.

Bilimsel ve teknolojik medya Science News'e göre, dünyanın dört bir yanındaki birçok bilimsel araştırma ekibi, haberlerin gerçekliğini otomatik olarak tanımlayabilen programlar geliştiriyor. Ana işlevleri, haberlerin güvenilirliğine ilişkin bir ön değerlendirme yapmak ve sonuçları okuyuculara referansları için iletmektir.

Bloomington Indiana Üniversitesi'nden bilgisayar bilimcisi Giovanni Luca Ciampaglia, sektördeki bu tanımlama algoritmasının geliştirilmesinin genellikle emekleme döneminde olduğunu, bir rapor için güvenilirliğini belirleme yöntemi olarak faktörlerin seçiminin de çeşitlilik gösterdiğini söyledi.

Bununla birlikte, bu programların bir habere odaklanması kabaca iki kategoriye ayrılabilir: raporun içeriği ve anlatının tonu.

Yukarıda bahsedilen Ciampaglia ve araştırma ekibi, raporun ana noktasına, konu ile nesne arasındaki bağlantının nesnel gerçeklerle desteklenip desteklenmediğine odaklandı. Algoritmaları Wikipedia giriş sayfasının doğru bilgi sütununda ("Bilgi Kutusu") büyük miktarda bilgi içerir ve isimlere ve isimler arasındaki bağlantılara dayalı bir veritabanı oluşturmak için ana girişi tüm zarflarla eşleştirir. Bir haberin ana noktası, konu ile aşağıdaki tanımlayıcı isimler arasındaki bağlantı daha kısa bir yoldan veri tabanında izlenebiliyorsa, o zaman haberin ana noktası nispeten inandırıcıdır.

Örneğin, "Obama bir Müslüman" cümlesinde "Obama" ile "Müslüman" arasında 7 katlı bir bağlantı var, bu da veritabanında bu iki kelimeyi birbirine bağlamak için 7 çift ismin yayılması gerektiği anlamına geliyor. Bu, ifadenin çok güvenilir olmadığını gösteriyor.

Şekil Obama wiki sayfası ve sağdaki bilgi kutusu (Kaynak: Wikipedia)

Bununla birlikte, isimler arasındaki ilişkinin gücüne dayanan bu yargılama yönteminin de belirli sınırlamaları vardır. Örneğin, "George W. Bush, Barbara Bush ile evlendi" cümlesinin gerçekliğini belirleyemez, çünkü bu iki terim veri tabanında birbiriyle oldukça ilişkilidir. Bu nedenle Ciampaglia, rasyonalitesini artırmak için algoritmasına başka parametreler de eklemeye çalışıyor.

Şekil "Obama" ve "Müslümanlar" arasındaki yedi bağlantı (Kaynak: Science News)

ABD'deki Rensselaer Polytechnic Üniversitesi'nden bilgisayar bilimcileri Benjamin Horne ve Sibel Adali başka bir yöntem önerdiler. Business Insider tarafından derecelendirilen en güvenilir medya tarafından yayınlanan 75 gerçek raporu ve İnternette tanınan 75 sahte haberi analiz ettiler ve ardından şu sonuca vardılar: sahte haberler genellikle gerçek haberlerden daha kısadır ve birçok zarf tekrar tekrar görünür. Ayrıca nispeten daha az alıntı ve profesyonel kelime haznesi vardır.

Makaledeki isimlerin sayısı, alıntı sayısı, uzunluk ve parametre olarak toplam kelime sayısına dayalı bir dizi değerlendirme algoritması oluşturdular. Algoritma, geçtiğimiz yıl Kanada'nın Montreal kentinde düzenlenen Uluslararası Web ve Sosyal Medya Konferansı'nda canlı olarak gösterildi ve sahte haberleri tespit etme doğruluğu% 71'e ulaştı.

Ann Arbor'daki Michigan Üniversitesi'nde bir bilgisayar bilimcisi olan Verónica Pérez-Rosas da sahte haberlerdeki zarfların gerçek haberlerden daha sık kullanıldığını keşfetti. Ağustos 2017'de bilimsel literatür veri tabanı arXiv.org'da yayınlanan bir araştırma raporunda Pérez-Rosas, sahte haberlerin daha olumlu bir dil kullanacağını ve sonuç çıkarmayı tercih edeceğini de öne sürdü.

Şekil Pérez-Rosas, sırasıyla haberlerde kullanılan doğru (sol yarı) ve yanlış (sağ yarı) kelimeleri özetledi (Kaynak: Bilim Haberleri)

Bu, sahte haberlerin yazma tekniklerinde ortak bir yönü olduğunu gösterir. Kaliforniya Üniversitesi, Riverside'da bir bilgisayar bilimcisi olan Vagelis Papalexakis, iki raporun gerçekliğini aralarındaki metnin benzerliğine dayanarak değerlendirdi. Araştırma raporundaki benzerliği ölçmek için belirli parametreleri açıkça listelemese de, 32.000 doğru ve yanlış haber içeren bir veritabanında, algoritması makalelerin% 5'inden hangisinin doğru ve hangilerinin yanlış olduğunu tahmin edebilir. Ardından, diğer makalelerin gerçekliğini% 69 doğrulukla belirleyin.

Sosyal ağ siteleri bu algoritmaları, haberler üzerinde ön kontroller yapmak için kullanabilir ve kullanıcılara şüpheli bir sahte haber açtıklarında erken uyarı gönderebilirler. Örneğin, Facebook şu anda hangi haberlerin arka planda daha şüpheli yorumları olduğunu izliyor ve ardından profesyoneller bu haberleri değerlendirecek ve algoritmayı optimize etmek için Facebook'un orijinal otomatik tanımlama algoritması tarafından kullanılan veri tabanına değerlendirme sonuçlarını girecek.

Birleşik Krallık'taki Imperial College of Technology'de bir bilgisayar bilimcisi olan Julio Amador Diaz Lopez, bu tanımlama algoritmalarının giderek daha "akıllı" evrimleşmesine rağmen, din ve felsefe hakkındaki raporlar gibi daha soyut geçmişler karşısında hala insanlar gibi davranmayabileceklerini söyledi. Ya bilin ya da güvenilirliğini kabul edin. Aynı zamanda, yazı stiline dayalı sahte doğrulama programı yaygın bir şekilde benimsenirse, orijinal sahte haberin yazarları da geçmek için yazma yöntemlerini uygun şekilde değiştireceklerdir.

Neyse ki, sektörde yalnızca metnin kendisine odaklanmayan algoritmalar zaten var. Çin Bilimler Akademisi Bilgisayar Teknolojisi Enstitüsü'nden Juan Cao tarafından önerilen algoritma, okuyucunun geri bildirim modeline odaklanıyor. Kullanıcıların Weibo ile ilgili haberler hakkındaki görüşlerini iki kategoriye ayırdı: destek ve muhalefet. Örneğin, bir yerel haber için, coğrafi konumu olayın yerine daha yakın olan kullanıcılar tarafından yapılan yorumlar, uzaktaki okuyuculardan gelen geri bildirimlerden daha güvenilirdir. Başka bir örnek, uzun süredir görünmez olan ancak aniden bir haber yorumu yaptığı ortaya çıkan bir kullanıcıdır, sözleri daha az güvenilirdir.

Juan Caonun ekibi Weiboda dolaşan 73 gerçek ve sahte haber seçti. Algoritmaları bu haberleri destekleyen veya kabul etmeyen yaklaşık 50.000 yorumu analiz etti ve sonunda% 84 doğruluk oranıyla sahteyi belirledi. Haberler. Araştırma sonuçları ayrıca Association for the Advancement of Artificial Intelligence (Association for the Advancement of Artificial Intelligence) 2016 konferansında sergilendi.

Benzer şekilde, Pekin Havacılık ve Uzay Üniversitesi'nden bir ağ uzmanı olan Profesör Li Daqing, içeriği sahtecilik doğrulama prosedürünün odak noktası olarak görmedi, ancak kararın ana temeli olarak haber yayma şeklini aldı. 1.700 sahte haber, Weibo'dan 500 gerçek haber ve Twitter'da 30 gerçek ve yalan haber topladı.Yayılma özelliklerini inceledikten sonra, gerçek haberlerin yayılmasının esas olarak tek bir güvenilir kaynaktan kullanıcılara bağlı olduğunu buldu. Doğrudan paylaşım, sahte haberlerin yayılması ise esas olarak kullanıcılar arasında paylaşıma dayanmaktadır.

Picture Profesör Li Daqing, doğru (sol) ve yanlış (sağ) ana haber yayma biçimlerini keşfetti (Kaynak: Science News)

Bu algoritmaların pratik uygulamasına geri dönersek - sosyal ağ siteleri, bu aşamada algoritmanın sonuçlarına göre tüm şüpheli sahte haberleri engellememelidir.Bu, kullanıcının bağımsız olarak bilgiye göz atmayı seçme hakkına totaliter müdahaleye eşdeğerdir. Facebook'un mevcut yaklaşımı, sistem tarafından belirlenen düşük güvenilirlikli raporları otomatik olarak itme çubuğunun altına yerleştirmektir Şirket sözcüsü Svensson'a göre, bu, sahte haber okuma sayısını yaklaşık% 80 oranında azaltabilir. Ek olarak, ön tanımlama sonuçlarına dayalı olarak kullanıcılara yukarıda belirtilen uyarı mesajları da gelecekte bu tür algoritmaların sosyal paylaşım sitelerinde uygulama biçimlerinden biri haline gelebilir.

Inno Prize kazananlarının derslerini anlamak zor ve öğrencileri "kuantum oyuncakları" yaratıyor
önceki
2019 veya yerli bilim kurgu filmlerinin ilk yılında hangi beş yeni eseri seçiyorsunuz?
Sonraki
Tarihi an! NASA, SpaceX Dragon astronotlarını duyurdu, özel insanlı uzay uçuşu çağı yaklaşıyor
QF2: Bulutta yüksek performanslı dosya depolama
Ian Goodfellow'un son makalesi: Neural Networks Can Debug
Wang Ying'in oğlu, annesi adına övgüyü kabul etti.
Altı açık kaynak yönlendiricinin karşılaştırması
"Doğa" Alt Dergisi: Bilim adamları, kalbin elektriksel aktivitesini belirleyen 50 anahtar gen lokusu keşfettiler
Wuhan'daki ilk hidroelektrik şirketi adını, orijinal olarak "Değişiklikler Kitabı" ndan kaynaklanan "jiji" kelimesinden almıştır.
Python veri bilimi dağıtımı için kısa bir kılavuz Anaconda
Sıcak dalgası krizi: Kuzey Çin Ovası bu yüzyılın sonunda artık yaşanabilir olmayabilirMIT'den son araştırma
"Gelgit Teknoloji Ödüllü Sorular ve Cevaplar" kazananlar listesinin 10. sayısı - Yunding Technology
UEFA Avrupa Ligi - kılıcın çift atışı ve Atletico Madrid'in takım tarihinde üçüncü kez Marsilya'yı 3-0 yenmesi
Yangtze Nehri Kurtarma Gönüllü Ekibi, yeni yılın başında güvenlik bilgisi eğitimi gerçekleştirdi.
To Top