Academia BigData 2018'in en ileri teknolojisi: Yapay zekanın kötülüğü önlemek için en uygun kararı bulmasına izin verin

AI Technology Review Press : Bu makalenin yazarı Zhao Tong, Notre Dame Üniversitesi Bilgisayar Bilimleri Bölümü DM2 Laboratuvarından bir doktora öğrencisidir. Bu makale, kendisi tarafından AI Technology Review için yazılan IEEE BigData 2018 tarafından kabul edilen "Büyük İki Taraflı Grafiklerde Şüpheli Davranış Algılama için İşlem Yapılabilir Hedef Optimizasyonu" belgesine dayanan özel bir yorumlama el yazmasıdır. İzinsiz çoğaltılamaz.

Önsöz

Kötü işler korkunçtur. Zhang Yingying'in kaçırılmasının ve ortadan kaybolmasının üzerinden 500 günden fazla zaman geçti ve önemli bir ilerleme kaydedilmedi. Nisan 2017'de Pekin Üniversitesi'nden 27 yaşından küçük bir mezun olan Zhang Yingying, değişim ve ziyaretçi akademisyen olarak çalışmak için Urbana-Champaign'deki Illinois Üniversitesi'ne gitti. 9 Haziran öğleden sonra saat 2'de Zhang, bir sözleşme imzalamak için otobüse binerek kampüs dışı daireye gitti Transfer istasyonunda otobüsü beklerken, yanlışlıkla bir yabancının siyah arabasına bindi. O zamandan beri kimse onu görmedi. Arkadaşı ve profesörü o gece polisi aradı ve 30 Haziran'a kadar ABD polisi Zhang'ın ölmüş olabileceğini iddia ederek beyaz bir adamı tutukladı. 12 Temmuz'da federal büyük jüri resmi olarak şüpheliyi suçladı, şu ana kadar dava hala mahkemede. Zaman zaman Çin'de de benzer durumlar yaşanmaktadır. "Didi Shunfeng" cinayeti davası kanlı bir trajedidir. Haber manşetlerinde "başka bir kız" veya "üç ay sonra ikinci yolcu" kelimeleri her çıktığında, insanlar bu tür olayların tekrar tekrar meydana gelmesine neyin sebep olduğunu merak ediyor. Kötü davranışlar yalnızca gerçek hayatta görünmekle kalmaz, aynı zamanda İnternetin her yerinde görülür. Örneğin, Taobao ve eBay'de alıcıların "zorbalık" satıcılarının davranışları vardır: alıcıların yalnızca satıcıdan ucuz bir ürün satın alması ve Ürünleri değerlendirme ve puanlama hakkı. Bir alıcı ürünün kalitesini görmezden gelir ve çok düşük bir puan verirse, satıcının ortalama puanı düşecektir. Platform öneri sistemi genellikle puana göre sıralanır ve puan biraz daha düşüktür, bu da satıcının diğer satıcılarla rekabet ederken önerilenler arasında görünmemesine neden olur. İlk sayfa, böylece iş kaybederek sonunda kapandı. Bu nedenle, alıcılar satıcının zayıflığından yararlanarak indirim ve hatta nakit talep edebilir, "zorbalık yapan alıcıların" kaynağı budur.

Soruyu gündeme getirin

Çeşitli durumlara dikkat ederken şunu düşünmeliyiz: Yaklaşan kötülüklerle karşılaştığımızda, kötü niyetli olayların ortaya çıkmasını önceden önleyebilir miyiz? Hayatın yalnızlığına kıyasla ne kadar çok düşünürsen, o kadar ürpertici olursan, bilginin kısırlığı ve çevrenin karmaşıklığı o kadar korkutucu olur.

Ebeveynin "Güvenlik konusunda dikkatli olun" cümlesi, "kira sözleşmesi imzalamak", "otobüsü kaçırmak", "geç ve geç kalmak", "yol kenarında", "siyah araba", "beyaz adam", "otobüse binmeye davet" gibi alışılmadık ortamlarla karşılaşır. Aşağıdaki karmaşık sahneler solgun ve zayıf görünüyordu. Kurbanın yargısı, "dakiklik", "dürüstlük ve güvenilirlik", "medeni gelişme" ve "başkalarına yardım etmeye hazır olma" tarafından çabucak ezildi. Fujian Eyaleti, Nanping'deki memleketi Nanping'de bu durumlar olsaydı, daha sakin olurdu: çok fazla kaza, hikaye ve çevresiyle ilgili anlayış ona karmaşık çevreyle yüzleşmesi için yeterli bilgi verdi. Yingying'in Illinois Üniversitesi kampüsünde suç haritaları gördüğünü, bazı tehlikeli olayların raporlarını duyduğunu ve kalbindeki kötülüğü önlemek için bir "güvenlik duvarı" inşa ettiğini, sözleşmeyi imzaladığında "sözleşmenin yanlış tarafında" olabileceğini hayal edin. Bu trajediden kaçınmak için "bir yabancının siyah arabası" seçimi dikkatlice düşünülmelidir. Basit bir cümle "Dikkatli olun", bilgi miktarı gerçekten çok az.

Şekil 1: CampusCrime.net'ten: Cinsel suçlar ve soygunlar gibi kısır olayların kampüs dağılımı

Hükümet ve çeşitli platformlar, insanlara ve kullanıcılara en kaliteli ve en güvenli hizmetleri sunmak için çok çalışmış olsa da, kötülüğü önceden etkili bir şekilde önlemeleri onlar için zordur. Çünkü iyi bir insanı kötü biri olarak yanlış değerlendirmenin maliyeti çok büyük. Önemli e-postaların yanlışlıkla çöp kutusuna atıldığını, bir grup normal Taobao kullanıcısı yasaklandığında ve polisin yanlışlıkla "şüpheli kişileri" tutukladığını hayal edin, bunlar kaçınılmaz olarak hizmette düşüşe, şikayetlere, platform gelirinde hasara ve sorumluluğa yol açacaktır. Pek çok olumsuz etkiye katlanmak zordur. Bu nedenle hükümetler ve platformlar, bilgi işlem ve büyük veri kaynakları üzerinde otursalar da, yavaş tepki veriyor ve korkuyor gibi görünüyor. Ancak kullanıcılar platformu suçlarken, "hayır" diyebilecek en etkili kişinin kendileri olduğunu unutarak güvenlik bilincinin oluşturulmasını bizzat ihmal etmişlerdir.

düşüncelerimiz

Platform ve kullanıcılar arasındaki bu uzun ve derin bilgi açığını gözlemlediğimizde, Notre Dame Üniversitesi'ndeki DM2 Lab bunu telafi etmek için yeni bir fikir kullanmaya çalıştı. Boşluk. Unvanı birleştirmek için, vurucuları, hayranları, şoförleri vb. İçeren davranışı yapan kişiye "aktif taraf" diyoruz; davranışı kabul eden kişi, vurulanlar, takipçileri, yolcular vb. Dahil "aktif taraf" olan "pasif taraf" dır. Kötü huylu davranış olasılığı vardır. Geleneksel şüpheli davranış algılama algoritmaları, genellikle optimize edilmiş bir değişken olarak "etkin tarafın saldırgan olup olmadığı" etiketini kullanır, böylece platform, tahminleri olumlu olanları manuel olarak araştırabilir ve kararlar verebilir. Araştırma süreci zaman alıcıdır. Zahmetli. DM2, "pasif taraf" ın bir savunma duygusu oluşturabileceğini ve "aktif tarafın" özelliklerinin veya davranış geçmişinin gözlemlenmesine dayalı bir savunma düzeyi seçebileceğini önermektedir.Örneğin, kadın yolcular sürücünün yaşı, cinsiyeti, sürüş deneyimi, geçmiş derecelendirmeler ve değerlendirmeler gibi bilgilere dayalı olarak taranabilir. Burada bir uzlaşma sorunu var: Eğer savunma seviyesi çok yüksekse, hizmetin menzili ve zamanlaması azalacak; savunma seviyesi çok düşükse güvenliği garanti etmek zor olacak. Bireysel kullanıcıların makul bir seviye seçmesi zordur, ancak platform, kullanıcılar için uygun savunma seviyelerini önerebilen ve seçimden sonra sonuçları tahmin edebilen, kullanıcıların kendi başlarına seçmelerine olanak tanıyan devasa veri ve akıllı algoritmalara sahiptir. Bu sayede kullanıcılar güvenlik bilincine sahip olurlar, platform sorumluluğun bir kısmını da "atlatabilir", bilgi boşluğu kapatılabilir ve kötü niyetli davranışların önlenmesi operasyonel ve yürütülebilir hale gelir.

Aslında, kötü niyetli davranışları önleme fikrinin ortaya çıkması ilk kez değildir.Örneğin, Taobao'nun olumsuz eleştirmenleri engellemek için kullanılabilecek eklentileri vardır (pozitif oranı belirli bir yüzdeden az olan alıcılar).

Şekil 2: Eklentiyi engelleyen hatalı yorumcu

Ancak, görünüşte güvenli olan bu uygulamanın birçok olumsuz etkisi vardır. Satıcının "savunma seviyesi" çok yüksek olduğunda, birçok dürüst ancak düşük puanlı alıcı mal satın alamaz ve bu da satıcının siparişlerini kaybetmesine neden olur. Aşağıdaki şekildeki örnek:

Şekil 3: Olumlu oranı% 85 olan dürüst alıcılar bu mağazadan ürün satın alamaz

DM2 tarafından önerilen Eyleme Geçirilebilir Hedef Optimizasyonu (AOO) algoritması, optimizasyon değişkeni olarak pasif tarafın savunma seviyesini ve optimizasyon hedefi olarak genel güvenlik faktörünü ve hizmet kalitesini alır.Davranışsal verinin en yaygın ikili grafik biçiminde, İyi sonuçlar elde edildi. Bu algoritma, IEEE BigData 2018 ( tarafından uzun bir metin olarak kabul edilmiştir. İlk yazar, Notre Dame Üniversitesi'nde birinci sınıf doktora öğrencisi olan Zhao Tong ve danışmanı Yardımcı Doçent Jiang Meng'dir.

Metodoloji

Kötü huylu önleme algoritmalarıyla ilgili birçok literatür, alışılmadık derecede yoğun iki taraflı çekirdeğin (yoğun iki taraflı çekirdek) iki taraflı grafiklerle temsil edilen davranış verileri üzerinde şüpheli olduğunu bulmuştur. Bu ikili grafiği temsil etmek için A matrisini kullandığımızda, orijinal görüntüdeki yoğun alt grafik, A matrisindeki yoğun alt matris haline gelir. Mevcut geleneksel yöntemlerin çoğu, sonunda her bir aktif tarafa şüpheli bir derece puanı vermek için çeşitli yöntemler kullanır.Birlikte, bu puanlar, uzunluğu aktif tarafların toplam sayısı olan bir vektör p'dir. Ardından, daha şüpheli aktif tarafların oluşturduğu alt anları optimize edin

J'nin yoğunluğu, dolayısıyla hedef denklem şu şekilde ifade edilebilir:

Aktif partinin şüpheli derecesinin değişkenini optimize etmenin geleneksel yönteminden farklı olarak, AOO fikri, pasif partinin savunma seviyesini optimize etmektir, böylece nihai olarak bloke edilen davranış, normal veriden çok daha büyük bir yoğunluğa sahip bir alt matris haline gelir. AOO, her bir pasife, aktifin belirli bir özelliği için bir savunma seviyesi veya eşik vermek ister.Birlikte, toplam pasif sayısının bir v vektörünü oluştururlar. Aktif tarafın özellikleri i pasif taraf j'nin eşiğini karşılayamadığında, j bu davranışı i ile bloke edebilir. Daha sonra, maskelenmiş metin tarafından oluşturulan alt matrisi optimize etmek için amaç denklemi:

Bu iki formül benzer görünebilir, ancak gerçekte oldukça farklıdırlar. Çünkü bu araştırma sorusunu hem aktif hem de pasif perspektiflerden tamamen kesiyorlar. Ve aslında, yalnızca pasif, kötü niyetli davranışları önceden engelleyebilen uygulayıcıdır.

Çevrimiçi alışveriş platformunda, aktif tarafın (alıcının) özellikleri, bu alıcının ortalama geçmiş puanı olabilir. Pasif partinin (satıcının) savunma seviyesi, doğal olarak, bu mağazadan satın alınabilecek malların alıcıları için ortalama derecelendirme eşiği olan yukarıda bahsedilen Taobao eklentisine benzer. Bu sayede alıcının geçmişteki ortalama puanı satıcının eşiğinin altında olduğunda alıcı bu mağazadan alışveriş yapamaz.

Bir veri seti verildiğinde, her satıcı için bir eşik oluşturarak, satıcı sayısı v'ye eşit bir uzunluk üretiriz, 0/1 B matrisini hesaplamak için v ve A'yı kullanabiliriz. B'deki her değer için

, Eğer j satıcısı, alıcı 'i ile işlemi bloke ederse, değer 1, değilse 0 olacaktır. Tabii ki, yalnızca işlemi olan alıcılar ve satıcılar dikkate alınacaktır, bu nedenle, işlemin var olup olmadığını, yani j satıcısı ile alıcı i arasında bir işlem yoksa, bunu belirtmek için matris I kullanıyoruz.

Doğal olarak 0, aksi halde 1.

Şekil 4: Basit puanlama verisi örnek gösterim matrisi A ve B

Matematiksel formüllerle ifade edilirse. İlk olarak, her alıcının tarihsel ortalama puanını temsil eden u vektörünü kolayca elde edebiliriz: (m alıcı sayısı ve n satıcı sayısıdır)

O zaman B matrisini bulabiliriz:

Sonra, sadece B matrisinin belirli sayıda bloke edildiğini bulmamız gerekiyor (

) Ve belirli sayıda (

) Alıcının satıcısı. İki 0/1 vektör geçiyoruz

ile

İlgili alıcıların ve satıcıların zorba ve zorba olup olmadığını belirtmek için:

Bu alıcılar ve satıcılar bir alt matris oluşturur ve amacımız bu alt matrisin yoğunluğunu en üst düzeye çıkarmaktır. Yoğunluğunu bulmadan önce, bu alt matrisin boyutunu bulmamız gerekir (uzunluk

Genişlik

) Ve içeriği (e):

Dolayısıyla hedef denklemimiz şu şekilde ifade edilebilir:

Matris değişkenli bir fonksiyonun kısmi türevini alarak, hedef denklemin v'ye göre birinci türevi elde edilebilir. Hedef denklemimiz daha karmaşık olduğu için, önce onu basitçe ayrıştırıyoruz:

Bu şekilde, nihai hedef denklemin türevini elde etmek için bu formüldeki üç önemli kısmi türevi bulmamız yeterlidir. Üç kısmi türev şunlardır:

(Bunların arasında sigmoid denkleminin parametresi olan sigmoid denklemi vardır. Spesifik türetme işlemi için lütfen orijinal makaleye bakın.)

V'ye göre nesnel denklemin türevi ile, her satıcının tam olarak ayarlaması gereken eşiği içeren mükemmel bir v vektörünü optimize etmek için sadece gradyan iniş yöntemini kullanmamız gerekir. Tüm platformun büyük verilerini kullanarak optimize edilen her bir satıcının eşiği, doğal olarak, az miktarda deneyime sahip satıcının kendi ayarından çok daha etkili olacak ve çok fazla dürüst alıcıyı "yaralamayacak" ve daha fazlasını elde tutmayacaktır. Satış.

deney analizi

Deneyde, bu makale etkisini kanıtlamak için hem yapay verileri hem de gerçek verileri kullanıyor. Makaledeki yapay veriler, gerçekte olabildiğince çok durumu kapsaması için on karmaşık olacak şekilde ayarlanmıştır. Yapay verilerde, bu makalede önerilen AOO, en popüler anormal davranış algılama algoritmaları ve dolandırıcılık algılama algoritmalarının birçoğu ile karşılaştırılmış ve aynı veya daha iyi sonuçları elde etmiştir.

Şekil 5: Bir veya daha fazla zorbalık alıcı grubu olduğunda, alıcılar zorbalık yaparken yöntemin etkisi farklı sayıda olumsuz yorum yapar. Birkaç popüler anormal davranış algılama algoritması (KDD'14, KDD'16) ile karşılaştırıldığında, AOO'nun etkisi neredeyse mükemmeldir.

Gerçek verilerle yapılan deneyde, hiçbir platform zorbalık yapan alıcı etiketiyle verileri açıklamadığından, bu makale Amazon.com'un ürün inceleme verilerini kullanır ve AOO'yu tespit eder. Kötü amaçlı olduğundan şüphelenilen ürünlerin ürün incelemeleri, diğer alıcılar tarafından yapılan ürün incelemeleriyle karşılaştırıldı. Sonuçlar çok ilginç:

Şekil 6: Amerikan Amazon ürün incelemesi kelime bulutu

Şekil 6'da, Şekil 6 (a), tüm veri setindeki tüm ürün incelemelerinin kelime sıklığının kelime bulutu göstermektedir.Genel veri setinin iyi karşılanma eğiliminde olduğu ve kullanıcıların da çok olumlu birçok kelime kullandığı görülebilmektedir. Örneğin: iyi, aşk, güzel, harika vb. Şekil 6 (b), AOO tarafından tespit edilen şüpheli olumsuz incelemelerin kelime bulutunu gösterir ve Şekil 6 (c), AOO'nun şüpheli olmadığını düşündüğü yorumlardaki olumsuz incelemelerin kelime bulutunu gösterir. Şekilden de görülebileceği gibi, hem kötü eleştiriler hem de yüksek sıklıkta kötü, sıkıcı ve diğer olumsuz sözcükler söz konusu olduğunda: Şekil 6 (c) 'deki sözcükler daha yumuşaktır, maalesef hayal kırıklığı, sorun gibi; Şekil 6 (b) 'deki kelime dağarcığı çok şiddetli ve hatta aşağılayıcıdır, örneğin korkunç, aptalca, korkunç, cehennem gibi. Verinin kendisi, AOO tarafından elde edilen sonuçların doğru olup olmadığını doğrulamak için resmi bir etikete sahip olmasa da, verilerdeki yorum sözlüğü, bu kullanıcıların daha kötü niyetli olduğunu göstermektedir.

özet

Bu makalede, kötü niyetli davranışları önlemeye ilişkin BigData2018 belgesini kısaca tanıttık. Bu makale, kullanıcılar ve mağdurlar açısından kötü niyetli davranışları önceden önleme fikrini acımasızca ortaya koymaktadır. Makalede yer alan AOO modeli puanlama verilerinde iyi sonuçlar elde etse de, insanların çeşitli karmaşık yaşam ortamlarında çeşitli kötü niyetli davranışları önlemesini istiyorsak, bilim adamlarının bu alanda daha fazlasını yapması gerekiyor. Derin araştırma. Yakın gelecekte kullanıcıların bakış açısından konulara odaklanan daha fazla ilgili makalenin olacağına ve daha çok insan odaklı araştırma konularının önerileceğine inanıyorum. bekleyelim ve görelim!

Makalenin farklı bir yorumunu görmek için orijinal metni okumak için tıklayın: 2018 KDD en iyi makalesi "Airbnb'de Gömmeler"

TVB'de hiç vasat bir oyuncu olmadı
önceki
`` Monument Valley 2 '' çevrimiçi oluyor ve ücretli listenin başında yer alıyor, Tencent'in ulusal hizmet acentesi Android pazarını hedefleyebilir
Sonraki
Çin Bilimler Akademisi'nden Lu Ruqian, Wu Wenjun Yapay Zeka En Yüksek Başarı Ödülü'nü kazandı ve Baidu Wang Haifeng, Wu Wenjun Yapay Zeka Üstün Katkı Ödülü'nü kazandı.
Liang Luoshi, Li Zekai'nin "benimle evlen" ini bekleyemez, bu Hong Konglu kardeş?
Aston Martin Vanquish Zagato Safari Sürümü çıktı
Üç kuşak büyükanne ve büyükbabalar ve on polis, 30 yıldan fazla bir süredir yeniden bir araya gelme yemeği yemedi
Bir dalga saati "garip anları" ortadan kaldırabilir mi? Her zaman Cool Style Online olmanıza izin verin!
Harika yükseltme! 6 Kasım'da Xiaomi yeni ürün lansman konferansı, Redmi Note6 / yeni hayran
"Kıdemli Holmes" iyi karşılandı ve başrol oynadığı kostüm dramasını asla kaybetmedi!
PyTorch 1.0 kararlı sürümü geliyor
2018 Skoda Xinrui, Ekim ayı sonunda dahili ve harici güncellemeler listelenebilir
Ön izleme | "AIoT + Akıllı Şehir Zirvesi" ajandası 1.0 yayınlandı, misafir spoiler
Kurucunun aşırı çalışma nedeniyle ölümü 150 milyon iddiaya neden oldu! A-share performans kumarının arkasındaki "Suç ve Ceza"
Yeni Prado, Kasım ayında listelenecek: görünüm çok daha genç
To Top