Kaynak: makine öğrenimi blogu
Bu makale hakkında 2215 kelime , Okumanız tavsiye edilir 6 dakika
Bu makale, takviye öğrenme aracısı biçiminde yüksek kaliteli negatif örnekleri keşfetmek için yeni bir negatif örnekleme modeli olan Bilgi Grafiği Politika Ağı'nı (KGPolicy) tanıtıyor.
Öneri için Bilgi Grafiğine Göre Güçlendirilmiş Negatif Örnekleme
Xiang Wang, Yaokun Xu, Xiangnan He, Yixin Cao, Meng Wang, Tat-Seng Chua
Singapur Ulusal Üniversitesi, Güneydoğu Üniversitesi, Çin Bilim ve Teknoloji Üniversitesi, HeFei Teknoloji Üniversitesi
Öneri sistemlerinde, eksik verileri doğru şekilde ele almak zordur.
Şu anda, çoğu iş, gözlemlenmemiş verilerden negatif örnekleme yapacak ve daha sonra, negatif sinyallere sahip öneri modellerini eğitebilecek. Bununla birlikte, statik negatif örnekleme veya uyarlamalı negatif örnekleme olsun, mevcut negatif örnekleme stratejisi, yüksek kaliteli negatif örnekler elde edemez.Bu negatif örnekler, model eğitimine yardımcı olma ve kullanıcıların gerçek ihtiyaçlarını yansıtma yeteneğinden yoksundur.
Bu makalede, bir emtianın bilgi grafiğinin, emtia ile bilgi grafiği varlığı arasında daha zengin bilgi sağlayabileceği, bu da zengin bilgi ve daha fazla gerçekçilik ile negatif bir örnek elde etmeye yardımcı olabileceği varsayılmaktadır.
Bu amaçla, yazarlar, takviye öğrenme aracısı şeklinde yüksek kaliteli negatif örnekleri keşfetmek için yeni bir negatif örnekleme modeli olan Bilgi Grafiği Politika Ağı'nı (KGPolicy) önermektedir. Spesifik olarak, uygun keşif işlemlerini tasarlayarak, model uyarlamalı olarak hedef pozitif numunenin etkileşiminden edinilen bilgilerle negatif numune bilgisi alır ve son olarak tavsiye modelini eğitmek için potansiyel negatif numune ürünleri üretir.
Matris çarpanlarına ayırmayı KGPolicy ile birleştirdikten sonra, STOA örnekleme yöntemlerine (DNS ve IRGAN gibi) ve bilgi grafiği geliştirmeyi kullanan öneri modellerine (KGAT gibi) göre önemli iyileştirmeler elde etti.
Negatif örnekleme üç ana kategoriye ayrılabilir
Bu üç odak türündeki farklılıklar esas olarak aşağıdaki yönlere yansır.
Yüksek kaliteli negatif numuneler aşağıdaki iki özelliğe sahiptir
Negatif numune damıtma diyagramı aşağıdaki gibidir
Bu makalede önerilen model şudur:
Bu makalenin ana katkıları aşağıdaki gibidir
İşte bazı gösterim kuralları
Sorun açıklaması aşağıdadır
Aşağıda, çok sekmeli bir yol ve negatif örneklerin bir örneği bulunmaktadır
Bilgi grafiğine dayalı model çerçevesi ve negatif örnekleme diyagramı aşağıdaki gibidir
Amaç işlevi aşağıdaki gibi tanımlanmıştır
Daha fazla bilgi içeren negatif numuneler aşağıdaki özelliklere sahiptir
Takviye öğrenme olarak olumsuz örneklemenin ayrıntılı süreci aşağıdaki gibidir
Durumun tanımı aşağıdadır
Davranış aşağıdaki gibi tanımlanır
Durum geçiş dinamikleri aşağıdaki gibi tanımlanır
Ödül işlevi aşağıdaki iki faktöre göre tanımlanır
Aşağıda amaç fonksiyonunun tanımı bulunmaktadır
Aşağıdaki grafik öğrenme modülünün şeklidir
Keşif operasyonu iki adıma bölünebilir
Aşağıda, bilgi grafiğinin yakın noktalarını dikkatle nasıl elde edeceğiniz anlatılmaktadır.
Aşağıdaki, malların komşularına dikkat çekmenin yoludur
Model eğitimi ve optimizasyonu ile ilgili olarak, yazarlar aşağıdaki stratejileri benimsemiştir
Veri seti bilgi istatistikleri aşağıdaki gibidir
Karşılaştırmada yer alan birkaç örnekleme yöntemi aşağıdaki gibidir
Karşılaştırmaya katılan bilgi grafiklerine dayalı birkaç öneri modeli aşağıdaki gibidir
Değerlendirme endeksi
Parametreler aşağıdaki gibi ayarlanır
Farklı öneri modellerinin etkilerinin karşılaştırması aşağıdaki gibidir
Farklı örnekleme yöntemlerinin etkileri aşağıdaki gibidir
Arama operasyonlarının sayısının karşılaştırması aşağıdaki gibidir
Ödül işlevinin etkisi aşağıdaki şekilde karşılaştırılır
Eğitim yinelemelerinin sayısı ile ortalama gradyan eğilimi aşağıdaki gibidir
Kod adresi
https://github.com/xiangwang1223/kgpolicy
-Bitiş-
Tsinghua-Qingdao Veri Bilimi Enstitüsü'nün resmi WeChat kamu platformunu takip edin " AI Veri Pastası "Ve kız kardeş numarası" Veri Pastası THU "Daha fazla ders avantajı ve kaliteli içerik elde edin.