İşbirliğine dayalı filtreleme algoritmasına dayalı öneri uygulaması

Giriş: Klasik bir veri madenciliği örneği, çocuk bezi ve bira örneğidir. Çocuk bezi ve bira, görünüşte birbiriyle alakasız iki üründür, ancak süpermarket iki ürünü satış için bitişik raflara koyduğunda, her ikisinin de satışını büyük ölçüde artıracaktır. Çoğu durumda, görünüşte birbiriyle alakasız olan iki ürün bu gizemli örtük ilişkiye sahip olacaktır.Bu ilişkiyi elde etmek satışları teşvik edecektir, ancak bazen bu ilişkiyi deneysel analiz yoluyla elde etmek zordur. nın-nin. Şu anda, başarmak için veri madenciliği-işbirliğine dayalı filtrelemede ortak bir algoritma kullanmamız gerekiyor. Bu algoritma, insanlar ile mallar ve mallar arasındaki ilişkiyi keşfetmemize yardımcı olabilir.

İşbirlikçi filtreleme algoritması, alışveriş davranışını örnek alan, ilişkilendirme kurallarına dayalı bir algoritmadır. A ve B olmak üzere iki kullanıcı ve a, b ve c olmak üzere üç ürün olduğunu varsayalım. Hem A hem de B, a ve b olmak üzere iki ürün satın almışsa, A ve B'nin benzer alışveriş zevklerine sahip olduğunu varsayabiliriz. A ürünü c'yi satın aldığında ve B, c'yi satın almadığında, c'den B'ye önerebiliriz. Bu, kullanıcının özelliklerini bir ilişkilendirme olarak kullanan tipik bir kullanıcı tabanlı durumdur.

(Bu deneyde kullanılan veriler, ticari kullanım için değil, yalnızca öğrenme için kullanılan gerçek e-ticaret duyarsızlaştırma verileridir)

1. İş senaryosu açıklaması

Temmuz ayından önceki bir kullanıcı alışveriş davranışı verileriyle, ürünlerin ilişkilendirme ilişkilerini öğrenin, kullanıcıların Temmuz ayından sonraki satın alma işlemlerine yönelik öneriler oluşturun ve sonuçları değerlendirin. Örneğin, A kullanıcısı A ürününü Temmuz'dan önce satın aldı ve A ürünü, B ürünüyle büyük ölçüde ilişkilidir. Temmuz'dan sonra B ürününü öneriyoruz ve bu önerinin isabet olup olmadığını kontrol ediyoruz.

Bu deneyde, PAI-Studio deneysel platform olarak seçildi ve bir dizi işbirliğine dayalı filtreleme tabanlı öneri sistemi yalnızca bileşenleri sürükleyip bırakarak hızlı bir şekilde gerçekleştirilebilir. Bu deneyin verileri ve tüm iş süreci, kutudan çıktığı gibi kullanıma hazır, PAI ana sayfası şablonuna yerleştirilmiştir:

2. Veri Kümesine Giriş

Veri kaynağı: Bu veri kaynağı Tianchi Yarışması için veri sağlar Veriler zamana göre iki bölüme ayrılır, bunlar Temmuz'dan önceki satın alma davranışı verileri ve Temmuz ayından sonraki veriler.

Belirli alanlar aşağıdaki gibidir:

Veri ekran görüntüsü:

Üç, veri keşif süreci

Bu deneyde, PAI-Studio deneysel platform olarak seçildi ve bir dizi işbirliğine dayalı filtreleme tabanlı öneri sistemi yalnızca bileşenleri sürükleyip bırakarak hızlı bir şekilde gerçekleştirilebilir.

Deneysel akış şeması:

1. İşbirliğine dayalı filtreleme öneri süreci

İlk girdi veri kaynağı, Temmuz ayından önceki alışveriş davranışı verileridir. Kullanıcının satın alma davranışı verileri SQL komut dosyaları aracılığıyla alınır ve işbirliğine dayalı filtreleme bileşenine girilir. Bunun amacı, süreci basitleştirmektir, çünkü satın alma davranışı bu deneysel analiz için en değerli olanıdır. . İşbirliğine dayalı filtrelemenin bileşen ayarlarında, TopN 1 olarak ayarlanır; bu, her bir öğenin en yakın öğeyi ve ağırlığını döndürdüğü anlamına gelir. Satın alma davranışı yoluyla, aynı kullanıcı tarafından satın alınma olasılığı en yüksek olan ürünleri analiz edin. Ayar şeması aşağıdaki gibidir:

İşbirliğine dayalı filtreleme sonucu ürünün alaka düzeyini, öğe kimliği hedef ürünü, benzerlik alanındaki kolonun sol tarafı hedefle yüksek alaka düzeyine sahip ürünü, sağdaki ise olasılığı temsil eder:

Örneğin, yukarıdaki ilk maddede, madde kimliği1000 ile madde15584 arasındaki benzerlik 0,2747133918'dir. Benzerlik ne kadar yüksekse, aynı anda iki maddenin seçilme olasılığı o kadar büyüktür.

2. Tavsiye et

Yukarıdaki adımlar, birbiriyle yakından ilişkili ürünlerin bir listesinin nasıl oluşturulacağını açıklamaktadır. Burada nispeten basit bir öneri kuralı kullanıyoruz. Örneğin, A kullanıcısı A ürününü Temmuz'dan önce satın aldı ve ürün A, B ürünüyle büyük ölçüde ilişkilidir ve bunu Temmuz ayından sonra öneririz Emtia B ve bu önerinin uyup uymadığını kontrol edin. Bu adım, aşağıdaki şekil ile gerçekleştirilir:

3. Sonuç istatistikleri

Yukarıdaki istatistik modülüdür.Soldaki tüm tablonun istatistikleri, Temmuz öncesi alışveriş davranışına göre oluşturulan öneri listesini gösterir.Tekilden arındırma işleminden sonra toplam 18065 öğe vardır. Sağdaki istatistik bileşeni, yaklaşık% 0,4'lük bir isabet oranıyla toplam 90 isabet gösterir.

Yukarıdaki istatistiksel sonuçlara göre, bu testin önerilen etkisinin nispeten genel olduğu ve nedenleri aşağıdaki gibidir:

1) Her şeyden önce, bu makale sadece kısaca iş senaryoları için işbirliğine dayalı filtreleme önerisinin kullanımını açıklamaktadır. Zaman serileri gibi, alışveriş davranışı önerileriyle ilgili pek çok kilit noktaya değinilmemiştir. Alışveriş davranışının, zamanın analizine dikkat etmesi gerekir. Birkaç ayı kapsayan önerilerin iyi sonuçları olmayacaktır. İkincisi, önerilen ürünlerin özelliklerine dikkat etmedim. Bu makale sadece ürünlerin alaka düzeyini ele alıyor ve ürünlerin yüksek frekanslı mı yoksa düşük frekanslı ürünler mi olduğunu dikkate almıyor. Örneğin, A kullanıcısı geçen ay bir cep telefonu satın aldıysa, A önümüzdeki ay satın almaya devam etmeyecek. Cep telefonları, çünkü cep telefonları düşük frekanslı tüketim mallarıdır.

2) İlişkilendirme kurallarına dayalı öneri, genellikle en iyi şekilde nihai öneri sonucuna veya en temel öneri sistemine ek olarak kullanılır. Doğruluk oranını gerçekten iyileştirmek veya makine öğrenimi algoritma eğitim modeli yöntemine güvenmek istiyorsanız, özel yöntem genel öneri serisine başvurabilir Diğer makaleler.

Avantajlar: Karnavalın son gününde UnionPay QuickPass, 60 yaşın üzerindeki siparişler için% 50 ve% 30 indirimden yararlanabilir.
önceki
WeChat önümüzdeki yıl Ocak ayında büyük avantajlar sunacak! Netizen: Harika ama ben Alipay'i seçiyorum
Sonraki
Bugünün göz kamaştırıcı resmi: İngiliz polisi 40 hava "devriyesini" karşılayacak Demir Taht "suçlanabilir"!
Fransa "trajik", CCTV6'nın hızlı bir şekilde yayınlanmasını beklemiyor ...
Cooler Master Dual Power Racing Oyun Kulaklığı: benzeri görülmemiş Hi-Fi ve konfor
Fransız sokak sporlarında neden "Çinli İşçi ve Köylü Kızıl Ordusu" bayrağı görünüyor?
Cuiyuan Kupası grup maçından sonra Shaanxi Normal Üniversitesi'ne Bağlı Lise ve Hebei Elite üç maçı da kazandı.
Xiaomi bu ay yeni Mi Play'i piyasaya sürecek veya 48 megapiksel kamera ile donatılacak
Dai Wei hatasını kabul ediyor, küçük sarı araba yarım kalmış: 3,6 milyar depozito, Dai Wei'nin son gururunu eziyor!
En güçlü Kirin çipi kutsanmıştır ve şan, yıl sonunda amiral gemisi V20'nin ilk değerlendirmesini tamamlar.
En büyük el yazısı olarak adlandırılan Lei Jun, Weibo'ya yeni bir araba gönderdi, Mi Fan kendinden geçmiş.
Putian departmanı, seni sevmenin kolay olmadığını söylemek istiyorum
Lei Jun, cep telefonunu bir arabaya çevirdi ve hayranlarına verdi ve Weilai'nin CEO'su yerinde duramadı.
Cydia mağazasını hatırlıyor musun? Finansman sorunları nedeniyle artık kapalı
To Top