[Öneri algoritması] LR'ye dayalı öneri algoritması ve uygulaması

1. Giriş

LR (Lojistik Regresyon) algoritmasının özü, doğrusal bir regresyon işlevidir. Algoritma, esas olarak tıklama oranı tahmini gibi iki kategorili senaryolar için kullanılır. Algoritma formülü aşağıdaki gibidir:

X, modelin girdisidir

  • xi, her boyutun girdisini temsil eder.
  • w, model girdisini temsil eden katsayı vektörü x, w = (w1, w2,), wi, xi boyutunun ağırlığını temsil eder.

2. Model çözme

Modelimizi gradyan inişi ile çözüyoruz. Örnek olarak tıklama oranı tahminini alın, önce örnekleri toplayın. Değişkenler şu şekilde tanımlanır:

  • nums, toplanan örneklerin sayısını temsil eder.
  • (Xi, yi) kullanıcının ilk örneğinin verilerini temsil eder, Xi örneğin özelliklerini temsil eder ve yi tıklama durumunu temsil eder (0 tıklama yok, 1 tıklama anlamına gelir).
  • Yi, w ve b değişkenleri olan modelin tahmin edilen değerini temsil eder.

Çapraz entropi kaybı işlevini tanımlayın:

Minimum los (w, b) 'ye karşılık gelen w, b, gradyan iniş yöntemi için gerekli model parametresidir.

3. İş uygulamaları

Mevcut öneri sistemi endüstrisinde, LR algoritmasının popüler yöntemi, özellikleri büyük ölçekte (tek etkin kodlama) ayırmak ve ardından bunu LR modeline getirmektir. Örnek olarak reklam tıklama oranı modelini alın. Adımlar aşağıdaki gibidir:

  • Adım 1: Kullanıcı portresini oluşturun

Özellik kategorilerine göre kullanıcı portreleri oluşturun ve kategorinin altındaki tüm özellikleri ayırın, örneğin: kullanıcı geçmişine göz atma öğe kayıtları, kullanıcı sosyal özellikleri, modeller aracılığıyla kullanıcılar için etiketler vb.

Tablo: Kullanıcı Portresi

  • Adım 2: Öğenin bir görüntüsünü oluşturun

Bir öğe portresi oluşturmak için, öğe özellik kategorilerini sınıflandırmak da gereklidir Kategori altındaki özellikler, öğe kimliği, öğe etiketi, öğe popülerliği vb. Gibi ayrıklaştırılmıştır.

Tablo: Kullanıcı Portresi

  • 3. Adım: Bir sahne portresi oluşturun

Gerçek iş uygulamasında, bir modelin genellikle birden fazla senaryo kullanması gerekir ve farklı senaryolardaki öğelerin ortalama tıklama oranları büyük ölçüde değişir.Farklı senaryolarda farklı ortalama tıklama oranları sorununu daha iyi çözmek için, genellikle sahne özelliklerinin eklenmesi gerekir. Sahne portresi genellikle sadece sahne kimliğine sahiptir ve konum bilgisi bazı özel sahnelerde eklenebilir (örneğin: arama listesi).

Tablo: Sahne portresi

  • 4. Adım: Örnek verileri toplayın

Geçmiş karşılaşma tıklama verilerini toplayın. Toplanan veri boyutları şunları içerir: kullanıcı kimliği, öğe kimliği, sahne kimliği ve tıklanıp tıklanmayacağı. Ardından, modelin eğitim örnek verilerini elde etmek için kullanıcı portresi ile öğe portresini ilişkilendirin.

Tablo: Örnek veriler

  • Adım 5: Model özelliklerini oluşturun

Modelin girdisi, örnek verilerin model özelliklerinin yapılandırılmasıyla elde edilir.Model özellikleri, biri çapraz özellik, diğeri ise orijinal özellik olmak üzere iki türe ayrılır.

Çapraz özellik: kullanıcının kategori özelliğini seçin, öğenin kategori özelliğini ve üç boyutlu çapraz yapmak için sahne kimliğini seçin.Örneğin: kullanıcının geçmiş tıklama kaydı öğe1, öğe2, öğe kimliği özelliği I1 ve sahne özelliği sahne1'dir, ardından oluşturulmuştur Çapraz özellikler şunlardır: item1I1scene1, item2I1scene1.

Orijinal özellik: Orijinal özellik, doğrudan modelin giriş özelliği olarak portre özelliğini kullanmayı ifade eder.Genel olarak, öğenin genelleştirilmiş özelliği, öğenin soğuk başlatma özelliği veya sahnenin soğuk başlatma özelliği için orijinal özellik olarak kullanılır, örneğin: öğenin TO'su, öğenin ısısı , Öğenin etiketi vb.

Tablo: Model girişi

  • Adım 6: Model eğitimi

Modeldeki tüm özellikler üzerinde tek sıcak kodlama gerçekleştirin. Model özelliklerinin sayısının N olduğunu varsayarsak, önce her model özelliğine benzersiz bir 1-N kodlama verin, ardından her örneğin model giriş vektörü N boyutuna ve 0/1 değerine sahiptir 0, örneğin karşılık gelen sayıda özelliğe sahip olduğu anlamına gelir; 1, hayır anlamına gelir, örneğin: örnek 1, 1 ve 3 numaralı özelliklere sahiptir, ardından örnek 1'in model giriş vektörü (1,0,1,0 , 0, ...) ve ardından modelin parametrelerini eğitmek için modeli genel bir LR eğitmeni aracılığıyla eğitin.

  • Adım 7: Model kullanımı

Bir kullanıcıya u ve bir grup aday öğe verildiğinde, u kullanıcısına öğelerin nasıl önerileceği. Yukarıdaki yöntemle aday kümesindeki her bir öğe için kullanıcı u'nun model puanını hesaplayın ve model puanına göre azalan sırayla kullanıcıya önerin.

Microsoft yeni bir dizüstü bilgisayar piyasaya sürmeye maruz kaldı, yeni bir sistem Win10 Lite ile donatılacak mı?
önceki
Dünyanın İlk Çevrimiçi Oyun Esnek Kumaş Sisteminin Ön Çalışması: "Jian Wang 3" en otantik klasik güzelliği geri getiriyor
Sonraki
Yaşınızı test etme zamanı. Bu klasik oyun konsollarından kaç tanesini oynadınız? (Bölüm 2)
Moto P40 yeni makine pozlaması: 6,2 inç delikli ekran, 48 milyon piksel ana kamera
Spielberg ve HTC Vive, Apple ve Dashi Johnson, vb. Teknoloji devleri neden film çekmeye gitti?
Hala Android WeChat 7.0 beta sürümünü mü arıyorsunuz? WeChat 7.0'ı sormadan yükseltmeyi öğretecek bir numara
Tencent QQ Video 4.0 resmi olarak yayınlandı: yepyeni bir görünüm, temiz ve reklamsız
Wo Wallet Yeni Yıl Arifesi kırmızı zarfı aldı, editör 13 yuan aldı, Jingdong Meituan Taobao biletleri mevcut
269.900'den ön satış! Lexus UX listeleme süresi kesinleşti: 23 Ocak
İki dakika içinde, QQ WeChat'in tüm yetkili uygulamalarını nasıl kontrol edip iptal edeceğinizi söyler misiniz?
Harika atılım! Baidu, "Dragon Ball" daki savaş gücü dedektörü teknolojisini gerçekleştirmeye bir adım daha yaklaştı
Zaobao: Suo Shuai önce kaybeder
Tam ekran sınırsız, ColorOS 6 genel beta lansmanının yeni deneyimini açın
Manchester United, Paris'e 0-2 kaybetti, Mbappe gol attı, Pogba kırmızıya boyandı
To Top