1. Giriş
LR (Lojistik Regresyon) algoritmasının özü, doğrusal bir regresyon işlevidir. Algoritma, esas olarak tıklama oranı tahmini gibi iki kategorili senaryolar için kullanılır. Algoritma formülü aşağıdaki gibidir:
X, modelin girdisidir
2. Model çözme
Modelimizi gradyan inişi ile çözüyoruz. Örnek olarak tıklama oranı tahminini alın, önce örnekleri toplayın. Değişkenler şu şekilde tanımlanır:
Çapraz entropi kaybı işlevini tanımlayın:
Minimum los (w, b) 'ye karşılık gelen w, b, gradyan iniş yöntemi için gerekli model parametresidir.
3. İş uygulamaları
Mevcut öneri sistemi endüstrisinde, LR algoritmasının popüler yöntemi, özellikleri büyük ölçekte (tek etkin kodlama) ayırmak ve ardından bunu LR modeline getirmektir. Örnek olarak reklam tıklama oranı modelini alın. Adımlar aşağıdaki gibidir:
Özellik kategorilerine göre kullanıcı portreleri oluşturun ve kategorinin altındaki tüm özellikleri ayırın, örneğin: kullanıcı geçmişine göz atma öğe kayıtları, kullanıcı sosyal özellikleri, modeller aracılığıyla kullanıcılar için etiketler vb.
Tablo: Kullanıcı Portresi
Bir öğe portresi oluşturmak için, öğe özellik kategorilerini sınıflandırmak da gereklidir Kategori altındaki özellikler, öğe kimliği, öğe etiketi, öğe popülerliği vb. Gibi ayrıklaştırılmıştır.
Tablo: Kullanıcı Portresi
Gerçek iş uygulamasında, bir modelin genellikle birden fazla senaryo kullanması gerekir ve farklı senaryolardaki öğelerin ortalama tıklama oranları büyük ölçüde değişir.Farklı senaryolarda farklı ortalama tıklama oranları sorununu daha iyi çözmek için, genellikle sahne özelliklerinin eklenmesi gerekir. Sahne portresi genellikle sadece sahne kimliğine sahiptir ve konum bilgisi bazı özel sahnelerde eklenebilir (örneğin: arama listesi).
Tablo: Sahne portresi
Geçmiş karşılaşma tıklama verilerini toplayın. Toplanan veri boyutları şunları içerir: kullanıcı kimliği, öğe kimliği, sahne kimliği ve tıklanıp tıklanmayacağı. Ardından, modelin eğitim örnek verilerini elde etmek için kullanıcı portresi ile öğe portresini ilişkilendirin.
Tablo: Örnek veriler
Modelin girdisi, örnek verilerin model özelliklerinin yapılandırılmasıyla elde edilir.Model özellikleri, biri çapraz özellik, diğeri ise orijinal özellik olmak üzere iki türe ayrılır.
Çapraz özellik: kullanıcının kategori özelliğini seçin, öğenin kategori özelliğini ve üç boyutlu çapraz yapmak için sahne kimliğini seçin.Örneğin: kullanıcının geçmiş tıklama kaydı öğe1, öğe2, öğe kimliği özelliği I1 ve sahne özelliği sahne1'dir, ardından oluşturulmuştur Çapraz özellikler şunlardır: item1I1scene1, item2I1scene1.
Orijinal özellik: Orijinal özellik, doğrudan modelin giriş özelliği olarak portre özelliğini kullanmayı ifade eder.Genel olarak, öğenin genelleştirilmiş özelliği, öğenin soğuk başlatma özelliği veya sahnenin soğuk başlatma özelliği için orijinal özellik olarak kullanılır, örneğin: öğenin TO'su, öğenin ısısı , Öğenin etiketi vb.
Tablo: Model girişi
Modeldeki tüm özellikler üzerinde tek sıcak kodlama gerçekleştirin. Model özelliklerinin sayısının N olduğunu varsayarsak, önce her model özelliğine benzersiz bir 1-N kodlama verin, ardından her örneğin model giriş vektörü N boyutuna ve 0/1 değerine sahiptir 0, örneğin karşılık gelen sayıda özelliğe sahip olduğu anlamına gelir; 1, hayır anlamına gelir, örneğin: örnek 1, 1 ve 3 numaralı özelliklere sahiptir, ardından örnek 1'in model giriş vektörü (1,0,1,0 , 0, ...) ve ardından modelin parametrelerini eğitmek için modeli genel bir LR eğitmeni aracılığıyla eğitin.
Bir kullanıcıya u ve bir grup aday öğe verildiğinde, u kullanıcısına öğelerin nasıl önerileceği. Yukarıdaki yöntemle aday kümesindeki her bir öğe için kullanıcı u'nun model puanını hesaplayın ve model puanına göre azalan sırayla kullanıcıya önerin.