g u t x .com.tr İpek yolu - Çin'i anlamaya götürürüm

Makine öğrenmiyor: CTR serisi (5) CTR tahmini-MLR algoritması

MLR algoritması, alibaba tarafından 2012'de önerilen ve kullanılan ve 2017'de yayınlanan bir reklam tıklama oranı tahmin modelidir. MLR modeli, verilere uyması için parçalı doğrusal bir yöntem kullanan doğrusal LR modelinin bir genellemesidir. Temel fikir, bölme ve yönetme stratejisini benimsemektir: sınıflandırma alanının kendisi doğrusal değilse, alanı uygun bir şekilde birden çok bölgeye bölün ve her bölge doğrusal bir şekilde yerleştirilebilir ve son olarak MLR'nin çıktısı çoklu hale gelir. Alt bölgelerin tahmin edilen değerlerinin ağırlıklı ortalaması. Aşağıdaki şekil (C) 'de gösterildiği gibi, 4 dilim MLR modelinin kullanılmasının sonucudur.

Yukarıdaki formül, MLR'nin amaç fonksiyonudur, burada m, parça sayısıdır (m = 1 olduğunda, MLR, LR modeline dejenere olur);

Parça uzayının bölünmesini, yani bir örneğin belirli bir parçaya ait olma olasılığını belirleyen bir kümeleme parametresidir;

Parça uzayındaki tahmini belirleyen sınıflandırma parametresidir; ve ww öğrenilecek parametrelerdir. Nihai modelin tahmin edilen değeri, tüm segmentlere karşılık gelen alt modellerin tahmin edilen değerinin beklentisidir. Veri bölme kuralı şu şekildedir: özellik parçalarının sayısı m = 1 olduğunda, yukarıdaki MLR'de LR; m = 4'e dejenere olur. M ne kadar büyükse, modelin uydurma yeteneği o kadar güçlüdür, genellikle m = 12'dir.

MLR modeli, büyük ölçekli seyrek veriler üzerinde doğrusal olmayan uydurma yeteneğini araştırır ve gerçekleştirir.Parçacıkların sayısı yeterince büyük olduğunda, güçlü doğrusal olmayan yeteneğe sahiptir; aynı zamanda, model karmaşıklığı kontrol edilebilir ve iyi bir genelleme yeteneğine sahiptir; LR modelinin otomatik özellik seçme yeteneği.

MLR modeli fikri çok basittir. Zorluk ve zorluk, MLR modelinin amaç fonksiyonunun dışbükey ve pürüzsüz olmamasıdır, bu da geleneksel gradyan iniş algoritmasını uygulanamaz kılar. İlgili ayrıntılar için lütfen şu makaleye bakın: Gai ve diğerleri, "Reklam Tıklaması Tahmini için Büyük Ölçekli Verilerden Parça Bazlı Doğrusal Modelleri Öğrenin".

Öte yandan, MLR modeli, gizli bir katmana sahip bir sinir ağı olarak görülebilir. Aşağıdaki şekilde gösterildiği gibi, x, büyük ölçekli seyrek bir girdi verisidir MLR modelinin ilk adımı, biri kümeleme Gömme (yeşil) ve diğeri Gömme (kırmızı) olarak sınıflandırılan iki bölüme ayrılmış bir Gömme işlemi gerçekleştirmektir. Her iki çıkıntı da düşük boyutlu bir alana yansıtılır, boyut, MLR modelindeki dilim sayısı olan m'dir. Projeksiyon tamamlandıktan sonra çok basit bir iç çarpım (İç Çarpım) işlemi ile tahmin yapılabilir ve y çıktısı elde edilir.

Temel bilgi

Optimizasyon:

1) Tıraşlığın azalması:

Boyut: birinci türev, yön: türevin negatif yönü. Amaç fonksiyonun Taylor birinci dereceden genişlemesinden elde edildi

2) Newton yöntemi:

Boyut: birinci türev, yön: Hisense matrisinin tersi. Amaç fonksiyonunun Taylor ikinci dereceden açılımından bulun

3) Quasi-Newton yöntemi (LBFGS): Newton yönü yaklaşık olarak değiştirilir ve her örnek aşağıdaki üç parametreyi kaydeder: delta x, delta derecesi ve p:

Artımlı değiştirme, Newton yönünü D hesaplama

LBFGS yöntemi, ilk türev medyan teoremi aracılığıyla Hisense matrisinin (karmaşıklık çok büyük) hesaplanmasını önler. Ancak L1 normu türetilemez, bu nedenle OWLQN yöntemine ihtiyaç vardır.

4) OWLQN:

(1) Alt gradyan aşağıdaki gibi tanımlanır,

(2) Yönlendirilmemiş nokta için sol veya sağ ikincil eğimi aşağıdaki gibi alın

Sezgisel açıklama, sol kısmi türevi kullanmayı planladığınızda, bunun negatif çeyrekte olduğu anlamına gelir, bu nedenle, çapraz çeyreği önlemek için, güncellemeden sonra parametrenin negatif çeyreğe hareket etmesini sağlamak için negatif bir değer eklemeniz gerekir; sağ kısmi türevi kullanmayı planladığınızda , Bu, pozitif kadranda her seferinde bir pozitif değerin eklenmesi gerektiği anlamına gelir, böylece parametre, çeyreği geçmekten kaçınmak için güncellemeden sonra pozitif çeyreğe ilerleyecektir; aksi takdirde, alt gradyanı yalnızca doğrudan 0 olarak ayarlayabilirsiniz.

(3) Çeyrek arama satırı araması:

X 0 noktasında olmadığında, x_i'nin bulunduğu kadranda çizgi araması yapılır; model parametresi 0 noktasındaysa (2) alt gradyan kısıtlamasının çeyreğinde çizgi araması yapılır.

MLR algoritması

Algoritma formülü aşağıdaki gibidir:

Sınırın iniş yönünü hesaplayın:

1 Gradyan boyutunu hesaplayın: teta 0'da türevlenemez, dij işaret fonksiyonunu alın.

2 Son azalan yönü hesaplayın p:

OWLQN ile aynı 3 çeyrekte gradyan inişi, satır arama:

Makaleye göre MLR ve LBFGS arasında üç fark var:

1) OWLQN'nin alt gradyanı hesaplaması gerekir, MLR'nin yönlü türevi hesaplaması gerekir;

2) Nihai iniş yönü p hesaplanırken, MLR de çeyrek daire kısıtı olmalıdır;

3) OWLQN'ye benzer çeyrek arama hattı araması.

Dağıtılmış çerçeve uygulaması

dağıtılmış

Kullanıcı özellik paylaşımı

Kişisel anlayış, hesaplamayı hızlandırmaktır, belirli özellikler aşağıdaki gibi bölünmüştür. Bunlar arasında c bir kullanıcı özelliğidir ve nc, kullanıcı olmayan bir özelliktir.

Deneysel sonuçlar

Denemenin ekran görüntüsü çıkarılır ve belirli grafik referans kağıdında görüntülenebilir.

Ordinat, bellek kullanım oranıdır ve özellik paylaşma tekniği hızı üçe katlamıştır.

Referans makale:

Reklam Tıklaması Tahmini için Büyük Ölçekli Verilerden Parça Bazında Doğrusal Modeller Öğrenme

Çoğu çevrimiçi oyunu sorunsuzca çalıştırabilir! 2500 yuan giriş seviyesi oyun platformu

Zhejiang'daki Anhui Yangtze Nehri Deltası'ndaki arkadaş çevresini ziyaret edin

: LOL ve CF'yi elde etmek kolaydır! 2000 yuan giriş seviyesi bağımsız ekran platformu yapılandırması

: Makine öğrenmiyor: bilgi grafiği muhakemesine dayalı ilişki kesintisi

: Kullanma izni vermiyor musunuz? Uygulama İşlemleri: var olmayan

: Bu Apple iPhone7 / 7Plus telefon kılıfları çirkin mi? Ama çok pratikler

: Makine öğrenmiyor: o zamandan beri evrişimli sinir ağını (CNN) anlıyor

: Düşük kaliteli platformu sonuna kadar taşıyın! 1750 yuan Intel giriş seviyesi çekirdek ekran yapılandırması

: Ellerinizi ve ayaklarınızı takabilirsiniz.Huawei Bracelet 3e incelemesi: 109 yuan özel koşu duruşu düzeltici

: Çin Ulusal Olimpiyatları 0-1 üç dış yardım Suning, Edel topu kazandı

: Bu ürünlerin satışları çok yüksek! Apple iPhone6 / 6Plus cep telefonu kılıfı ekranı

: PPTV 3 tam ekran TV yayınladı: Youku üyeleriyle bağlantı kurun

: 80'ler sonrası neslin rüya ürünü! Sony WM-EX5 teyp sürücüsü ekranı

: 2019 başlıyor! Huawei, yeni yılda ağır faydalar sağlamak için "koi" çekiyor: netizenler deli oynuyor

g u t x .com.tr İpek yolu - Çin'i anlamaya götürürüm

Makine öğrenmiyor: CTR serisi (5) CTR tahmini-MLR algoritması

İlgili bilgi

Makine öğrenmez: ayrıntılı sinir ağı açıklaması, ileri yayılma ve geri yayılma

Bireysel vergi değişikliği taslağı açıklandı. 5.000 yuan "eşiğin" Ekim ayından itibaren uygulanması bekleniyor.

Trendleri takip etmek de moda, yolsuz bir bilgisayar kurun! On Bin Yuan AMD Ryzen Oyun Platformu

Odak noktası | Uçak bileti fiyatlarında% 10 artış! Bu şehirlere sık sık gelenler dikkat etmeli ...

Şu anda en uygun maliyetli ve güvenilir tüm modül güç kaynağıdır! Cooler Master V550 kutudan çıktı

Siviller için entegre su soğutma çağına girerken, Cooler Bingshen B120'yi kurma deneyimi

Eski parçaları yeni kutularla değiştirin, önce Marcel 1 kasasını takın ve üç yıl daha savaşın

Arsa tersine döndü! Lei Jun'un övdüğü 00 sonrası CEO, intihale maruz kaldı, tamamen aynı!

Makineler öğrenmez: Klasik CNN modelini gözetleyin; diğer dağların yeşim taşı taşa saldırabilir

On yıldan daha uzun bir süre önce yüksek fiyatlı malların hepsi artık e-atık haline geldi Onları hiç kullandınız mı?