"Öneri Algoritması Uygulaması" Müzik Çalma Listesi Akıllı Öneri

Yazıt: Öneri motoruna dayalı sınıflandırma, demografik temelli (kullanıcılar aynı zamanda yaş veya cinsiyete göre benzer kullanıcılar olarak değerlendirilir) ve içerik temelli (öğeler, insan faktörleri dikkate alınmadan aynı anahtar kelimelere ve etiketlere sahiptir) olarak ikiye ayrılan veri kaynağına dayanır. Ve işbirliğine dayalı filtrelemeye dayalı öneriler (keşfedilen öğeler. İçerik veya kullanıcıyla ilgili öneriler. Aşağıda açıklanan üç alt kategoriye ayrılmıştır);

Kuruluş yöntemine göre, ilişkilendirme kurallarına (Apriori algoritması algoritması en etkili madencilik Boole ilişkilendirme kurallarından biridir), öğelere ve kullanıcılara (kullanıcı öğesinin iki boyutlu matris açıklaması kullanıcı tercihlerini, kümeleme algoritmasını tanımlar) ayrılabilir. Sık kullanılan öğe setleri algoritmaları) ve model tabanlı öneriler (makine öğrenimi, bilgisayarların insan beyni gibi sürekli öğrenmesini sağlayan makine öğrenimi, yapay zekanın bir alt alanıdır).

Öneri algoritması : Gizli Faktör algoritması.

Uygulama alanı "Netease Cloud Müzik Şarkısı Kişiselleştirilmiş Öneri", "Douban Radyo Müzik Önerisi" vb.

Anahtar faktör : Puanlama matrisinin UV ayrışımının anlaşılması.

Algoritma fikri :

Her kullanıcının (kullanıcı) kendi tercihleri vardır, örneğin, A küçük ve taze sever, gitar eşliğinde, Faye Wong ve diğer unsurları (gizli faktör) sever. Bir şarkının (öğenin) bu öğelere sahip olduğunu varsayarsak, şarkı kullanıcıya önerilir, yani öğe kullanıcıyı ve müziği bağlamak için kullanılır.

Herkesin farklı öğeler için farklı tercihleri vardır ve her şarkı farklı öğeler içerir.

Bu tür iki matris bulmayı umuyoruz:

reklâm

ayrıntılara bakınız

Aslında, gizli faktörün, kullanıcı niteliklerinin ve müzik niteliklerinin iki boyutlu bir azalması olduğunu anlayabilirsiniz (yüksek boyutlu kullanıcı \ müzik özelliklerinin boyutluluğunu ifade için k boyutlu bir gizli alana indirgemeye eşdeğer). Kullanıcı özniteliği \ müzik özniteliğinin tümü k boyutlu bir vektörle temsil edilir ve nihayet belirli bir müzik için belirli bir kullanıcının puanının bu iki vektörün iç çarpımı olduğu tahmin edilir.

1. Farklı kullanıcıların farklı öğeler için tercih derecesini belirtir, 1 çok fazla, 0 beğenmeme anlamına gelir. Örneğin:

2. Gizli faktör-müzik matrisi P, yani her müzik türü çeşitli öğeler içerir. Örneğin aşağıdaki tabloda, Müzik A küçük ve taze bir müziktir.Küçük ve tazeyi içeren Gizli Faktör 0.9, ağır lezzet 0.1 ve zarif olan 0.2 ...

Bu iki matrisi kullanarak, Zhang Sanın müzik A tercihinin şudur: Zhang Sanın küçük ve taze müzik tercihi A, küçük ve taze malzemeler içerir + ağır tatlar tercihi Müzik A, zarafet için ağır tatlar içerir + Tercihler * Müzik A zarif malzemeler içerir +

Yani: 0.6 * 0.9 + 0.8 * 0.1 + 0.1 * 0.2 + 0.1 * 0.4 + 0.7 * 0 = 0.69

Her kullanıcı, farklı şarkılar için farklı kullanıcıların puan matrisini elde etmek için her şarkıyı bu şekilde hesaplar. (Buradaki kırılma dalgası çizgisinin tahmini puanı temsil ettiğini unutmayın ve ardından gerçek puanı temsil etmek için dalga çizgisi olmadan R'yi kullanacağız):

Bu nedenle ekibimiz, Zhang San'ın dört şarkısı arasında en yüksek puanı alan B'yi, en yüksek puanı Li Si'ye ve B'yi Wang Wu ile öneriyor.

Bir matris ile temsil edildiğini varsayarsak:

Şu soru geliyor, bu gizli faktör nasıl oluştu?

Kullanıcıların müziği kendi başlarına sınıflandırmaları ve bize tercih katsayılarını muazzam miktarda veri karşısında söylemeleri açıkça gerçekçi olmadığı için, aslında elde edebileceğimiz veriler yalnızca gerçek kullanıcı davranış verileridir. Kullanmaya devam ettiğimiz kantifikasyon standartları: tek döngü = 5, paylaşım = 4, koleksiyon = 3, aktif oynatma = 2, dinleme = 1, atlama = -2, karartma = -5, analiz sırasında elde edilebilecek gerçek puan Matrix R. Yani, girdi matrisi şuna benzer:

Aslında, bu çok seyrek bir matristir, çünkü çoğu kullanıcı tüm müziklerin yalnızca küçük bir bölümünü dinlemiştir.

Gizli faktörleri bulmak için bu matris nasıl kullanılır? Buradaki ana uygulama, matrisin UV ayrışmasıdır. Yani, yukarıdaki puan matrisi iki düşük boyutlu matrise ayrıştırılır ve Q ve P iki matrisinin çarpımı gerçek puan matrisini tahmin etmek için kullanılır ve umarız tahmin edilen puan matrisi

Büyük bir puanlama matrisi için X (m * n, m kullanıcı sayısıdır. N müzik sayısıdır. Matristeki her öğe bu müzik için kullanıcının derecelendirmesidir, açıkçası bu çok seyrek bir matris olacaktır), Bu skor matrisinden iki ayrıştırılmış matris U (m * k. Kullanıcı özniteliklerinin gizli alanda gösterimi) ve V (n * k, müzik özniteliklerinin gizli alanda temsili) elde etmeyi umuyoruz. U'nun transpoze (V) ile çarpılması, X matrisine mümkün olduğunca yaklaşabilir, yani, çıkarılan kullanıcı öznitelikleri \ müzik öznitelikleri. Orijinal girdi büyük puanlama matrisi X'i "mümkün olduğunca geri yükleyebiliriz" - bu ayrıştırmaya "UV ayrışması" denir.

Gerçek puan matrisinden çok fazla farklılık göstermeyin, yani aşağıdaki amaç fonksiyonunu çözün:

Bu, optimizasyon teorisini içerir. Pratik uygulamalarda, genellikle arkaya 2 normluk bir ceza eklenir ve daha sonra P ve Q matrislerinin tahmin edilen değerleri gradyan iniş yöntemi kullanılarak elde edilebilir. Burada onu genişletmeyeceğiz. Örneğin, yukarıda verdiğimiz örnek iki matrise ayrıştırılabilir:

Beklenen puan matrisini elde etmek için bu iki matrisi çarpın:

Kullanıcının dinlediği müziği kaldırdıktan sonra, en yüksek puana sahip müziği seçin ve kullanıcıya önerin (kırmızı).

Referanslar :

Veri Bilimcisi Bilgi Grafiği
önceki
Bu çizgi roman dizisini okuduktan sonra, güvenilir bir yama panelini nasıl seçeceğinizi öğreneceksiniz!
Sonraki
Fetion dirildi mi? China Mobile, yalnızca veri göndermekle kalmayan, aynı zamanda ücretsiz aramalar da yapan Hefeixin'i piyasaya sürdü
Yazın en eğlenceli oyun hangisi? Gelin ve küçük aslan Lisesi oyun önerisini görün ~
Bugünün "Satın Al, Satın Al, Satın Al, Yaz Tatili" önerisi harika bir görünüme sahip, sevdiğiniz biri olmalı
Alipay, QR kodunu tarayarak altın yumurtalar alabilir ve taze yumurtaları kullanabilir. Şehriniz var mı?
Bir kaçış üçlemesi, acıyı senden uzak tut
IQIYI arama sıralama modeli yineleme yolu
Alipay UnionPay Cloud QuickPass için yeterince kırmızı paket almadınız mı? JD.com'un anlayacağı başka bir refah dalgası var
İPhone 8'in ilk 360 derecelik görünümü yayınlandı: tasarım artık merak uyandırmıyor!
Huawei'nin sırrı: 5G ve 700 milyar
Ali öneri motorunun kullanımının özeti
Google Store'dan indirin, yabancı sunuculardaki oyunları hızlandırın, tek ihtiyacınız olan bu
Daha önce konuşursak, böyle toplantılar yapabileceğiniz ortaya çıktı! Bütün utançlar giderildi
To Top