Kaynak: Sütunu bilin
Yazar: Wang Zhe
Bu makale hakkında 5400 Word, önerilen okuma 10+ dakika.
Göze çarpmayacağını düşündüğüm şey, Youtube mühendislerinin değerli mühendislik deneyimini de gizliyordu.
İşte Wang Zhe'nin makine öğrenimi notları: Her bir ila iki haftada bir, bir algoritma mühendisinin bakış açısından bilgisayar reklamcılığı ve öneri sistemleriyle ilgili bazı makaleleri açıklayacağım. Makalelerin seçimi aşağıdaki üç koşulu karşılamalıdır:
Bu hafta Youtube'un "YouTube Önerileri için Derin Sinir Ağları" adlı derin öneri sistemi makalesini tartışacağız. Bu bir 2016 makalesi. Bugünün standartlarına göre, bu konuda yeni bir şey yok. Bunu iki yıl önce de okudum. Bunu bu makalenin arkasına koydum ama birkaç gün önce bu makaleyi tekrar okuduğumda birçok parlak nokta keşfettim, hemen hemen her yerde rutin ve deneyimle ve bir tanrı olarak şaşırmaktan kendimi alamadım. Bu ilahi metin bende iki noktada derin bir etki bıraktı:
Çok saçma değil, bu makaleyi iki kez okumanın farklı deneyimlerini ve kazanımlarını sizinle paylaşmama izin verin.
Bu yazıyı ilk okuduğumda herkesin algoritmanın mimarisine odaklandığını düşünüyorum .. Bugün derin öğrenme öneri sistemi büyük şirketlerin "temel operasyonu" haline geldiğinde, YouTube algoritma mimarisine şaşırmıyor. Burada, makaledeki derin öğrenme öneri sisteminin algoritma mimarisini hızlı bir şekilde tanıtalım.
Söylemeye gerek yok, dünyanın en büyük UGC video sitesi olan Youtube'un kullanıcı öneri senaryosu, milyonlarca video ölçeğinde kişiselleştirilmiş öneriler gerektiriyor. Çevrimiçi sistem gecikmesi sorunu göz önüne alındığında, aday videolar çok büyük olduğundan, doğrudan önermek için karmaşık bir ağ kullanmak uygun değildir, bu nedenle Youtube, tüm öneri sürecini tamamlamak için iki katmanlı derin bir ağ kullanır:
İlk olarak aday nesil modelinin mimarisini tanıtın:
Youtube Aday Oluşturma ModeliBu ağa aşağıdan yukarıya bakıyoruz, alttan giriş, kullanıcının izlediği videonun gömme vektörü ve arama teriminin gömme vektörü. Bu gömme vektörünün nasıl oluşturulduğuna gelince, yazarın orijinal kelimeleri şu şekildedir:
Kesintisiz kelime dili modellerinden ilham alarak, sabit bir kelime dağarcığındaki her video için yüksek boyutlu yerleştirmeleri öğreniyor ve bu yerleştirmeleri ileri beslemeli bir sinir ağına besliyoruzBu yüzden yazar, videoyu ve arama jetonunu gömmek için önce word2vec yöntemini kullandı ve sonra onu girdi olarak kullandı.Bu aynı zamanda yerleştirmenin "temel işlemidir", bu nedenle çok fazla tanıtmaya gerek yoktur, tabii ki diğeri herkese aşina olmalıdır. , Bir gömme katmanı ekleyerek yukarıdaki DNN ile eğitmek mi? İki yöntemden hangisi daha iyi veya daha kötü? Uygulanabilir durumlar nelerdir? Tartışabilirsiniz.
Özellik vektörü ayrıca kullanıcının coğrafi konumunun yerleştirilmesini, yaşını ve cinsiyetini de içerir. Sonra tüm bu özellikleri birleştirin ve bunları üst ReLU sinir ağına aktarın.
Üç katmanlı sinir ağından sonra softmax işlevini görüyoruz. Burada Youtube öğrencileri, bu sorunu bir sonraki izlemeyi öneren kullanıcıların sorunu olarak görüyorlar, bu nedenle çıktının tüm aday videolarda bir olasılık dağılımı olması gerekiyor ki bu da doğal olarak bir çoklu sınıflandırma problemidir.
Tamam, derin öğrenmenin bu "temel işlemleri" seti Youtube'un aday oluşturma ağını oluşturuyor. Olağanüstü görünüyor, ancak yine de bazı gizli sorunlar var, örneğin:
Bu sorunları ilk okuduğumda derinlemesine düşünmedim ama mühendislik uygulamasında kaçınılmaz olarak karşılaşılacak sorunlardır.Sonra yazıda çözümlerini derinlemesine tanıtacağız.
Artık yüzlerce aday seti elde edildiğine göre, bir sonraki adım, sıralama modelini ince sıralama için kullanmaktır.Aşağıda, sıralama derin öğrenme ağının mimari diyagramıdır.
Youtube Sıralama Modeliİlk bakışta, yukarıdaki sıralama modeli aday nesil modeli ile aynı gibi görünüyor.Model mimarisi hala derin öğrenmenin "temel işlemidir". Tek fark özellik mühendisliğidir, hadi özellik mühendisliği hakkında konuşalım.
Aslında orijinal metin, bir sıralama modeli olarak başka bir DNN setini tanıtmanın amacının, aday video setini doğru bir şekilde sıralama amacına ulaşmak için videoyu, kullanıcıyı ve ikisi arasındaki ilişkiyi tanımlayan daha fazla özellik sunmak olduğunu da açıkça belirtti.
Sıralama sırasında, videoyu ve kullanıcının videoyla ilişkisini açıklayan daha birçok özelliğe erişimimiz var çünkü aday nesilde puanlanan milyonlar yerine yalnızca birkaç yüz video puanlanıyor.Özellikle soldan sağa özellikler şunlardır:
Yukarıdaki beş özellik arasında dördüncü ve beşinciye odaklanmak istiyorum. Çünkü bu ikisi, kullanıcı davranışının gözlemlenmesine iyi bir giriş niteliğindedir.
Dördüncü özelliğin arkasındaki fikir şudur:
En önemli sinyallerin, bir kullanıcının öğenin kendisiyle ve diğer benzer öğelerle önceki etkileşimini tanımlayanlar olduğunu gözlemliyoruz.Dikkat çekmek için bazı anlamlar vardır, burada kullanılır son izlemeden bu yana geçen süre Bu özellik, benzer videoları izleyen kullanıcılar arasındaki zaman aralığını yansıtır. Bunu kullanıcının bakış açısından düşünün. "DOTA Classic Review" kanalının videosunu yeni izlediysek, bu kanalın videosunu izlemeye devam etme olasılığımız yüksek. O zaman bu özellik, bu kullanıcı davranışını iyi bir şekilde yakalayabilir. .
Beşinci özellik #previous gösterimler Belirli bir dereceye kadar, aynı videonun aynı kullanıcıya sürekli olarak geçersiz şekilde maruz kalmasını önlemek için keşif fikri getirilir. Kullanıcıların izlemediği yeni videoların pozlama olasılıklarını artırmaya çalışın.
Şimdiye kadar, makaleyi ilk okumam bitti ve Youtube'un algoritmik çerçevesine dair bir konseptim var, ama her zaman bunun çok fazla olmadığını hissediyorum, çok fazla yenilik yok.
Ama gerçekten öyle düşünüyorsan, bu hala çok saf. Ali'nin Derin İlgi Ağı DIN Aradaki fark şu ki, DIN'nin dikkat mekanizmasını anlarsanız, kağıdının değerinin% 70'ini yakalayabilirsiniz, ancak bu makale, Yalnızca Youtube'un öneri sistem mimarisini anlarsanız, değerin yalnızca% 30'unu alırsınız. Peki kalan% 70'in değeri nerede?
Bu makaleyi bir mühendisin bakış açısından yeniden okurken, her zaman "nasıl başarılır" dizesiyle mücadele ediyordum ve daha önce bu makalenin mühendislik değerini büyük ölçüde görmezden gelmiştim. Aşağıda makalede çözülen çok değerli on sorunu listeliyorum:
Video önerisi alanında da çalıştığım için sorumlu bir şekilde yukarıdaki on sorunun çok değerli olduğunu söyleyebilirim. Ama bugün burada tek bir nefeste yazarken, biraz enerji eksikliği hissediyorum. . Eğer ilgileniyorsanız, beğenebilirsiniz Yukarıdaki on sorunun cevabını yarın detaylı olarak analiz edeceğim.
Yukarıdaki soruların cevapları tamamlandı, lütfen bir sonraki makaleme bakın
Tamam, işte Wang Zhe'nin makine öğrenimi notlarının ikinci makalesi. Seviye sınırlıdır. Şikayet edebilir, eleştirebilir ve hataları düzeltebilirsiniz.
Referans malzemeleri: YouTube Önerisi için Derin Sinir Ağları'ndaki dikkat mekanizması Önerici Sistemi Kağıt Listesi Öneri Sistemi Alibaba Derin İlgi Ağı (DIN) - Bitiş -Tsinghua-Qingdao Veri Bilimi Enstitüsü'nün resmi WeChat kamu platformunu takip edin " THU Veri Pastası "Ve kız kardeş numarası" Veri Pastası THU "Daha fazla ders avantajı ve kaliteli içerik elde edin.