Makine öğrenmiyor: Alibaba'nın arama önerilerinde derin öğrenme uygulaması

Açıklanması gereken ilk şey arama senaryosu, gerçek durum teknolojisi cep telefonu Taobao arama sayfası aşağıdaki gibidir:

Aranan ürün kelimesini arama kutusuna girmektir ve ardından sistem, kapsamlı bir yargıya varmak için kullanıcının özelliklerini, ürün özelliğini ve arama kelimesinin özelliğini bütünleştirir ve nihai öneri sonucunu verir. Gerçek operasyonda, Taobao'daki emtialar yüz milyonlarca mertebesinde olduğundan, bu süreç aşamalar halinde gerçekleştirilir:

1 Arama terimlerini ve ürün adlarını eşleştirin ve ilgili ürünleri seçin (yüz milyonlarca > Milyon)

2 Ürün özelliğinin bilgisine göre, 1. adımda üretilen ürünü kabaca sıralayın (milyon- > Milyon)

3 Ürün özelliklerini, arama terimlerini ve kullanıcı özelliklerini kapsamlı bir şekilde değerlendirin, 2. adımda üretilen ürünleri hassas bir şekilde sıralayın, ilk k'yi çıkarın ve kullanıcılara önerin (on bin > k)

İnce sıralarda kullanılan temel model aşağıdaki gibidir:

Tüm modelin nispeten basit olduğu görülmektedir.Derin öğrenme yöntemi kullanıldığından, giriş özellikleri doğrudan ID özellikleridir ve herhangi bir istatistiksel özelliğe ihtiyaç yoktur.Model otomatik olarak öğrenebilir ve SFC katmanı bir Gömme katmanı olarak kabul edilebilir. Daha sonra, çoklu görev fikrini kullanarak gelişmiş bir yöntem tanıtıldı. Açıkça söylemek gerekirse, 2. adımın kaba düzenlemesini eğitim için 3. adımın ince düzenlemesini birleştirmektir. Model aşağıdaki gibidir:

Şeklin altındaki üç alan parametresi paylaşılan kısımlardır, yukarıdaki sol kısım ince ayıklama kısmı ve sağ kısım kaba tasnif kısmıdır.Kaba tasnif kısmının sadece madde bilgilerini kullandığını görebilirsiniz.

Yukarıdakilerin tümü genel senaryolardır, ancak "Double Eleven" gibi özel bir tarihle karşılaştığınızda genel senaryolara uyum sağlayan bu model uygun değildir.Bu özel senaryo için aşağıdaki model önerilmiştir:

Özünde, "yapay tasarım özellikleri + derin öğrenme özellikleri" nin bir füzyon modelidir. Sözde çoklu modalite, "normallik + terfi modu" dur. Soldaki normal madencilik, yukarıda tanıtılan modeldir ve normal koşullar altındaki kullanıcı özellikleridir. , Ürün özelliklerinin ve arama terimi özelliklerinin temel interaktif özellikleri; sağ bölüme girilen özellikler manuel olarak tasarlanmış istatistiksel ve kimlik özellikleri olup, "Double Eleven" senaryosu için özel olarak tasarlanmış bazı gerçek zamanlı özellikler (bu bölüm Özellikler normalden tamamen farklıdır, çünkü birçok mağaza bu gün önemli indirimler sunacaktır.Son olarak, model öğrenirken çevrimiçi öğrenme fikrini kullanır ve yalnızca son katmanın veya birkaç katmanın parametrelerini eğitir.

Sırada önerilen senaryo var.Arama ve tavsiye iki benzer ancak farklı alandır.İnce sıralama aşamasında kullanılan iki model benzerdir, ancak ikisinin denetim aşamasındaki hedefleri farklıdır. EVET: Arama, deniz tarafından seçilen ve arama terimiyle ilgili bir üründür; öneri, deniz tarafından seçilen ve kullanıcının geçmiş davranışıyla ilgili bir üründür. Yazar tarafından sunulan senaryo, aşağıda gösterildiği gibi mobil Taobao ayrıntıları sayfasının altındaki tavsiyedir:

Gereksinim sadece aynı mağazadaki diğer bebekleri önermek olduğundan, ancak birbirleriyle ilgili veriler seyrek olduğundan, doğrudan eğitim performansı büyük ölçüde etkileyecektir, burada bu sorunu çözmek için göç öğrenme fikri kullanılır, model Aşağıdaki gibi:

Burada kullanılan geçiş stratejisi, özellik düzeyinde geçiş öğrenimine dayanmaktadır.Solda, tüm e-ticaret özelliklerini kullanır (yani, arama, öneri ve reklam dahil olmak üzere Alibaba Group'un tüm senaryolarındaki verileri kullanmak) ve giriş katmanındaki tüm senaryoları filtreler. Ortak özellikler, model eğitimine beslenir (arama sahnesindeki arama terimlerini kaldırın ve önerilen sahnede kullanıcının mevcut ürün kelimelerini önerin), kullanıcının son satın alma veya tıklama davranışına göre modelleyin ve kullanıcıların ve ürünlerin vektörleştirilmiş temsilini öğrenin. Ardından tüm senaryolarda öğrenilen özellikleri alın. Bunu önerilen senaryoda bir girdi olarak kullanın ve senaryoya karşılık gelen günlük özelliğini aynı anda ekleyin ve doğrudan GBDT veya DL'yi eğitin.

Son olarak, Youku kısa video arama senaryosundaki öneri tanıtıldı. Senaryolar aşağıdaki gibidir:

Kullanıcı bir arama terimi girer ve ilgili kısa videoyu önerir. Model yapısının tamamı aşağıdaki gibidir:

Modelin tamamı, yukarıda bahsedilen e-ticaret arama öneri modeline çok benzer. Kısa video arama kullanıcıları nispeten seyrek olduğundan, burada bir kullanıcıyı karakterize ederken, kullanıcının gördüklerinin üst üste binmesini kullandıklarına dikkat edilmelidir. Video listesi Gömme işlemi gerçekleştirilir. Buradaki üst üste binme ortalama bir yöntemdir.Kullanıcıların geçmişte gördükleri videoların çeşitliliği nedeniyle burada ortalama yöntemde iyileştirme için yer vardır, yani dikkat mekanizmasını kullanarak, değişiklikten sonraki model aşağıdaki gibidir:

Kullanıcının gördüğü video listesini kullanarak bu kullanıcı karakterizasyonu yöntemi öğrenmeye çok değer, özellikle de kullanıcı sayısı nispeten az olduğunda, çok iş.

Orijinal: https://blog.csdn.net/guoyuhaoaaa/article/details/80882449

"Kuşak ve Yol" Zirve Forumu: Gıda Füzyonunun "Kuşak ve Yolu"
önceki
Dahi bir kız, Wu Junmei ve David'i olay yerinde tartışmaya kışkırtır.
Sonraki
Grafik BERT (NLP'de transfer öğrenimi)
Pingxiang, Hebei: "Buğday Tarlası Kontrolü" gelirin artmasına yardımcı oluyor
Dağıtılmış kilit ilkelerini öğrenme ve düşünme-redis dağıtılmış kilit, zookeeper dağıtılmış kilit
İlkokul oluşumu, Halk Donanmasına haraç vermek için "Deniz Geçidi" düzenledi
"Like You Me Too" da kabin atmosferi donma noktasına geldi .. Erkek konuk neden öfkeyle ayrılıyor?
Saf kuru ürünler | Şimdiye kadar gördüğüm daha kapsamlı BERT ürünleri, şiddetle tavsiye edilir
Hızlı yaşlanmana şaşmamalı! Ama çoğu insan sık sık ...
Transformer ve BERT Üzerine Kısa Bir Konuşma
Ne dağınıklık! Havaalanının camı hayranlar tarafından parçalandı ve Kamu Güvenliği Bakanlığı yardım edemedi ama konuştu
Saf kuru ürünler | Boosting ailesinin Adaboost algoritması
Akşam saat 2'de Zhejiang'lı bir kadın 120'yi aradı, ama ambulanstan çıkan kocasıydı! orijinal
Öneri algoritması yeterince doğru değil mi? Bilgi grafiği çözsün
To Top