Kuru ürünler | Kullanıcı davranışına göre video kümeleme şeması

Kişiselleştirilmiş bir öneri sisteminde, öğelerin öznitelikleri genellikle kullanıcının ilgi alanlarını anlamak için çıkarılır ve böylece bir öneri modeli oluşturulur. Öğelerin özelliklerini kullanıcı davranışından anlamak genellikle basittir, genellikle sadece bazı basit etiket istatistikleri. Meipai, içeriği anlamak için kullanıcı davranışını derinlemesine incelemek için, video içeriğini kümelemek için kullanıcının tıklama ve oynatma davranışını kullanır.Bir yandan video içeriğini görsel açıdan anlama sınırlamasını ortadan kaldırırken, diğer yandan insan dışı bir özet çıkarabilir. Kişiselleştirilmiş önerilerin etkisini iyileştirmek için bilgileri kategorilere ayırın.

Meitu Technology Salon'un dokuzuncu sayısında Meitu'dan Bai Yang, kullanıcı davranışına dayalı bir video kümeleme şeması tanıttı ve Meitu öneri sistemindeki bazı video kümeleme uygulamalarını tartıştı.

/ Meipai'de kümelemenin uygulama senaryoları /

Şekil 1'de gösterildiği gibi en soldaki ekran görüntüsü Meipai ana sayfasının UI arayüzüdür.Kullanıcı bu arayüzde 4-6 video görebilir.Bu sayfada video kümeleme uygulama senaryosu aşağıdaki gibidir: Arayüzde görüntülenen 6 video Aynı kümeye ait olan ve aralıklarla gösterilmeyecek iki video var.Bu durumda, kullanıcıların sınırlı bir sayfada daha fazla kategori görebilmesini sağlamak için video ekranında aynı kümeleme işlemini gerçekleştireceğiz. Öneri sonuçlarında çeşitlilik elde edin.

Şekil 1

İkincisi, benzer video alımının uygulama senaryosudur. Genellikle belirli bir videonun benzer videolarını veya benzer videoları bulmamız gerekir. Bu durumda, videonun hangi kümeye ait olduğunu bulmak için video kümelemeyi kullanabilir ve daha sonra bu kümeden benzer videoları bulabiliriz. Arama işlevi.

Üçüncü uygulama senaryosu, kümeleme yoluyla bazı niş videoları keşfetmek veya kısa dönem Popüler videolar, ürünlerin daha iyi operasyonel stratejiler oluşturmasına yardımcı olur.

Dördüncü senaryo, öneri stratejilerinin genişletilmesidir.Video kümeleme, bazı genel öneri stratejilerini gerçekleştirmek için kullanılabilir. Kullanıcının hangi kümelerle ilgilendiğini kümeleme yoluyla bulabiliriz. Örneğin, kullanıcının ilgilendiği kümeler yemek ve güzelliktir. Ardından, kullanıcının ilgilendiği kümelere göre videolar öneriyoruz.

Son sahne, videoların şu şekilde kümelenmesidir: özellik , Efekti iyileştirmek için sıralama modeline eklendi. Yukarıdakiler, Meipai'de video kümelemenin beş önemli uygulama senaryosudur.

Videonun içeriğini nasıl keşfediyorsunuz? En sezgisel yol şudur: Video içeriği veya resim Bu videoda ifade edilen bilgileri görüntünün perspektifinden çıkarmak için videodaki varlıkları (resimdeki yiyecek ve evcil hayvanlar gibi) görüntünün perspektifinden çıkaracağız; ikincisi, ses Açı (videodaki arka plan müziği veya ses gibi); üçüncü olarak video boyunca Metin (Video açıklaması, yorumlar, altyazılar vb.); Son olarak Video kapağı, anahtar kareler, kesintisiz ekran görüntüleri vb. Videonun ne anlattığını keşfedin.

Aynı zamanda, yukarıdaki yöntemlerin de kusurları vardır:

Video içeriği / resmi:

Ön bilgiye ihtiyacınız var

Metin:

Kapsam oranı eksik, açıklama doğru olmayabilir

Bu yüzden başlıyoruz kullanıcı davranışı Videonun içeriğine madencilik yapmak için, kullanıcı davranışı şu şekilde belirlenir: Kullanıcı portresi ile Video portre oluşturmak. Kullanıcı davranışı yoluyla içerik madenciliği uygulama senaryosu şu şekildedir: Büyük kullanıcıların çoğu iki video izler, bu iki videonun aynı izleyici kitlesine sahip olabileceği (yani iki videonun içeriği birbiriyle ilişkilidir) çıkarılabilir ve daha sonra bunu çıkarabilir. İki video aynı kümeye aittir, bu yöntem Önceden bilgi gerekmez .

Öyleyse, kullanıcı davranışı video kümeleme yoluyla hangi sorunların çözülmesi gerekiyor?

1. Kitle verileri. Meipai'nin günlük kullanıcı davranışı, T düzeyi birimlerdeki büyük verilere dayanmaktadır ve modelin her gün büyük miktarda veriyi işlemesi gerekir.

2. Model hızlı bir şekilde güncellenir. Her gün kullanıcılar tarafından yüklenen çok fazla yeni video olduğundan, bu videonun ait olduğu kümeyi olabildiğince çabuk bulmak gerekiyor.

3. Yorumlanabilirlik. Her bir kümenin örtük anlamını anlamak için, örneğin, bu video hem yemeğe hem de güzelliğe aittir, bunun bir güzellik yeme programı videosu olduğu sonucuna varabilirsiniz.

/ Video kümeleme şemalarının evrimi /

Yukarıdaki sorunlara yanıt olarak, şekilde gösterildiği gibi dört çözüm önerdik, dört çözümümüzün evrimi. İlk TopicModel konu modelinden Item2vec'e ve DSSM'ye anahtar kelime yayılmasına kadar, esas olarak bu dört modelin evrimi ve çevrimiçi etkiler hakkında konuşacağız.

şekil 2

1.TopicModel-Item2vec-KeywordPropagation-DSSM

Önce videoların konu kümelenmesini tanıtın TopicModel, TopicModel aslında doğal dil işleme alanında birçok belgeden her belgenin konusunu çıkarabilen klasik bir modeldir. Böyle bir model sayesinde her bir belgenin hangi konuya ait olduğu ve belgedeki kelimelerin hangi konuya ait olduğu ortaya çıkarılabilir. Bir belge yazarken toplam 100 konu olduğunu varsayarsak, önce belgenin konu dağılımına göre 100 başlık arasından belgenin konusunu seçeceğiz, ardından konuyu seçtikten sonra bir sözcüğün konu dağılımından sözcüğü seçeceğiz. Yazmayı bitir. Daha sonra TopicModel, her belgede kelime sıklığını ve birlikte kelime oluşumunu sayarak dokümanların ve kelimelerin konu dağılımını belirler.

Öyleyse, Meipai'nin tavsiyelerine nasıl uygulanır? İlk olarak, kullanıcı davranışını bir belge olarak anlayabilir ve ardından kullanıcı tarafından oynatılan veya beğenilen videoyu bir kelime olarak anlayabilirsiniz, böylece kullanıcı davranışı verileri TopicModel'de kümeleme sonucunu elde etmek için kullanılabilir.

Peki TopicModel yukarıda belirtilen üç gereksinimi nasıl karşılıyor?

1. Büyük verileri işleyin. TopicModel, veri paralelliği yoluyla büyük veri sorununu çözebilir;

2. Hızlı bir şekilde güncelleyin. Yeni bir video için, kullanıcının yeni videodaki davranışını hızlı bir şekilde alabiliriz. Konu modelini hızlı bir şekilde güncellemek için, kullanıcının hangi konuya ait olduğuna göre yeni videonun hangi konuya ait olduğu sonucuna varabiliriz.

3. TopicModel'in yorumlanabilirliği çok iyi. Konunun (kümeleme) ne anlama geldiğini sezgisel olarak anlayabilir ve her bir konudaki videonun dağıtımını alabiliriz, böylece dağıtım sonucunun gerçeklikle uyumlu olup olmadığına karar verebiliriz İnsanların anlayışı.

Üç problemi çözdükten sonra ilk çözümü yapmak için TopicModel'i kullanabilirsiniz.Dört konu modelinin en yaygın problemlerini çözmek için:

1. Model değerlendirmesi. Konu modeli model değerlendirmesi yaparken, bu modelin kalitesini değerlendirmek için uygun yöntemlere ihtiyacımız var.

2. Modelleme yöntemi. Yukarıda belirtildiği gibi, kullanıcı davranışına dayalı modelleme, videoları modelleme için kelime olarak kullanmaktır, ancak başka modelleme yöntemleri de vardır.

3. Konu sayısı (kümeler). Konu sayısı, genellikle konu modelinde ayarlanması gereken bir parametredir.

4. Kümelemeyi tekrarlayın. Konu modeli yapısı genellikle birçok benzer kümeye sahiptir ve bu kümelerin parçalandığı sahneyi etkileyerek doğru şekilde ayrılmamasına neden olur.

Çözülmesi gereken ilk şey, Model değerlendirmesi , Sadece doğru bir model değerlendirme yöntemi bularak her planın sonuçlarını karşılaştırabiliriz.

resim 3

Şekil 3'te gösterildiği gibi, önceki konu modelinde yaygın olarak kullanılan iki göstergedir ve aşağıdaki şekil bir model eğitiminde iki göstergenin eğilimidir. Bu iki gösterge, modelin yakınsamış olup olmadığına karar vermek için kullanılabilir.Elbette, bu iki gösterge aynı zamanda model kalitesinin güvenilirliğini değerlendirmek için de kullanılabilir. Konunun sonucu (kümeleme) sıralama modeline dahil edilir ve kümeleme modelinin güvenilirliği, sıralama modelinin indeksi kullanılarak değerlendirilebilir. Sonraki uygulamalarda böyle bir kümeleme şemasının etkisini bilmek istiyoruz, bu nedenle üçüncü bir gösterge sunduk: sıralama modeli.

Bu göstergelerle ikinci sorun çözüldü: Modelleme yöntemi . Yukarıdaki ilk örnek, video ile kelime olarak oluşturulmuştur, daha sonra kullanıcı tersten kelimeler olarak modellenebilir, yani video belgedir ve kullanıcı kelimedir.İki çözümün üç göstergesini karşılaştırarak bulabiliriz: Kullanıcı kelime olarak kullanıldığında, üç gösterge kelime olarak videodan daha yüksektir, ancak eğitim süresi video kelimeden daha uzundur ve 5 saate kadar sürer. Popüler bir video 1 milyon kullanıcı tarafından oynatılabileceği için belgede 1 milyon kelime var, bu nedenle eğitim süresi daha uzun olacak.

Şekil 4

Şekil 4'te gösterildiği gibi, bu iki modelleme yönteminin sıralama modelindeki etkisi, alt açık mavi çizgi üzerindeki taban çizgisidir ve ordinat, sıralama modelinin EAA'sıdır. Konu modeli tanıtıldıktan sonra, şema ne olursa olsun bulduk Her ikisi de çevrimiçi temelden daha iyidir, bu nedenle konu modelinin daha iyi bir etkisi vardır.

İkinci soruyu tekrar karşılaştırdığımızda, bu iki modelleme şemasının EAA'sının çok farklı olmadığını bulduk Eğitim süresini kısaltmak için şema olarak kelimeleri kullanma eğilimindeyiz. Farklı temaların sayısını alırken, koyu mavi AUC ile sarı AUC arasında da belirli bir fark olduğunu gördük. O zaman üçüncü problemi şu anda çözmeliyiz. Konu sayısının seçimi .

Konuların sayısı uygulama senaryolarıyla çok ilgilidir ve tartışma, yukarıda bahsedilen uygulama senaryolarına göre sınıflandırılır:

1. Niş video kümeleme keşfi . Düşük frekanslı ve uzun kuyruklu kümeler bulmaya ve konu sayısını artırmaya çalışın Tecrübelere göre konu sayısı bin veya daha fazla olduğunda uzun kuyruklu video kümeleme etkisinin daha iyi olduğu görülmüştür.

Şekil 5

2. Konu modelini sıralama modeline tanıtın . Her konudaki EAA sayısını karşılaştırdığımızda, alt kısım hala temeldir. Yukarıdaki şekildeki her satır, farklı konuların EAA'sını temsil etmektedir. Konu sayısı 100'den 200'e çıkarıldığında AUC'nin önemli ölçüde değişmediğini gördük. Ekran görüntüsü araştırma deneyinin sonucudur. Birçok araştırma deneyi yaptık. Bundan sonra, sıralama modelinin AUC ve GAUC göstergelerine göre konu sayısı 150'ye ayarlanır.

3. Küme parçalanması . Kümeleme parçalanması durumunda, konu sayısı ne kadar küçükse, göstergelerin paylaşımının o kadar iyi olduğunu gördük. Örneğin konu sayısı 100 olarak ayarlandığında, kişi başına çevrimiçi paylaşım% 8 arttı, ancak oynatma endeksi bir miktar düştü.Daha sonra konu sayısı 200'e çıkarıldığında paylaşım dizini yalnızca% 2 arttı, ancak oynatma Göstergeler de gelişti.

Şekil 6

Bu neden oluyor? Konu sayısı nispeten az olduğunda, kümeleme ayrıntı düzeyinin daha kaba olacağı anlaşılabilir, bu da kullanıcıların bir ekranda 6 videoda daha fazla kategori göreceği anlamına gelir. Bir kızın Anlarında bir şekillendirme veya düzenleme videosu paylaştığını varsayalım, günde yalnızca bir stil paylaşabilir, video düzenleyebilir, yani bir kullanıcı aynı türde videoyu bir günde daha az paylaşabilir, bu nedenle video öneri kategorisini artırdıktan sonra, Kullanıcının paylaşmak istediği kategoriye ulaşma olasılığı yüksek, dolayısıyla paylaşım göstergesini iyileştirir. Ancak, ayrılığın ardından, kullanıcıların ilgilendiği video kategorileri geriye yaslanacak ve kullanıcının oynatma oranı daha düşük olacaktır.

Konu sayısını artırırken her iki gösterge de neden gelişiyor? Bunun ana nedeni, parçalanmanın videoların çeşitliliğini artırması, kümeleme ayrıntı düzeyinin daha ince olması ve ilgilenilen videoların geri çekilmesinin kolay olmamasıdır, bu da kullanıcı deneyimini iyileştirir, kullanıcı aşağı çekmeyi artırır ve doğal olarak göstergelerin iyileştirilmesini sağlar.

Son soru Benzer konular . Örneğin, bir model eğitiminden sonra, iki benzer tema elde ederiz.Bu iki tema, bebekleri yakalama videolarıdır.Bu iki küme işlenmemişse, bebekleri yakalama videolarını doğru bir şekilde ayırmanın bir yolu yoktur. . Konu modeli sonuçları, videonun konu dağılımını alabilir ve ardından bir konu vektörü elde etmek için videonun konu dağılımını aktarabilir. Bu konu vektörünün her boyutu, videonun konuya ait olma olasılığıdır. Ardından konu vektörünü aldıktan sonra yapabilirsiniz. Her konunun benzerliğini hesaplayın ve ardından benzer konuları birleştirebilirsiniz, böylece iki kavrayıcı bebeği veya hatta diğer bazı benzer kümeleri birleştirerek kümelemenin doğruluğunu iyileştirebilirsiniz. Yukarıdaki temamızdır Model, video kümelemenin bazı sorunlarına uygulanmıştır.

Şekil 7

TopicModel'in avantajlarını ve dezavantajlarını özetleyin:

avantaj:

Konu modelinin kullanımı nispeten basittir.Sadece kullanıcı davranışını ayırmanız ve ardından tüm kullanıcı davranışını bir belge olarak anlamanız ve istenen kümeleme etkisini oluşturmak için konu modelinde kullanmanız gerekir.

Dezavantajları:

Kümeleme tanecikliği nispeten kabadır. Örneğin, NLP alanında, çok sayıda haber külliyatında konu madenciliği yapıyorsanız, bir eğlence haberleri konusu alabilirsiniz. Bu eğlence konusu aslında daha ayrıntılı olabilir (eğlence haberlerindeki yıldız kümelerini elde etmek için) ve konu modeli çok Ayrıntılı optimizasyon yapmak zordur.

Daha ince taneli kümeleme nasıl elde edilir? İkinci seçenek Item2vec tanıtılabilir.

2.TopicModel-Item2vec-KeywordPropagation-DSSM

Item2vec, önerilen senaryomuzda Word2vec uygulamasının bir çeşididir.

Figür 8

İlk olarak, SkipGram modelini kısaca tanıtın. Şekil 8'in sağ tarafında gösterildiği gibi, bu bir pozitif örnekleme örneğidir SkipGram'ın temel amacı, her kelimenin kendi bağlamına nasıl benzediğini bulmaktır. Bu şekilde modelin kullanıcı davranışında kullanılıp kullanılamayacağı, konu modeli modellemeye benzer şekilde, videoları kelime olarak anlayarak ve hangi videoların benzer olduğunu bulmak için modeli kullanarak anlaşılabilir. Model nasıl eğitilir? Şekildeki mavi kutu bir giriş kelimesini ve beyaz kutu bir çıkış kelimesini temsil eder.Giriş ve çıkış kelimelerini bir kelime çiftine entegre ederiz.Bu kelime çifti ağ yapısına girilir ve ağ her kelimeyi öğrenebilir. Her kelimede benzer bağlama sahip kelimeler nelerdir?

Bu modelin konu modeline göre avantajları nelerdir? Ayrıntı düzeyi neden daha ince? Örneklenen bu pencereyi tema modeliyle karşılaştırın. Tema modeli, kullanıcının tam davranışını analiz eder. Örneğin, kullanıcının bir aydaki davranışı bir belge olarak anlaşılırsa, tema modeli videonun bir ay içindeki birlikte oluşum bilgilerini sayar ve Item2vec Videoların bu videonun yanında bir arada olmasına daha fazla dikkat edilir, bu nedenle bugün tıklanan video arasındaki korelasyon, bugün tıklanan video ile 1 ay önce tıklanan video arasındaki korelasyondan açıkça daha yüksektir. Bu nedenle, bu modelin ayrıntı düzeyi, konu modelinden daha iyi olacaktır. İkinci avantaj, uçtan uca optimizasyon için diğer derin öğrenme görevlerine eklenebilen basit bir ağ yapısı olmasıdır.

Vektör kelimesi, NLP alanında ilginç bir analojiye sahiptir ve video vektörünün de bazı ilginç analoji sonuçları vardır. Örneğin, geçen yıl popüler WeChat mini oyunu "Jump Jump" da, atlama videosu oynayan bir kedi bulmaya gittiğimizde böyle bir vektör bulduk ve sonra onu atlama video vektörü oynayan köpekten çıkardık, karşılaştırabiliriz. Yaklaşık olarak kedinin video vektörü eksi köpeğin video vektörüne eşittir Bu benzetme, çıkış video vektörünü temsil eder. İma ettiği şey sadece basit varlık bilgisi değil, diğer bazı hiyerarşik bilgileri de saklayabilir Benzer şekilde, dans eden güzel bir kadının ve sonra dans eden yakışıklı bir adamın video vektörü, güzel bir kızın eksi yakışıklı bir erkeğin videosu ile karşılaştırılabilir.

Sıradaki Kümelerin kontrastı Kümelemenin ayrıntı düzeyini daha iyi hale getirmek için, kümelenmenin gücünü benzer bir video videosuyla karşılaştırıyoruz. Örnek olarak yemek videolarını ele alırsak, karşılaştırma için Item2vec'de tema modelini ve en benzer videoları buldum ve tema modelinde kümelenmenin anlamının daha yüksek düzeyde bilgi olduğunu buldum. Bu benzer videolar gıdaya aittir ve yalnızca birkaç video alt bölümlere ayrılabilir Tarifler ve yemek tarifleri, Item2vec tarafından elde edilen iki benzer video, kapaktan açıkça daha doğrudur: ikisi de gösteri videoları yiyorlar ve hatta içerik çok benzer.Yeni kümeleme şemasının daha ince bir ayrıntı düzeyine sahip olduğu açıktır.

Figür 9

Sıralama modeline bir özellik olarak video kümelemeyi ekledik ve AUC büyük ölçüde iyileştirildi. Yukarıda bahsedilen AUC konu modeline bakıldığında, o zamanki gelişme yalnızca binde bir ile ikide arasında iken Item2vec kümelenmesi Sınıf özellikleri binde 9'a ulaştı ve etkisi çok önemliydi.

İkinci senaryo, modelin ürettiği video vektörünü videoları kümelemek için kullanmak olan öneri stratejisini genişletmek için bir çözümdür.Kullanıcının ilgilendiği kümeleri bulduktan sonra bu, önerilen videoları geri çağıracak ve geri çağrılan videolar sıralanacak ve ardından bir öneride bulunulacaktır. Önerilen stratejinin çevrimiçi etkisi% 4 oranında iyileştirildi ve etkisi de çok açık.

Item2vec'i tanıttıktan sonra, avantajları ve dezavantajları özetleyin:

avantaj:

Kümeleme gücü daha incedir.

Dezavantajları:

Zayıf kararlılık.

Neden istikrarı zayıf olduğu söyleniyor? Kümelenecek bir dizi video vektörü olduğu varsayılırsa, kümeleme için en basit yöntem (kmeans gibi) kullanılır. İlk kümelemeden sonra, kimliği 0 olan küme gurme yiyecekleri temsil edebilir. Ardından, ikinci kez kullanırız Bu vektörler tekrar kümelenmiştir ID 0 olan küme hala gurme mi? Kesinlikle hayır, bu yüzden istikrarı nispeten zayıf.

Yetersiz istikrarın etkisi nedir? Küme kimliği, sıralama modeline eklemek için bir özellik olarak kullanılıyorsa, ancak gizli küme kimliğinin anlamı eğitimden eğitime farklıysa, özellik mühendisliği üzerinde büyük bir etkisi olacaktır, bazı sıkıcı mühendislik çalışmaları yapmamız gerekir, bu yüzden Güçlü kararlılıkla bir kümeleme sonucu yapmak istiyorum.

Kullanıcı davranışına göre bazı düşük frekanslı videolar var, bu nedenle Yetersiz doğruluk .

Yukarıdaki iki problem nasıl çözülür? Tanıtıyoruz SMS , Kümelemenin anlamını özetlemek ve düşük frekanslı videoların doğruluğunu iyileştirmek için metin kullanın.

3. TopicModel-Item2vec-KeywordPropagation-DSSM

Kümeleme için metin kullanımında da sorunlar var. Her şeyden önce, metin Kapsam daha düşük olacak Meipai'yi örnek olarak alırsak, her kullanıcı bir videoyu yüklerken videonun açıklamasını doldurmak istemez; ikinci soru ise Video açıklama hatası Açıklamayı doldururken, kullanıcı gündemdeki konuları tespit etmek isteyebilir ve açıklamada bazı gündem konuları yazacaklar, ancak aslında video bu konuya ait değil; üçüncüsü anahtar kelimeleri çıkarırken. Uzun kuyruklu bir kelime veritabanı tutmanız gerekiyor , Çünkü bazı niş, yeni video kümeleri bulmak istiyoruz.

Bu üç sorunu çözmek için iletişim yöntemini araştırdık. Önümüzde bir grafik olduğunu varsayarsak, grafikteki düğümler videolar ve video ile video arasındaki ilişki grafikteki düğümler arasındaki uçtur. Bazı videolarda anahtar kelimeler bulunurken bazı videolarda yoktur, bu nedenle düğümler arasındaki kenarlar, anahtar kelimeleri videolara anahtar kelime olmadan yaymak için kullanılabilir.

Figür 10

İlk olarak, grafikteki düğümler başlatma , Her düğüme (video) benzersiz bir etiket verin, temel göstergeleri olan video doğrudan ona anahtar kelimeler atayacaktır ve anahtar sözcük içermeyen düğümler ilk benzersiz etiketi saklar; ikinci adım video ile video arasındaki ilişkiyi kullanır Yayılmış etiket ; Etiket yayıldıktan sonra Her videonun etiketlerini güncelleyin , Bir video diğer videolardan yayılan birçok etiket alabilir, birleştirmenin en basit yolu, bu sefer videodaki en çok sayıda etiketi düğümün yeni etiketi olarak almaktır. Ardından, yayılma sürecinden sonra tüm grafiğin etiket değişikliğini değerlendirin.Tüm grafiğin değişimi nispeten küçükse (küçükse), yakınsama olarak düşünülebilir.

Bunu çözmek için kullanıcı davranışı nasıl kullanılır? Bu grafiği oluşturmak için kullanıcı davranışını kullanabilirsiniz. Örneğin, 100 kullanıcı video A ve video B'yi aynı anda izlerse, video A ve B'nin iki düğümü 100 ağırlığa sahip bir kenarla ve grafikteki düğümler ve Anahtar kelimeleri yaymak için kenarlar kullanılabilir.

Önceki süreci hatırlayarak: önce videonun anahtar kelimelerini videonun açıklamasından, yorumlarından ve altyazılarından çıkarın, ardından bu resmi kullanıcı davranışıyla oluşturun ve ardından, her bir videonun anahtar kelimelere yayılabilmesi için anahtar kelimeleri yaymak için resmi kullanın. , Ve son olarak kümeleme için N-Gram kullanın ve Bi-Gram çevrimiçi kullanın.

Bu anahtar kelimenin yayılma etkisi aşağıdaki gibidir:

  • Kapsamı geliştirin
  • Anahtar kelime içermeyen birçok video, yayılma yoluyla anahtar kelime alabilir ve kapsam oranı artık% 95'e ulaştı.

Figür 11

  • Metin açıklaması hata düzeltmesi
  • Şekil 11'de gösterildiği gibi, sol alt köşedeki video bir derleme ve şekillendirme videosudur, ancak açıklaması "# # Desteklemek için çift tıklayın" şeklindedir. Bu açıklamanın videoyla hiçbir ilgisi yoktur, sadece bir etkin nokta davranışıdır. Kullanıcı davranışıyla oluşturulan grafiğe göre, bu modelleme derleme videosu bazı modelleme derleme videoları ile çevrilidir, ardından orijinal yanlış anahtar kelimeler, video açıklamasının hata düzeltmesini tamamlamak için doğru anahtar kelimelerle kaplanabilir.
  • Niş videoların kümelenmesini keşfedin
  • Anahtar kelime veritabanında "Zangwu" kelimesi yoksa, bu videoların doğru anahtar kelimeleri çıkarılamaz ve kümeleme doğal olarak tamamlanamaz, ancak anahtar kelime iletişiminin kullanılması, bu tür niş kümelemenin keşfini gerçekleştirebilir. Örneğin, yüzlerce "Tibet Dansı" videosu varsa, anahtar kelime başlatmanın ilk adımında, hiçbir anahtar kelime bulunamadığından, bu yüz videonun tümüne benzersiz bir etiket atanacaktır. Ardından, etiket yayma yapılırken Çevreleyen "Tibet Dansı" videolarıyla yayılacak ve son olarak etiketleri (anahtar kelimeleri) aynı olma eğiliminde olacak ve düğümleri arasında en yüksek ağırlığa sahip etikete yakınlaşacaktır. Bu nedenle, anahtar kelime veritabanında tutulmayan niş kümeleri bulabiliriz.

Item2vec kümeleme modelini inceleyin: Öncelikle, denetimsiz olan kümeleme yapmak için konu modelini ve kelime vektörünü kullanın ve ardından yarı denetim yapmak için anahtar kelime yaymayı kullanın, videoyu anahtar kelimelerle ve video ile video arasındaki anahtar sözcüklerle kullanarak bir buçuk turu tamamlayın Denetlenen model. Video kümelemenin etkisini iyileştirmenin denetimli bir yolu var mı? Şu anda derin DSSM modelini tanıttık.

4.TopicModel-Item2vec-KeywordPropagation-DSSM

DSSM'nin ilk uygulama senaryosu aramak . Arama sahnesini kısaca tanıtın Baidu aramasına "Meipai" kelimesini girin ve Meipai ile ilgili birçok web sayfası göreceksiniz. Meipai resmi web sitesi, Meipai ile ilgili haberler veya Meipai'nin Baidu Ansiklopedisi olabilir. Meipai'yi tıklamayı seçebiliriz. Resmi web sitesini ele alalım, bu tıklama davranışı olumlu bir örnek olarak anlaşılabilir ve benzer şekilde şunları da yapabilirsiniz: Videonun tıklanması, olumlu bir örnek olarak anlaşılır , Ve sonra kullanıcıların beğenmediği davranışları ve videoları negatif örnekler olarak yorumlayın. Kullanıcıların beğenmediği daha az video varsa, açıkta kalan ve tıklanmamış verileri negatif örnekler olarak kullanabilirsiniz.

Figür 12

NLP senaryosunda DSSM'nin açıklanması: İlk önce içeriği girin Şekil 12'de gösterildiği gibi, soldaki Q, Baidu'ya bir kelime girmek olarak anlaşılabilir ve sağdaki D, arandıktan sonra görüntülenen sayfanın başlığı olarak anlaşılabilir. Daha sonra, temelde NLP senaryosundaki boyutsallık azaltımı olan ikinci kelime karma katmanına bakın.Örneğin, 500.000 kelimenin boyutsallığı 30.000'e düşürüldü.O zaman Meipai video sahnesinde nasıl yapılır? Yukarıda önerilen modeller (konu modeli, Item2vec gibi) bu katmana erişmek için kullanılabilir. Ardından, DNN'nin 128 boyutlu anlamsal uzaya eşlenmesi ve ardından Q ile D arasındaki benzerliği hesaplamak için kosinüs benzerliğini kullanan eşleşen katman var. Son olarak, benzerliği arka olasılığa dönüştürmek için softmax kullanın. Model Meipai tavsiyesine uygulandığında, Q bir kullanıcı olarak ve D bir video olarak anlaşılabilir ve daha sonra kullanıcı davranışı zayıf bir şekilde denetlenen öğrenme için kullanılabilir. Neden zayıf denetlenen bir model? Bunun ana nedeni, negatif örneklerin (yani tıklanmamış pozlama içeren videolar) kullanıcılar tarafından beğenilmemesi gerekmesidir. Tıklanmamış bazı videolar yalnızca daha düşük sıralanabilir, bu nedenle zayıf bir şekilde denetlenen modellerdir.

DSSM, Meipai'de aşağıdaki iyileştirmeleri benimsemiştir: İlk olarak, video çeşitli senaryolarda Meipai'de oynatılır, en yaygın olanı, arama yaptıktan sonra videoyu aşağıdaki yazarlar listesinde oynatmak gibi diğer kaynaklara ek olarak ana sayfada oynatmaktır. Bir videoya tıklama vb. Kullanıcının tıklamasının amacı veya davranış özellikleri farklı kaynaklarda farklıdır. Farklı kaynakları böldük ve kullanıcıların farklı kaynaklardan video oynatma amacını öğrenmek için bir kullanıcı modunu paylaşmalarına izin verdik; yukarıda belirtildiği gibi, DSSM'nin alt girişi kelime torbası şeklindedir, bu nedenle modelin yapabileceğini umarak LSTM'yi tanıttık. Bazı kullanıcıların bazı uzun vadeli ilgi alanlarını öğrenmek üzere modeli geliştirmek için daha fazla bağlamsal bilgi edinin.

DSSM'nin getirdiği etkilere bakıldığında, ilk tema modeli AUC% 0,1 arttı, Item2vec% 0,9 arttı ve son olarak DSSM% 1,3 arttı, etki çok açık. Ayrıca, ilk iki modelin (özellikle konu modeli) çok büyük eğitim verisi gerektirdiği ve bunun iki hafta hatta bir aylık kullanıcı davranışı gerektirdiği, DSSM'nin ise daha iyi bir tane elde etmek için yalnızca iki veya üç günlük davranış verilerine ihtiyaç duyduğu unutulmamalıdır. sonuç.

Figür 13

Dört kümeleme şemamızın gelişim yoluna dönüp baktığımızda, konu modelinin başlangıçta kullanılmasının nedeni, karşılaştırılmış olmasıdır. basit , Ve yorumlanabilirliği çok güçlüdür; bir sonraki aşamada, ince taneli kümeleme sahneleri vardır, bu nedenle Item2vec kümeleme şemasına atıfta bulunulur; üçüncü şema anahtar kelime yayılımı, kümelemeyi stabilize etmek için esas olarak metni kullanmak ve bazı düşük frekansı iyileştirmektir. Niş videoların kümeleme etkisi; son şema DSSM, kullanıcıların ve video vektörlerinin sonuçlarını iyileştirmek için denetimli bir yol kullanır.

/ Geleceğe Bakış /

her şeyden önce Çok düzeyli Şu anda video kümelememizin tek bir düzeyi var. Aslında birçok küme elde edebiliyoruz. Örneğin yiyecekler baharatlı çorba, makarna, kek gibi kümeler de alabilir ve bu üç küme hiyerarşiktir. Bununla birlikte, mevcut şemalarımızın bir hiyerarşi duygusu yoktur ve metin hiyerarşisi hiyerarşik kümeleme problemini çözmek için kullanılabilir.

Figür 14

İkincisi gerçek zaman , Kümeyi çevrimiçi olarak analiz edebilmeyi ve videonun hangi kümeye ait olduğunu güncelleyebilmeyi umuyoruz. Ayrıca çevrimiçi olarak yeni bir video almak istiyoruz. Küçük bir kullanıcı davranışına sahip olduğunda, hemen video kümesini alacağız.

Üçüncüsü Doğruluk Doğruluk için pek çok çözüm vardır.Örneğin, DSSM'de video vektörünü iyileştirmek için kullanıcı portre özellikleri veya video portreleri tanıtılabilir.Video vektörü iyileştirildikten sonra, daha doğru video kümeleme elde edilebilir.

Yukarıdakiler, kısa vadede ulaşmak istediğimiz üç yöndür.

Ni Ni harika, beyaz gömlek ve pantolon o kadar iyi giyebiliyor ki, "kaliteli bir yüz" olmayı hak ediyor.
önceki
Oyunda, Di Lieba ona takıntılı, altın renkli pantolon ve ceket giyiyor, en iyi "patlayıcı saç modeli" çok yakışıklı.
Sonraki
Meitu Dağıtılmış Bitmap Uygulaması
14 yaşında, mavi ve beyaz dikişli etek giyen, duygu dolu büyük dalgalı kıvırcık saçlı bir kızla model olarak ilk kez sahneye çıktı.
GIF: Tereyağı Eli! Han Jiaqi, Xie Pengfei'ye ayrılması için bir hediye verdi, Suning 5-1 R&F
Popüler bilim | Bayes olasılık modellerinin listesi
Bao Wenjing "rüzgara karşı döndü", gül kırmızısı ceket ve kot pantolon, 32 yaşında peri kadar güzel
Meitu-On en uygun çözümü bulma fikri
Oyunda, binlerce yıldır Zheng Shuang'a aşık olmuş, bugün çizgili bir gömlek ve kot pantolon giyiyor ve gökyüzünü göstermek için güneş gözlüğü takıyor.
Pekin Film Festivali kapatıldı "Lucky Boy Bill", "Tiantan Ödülü" nün en iyi filmi oldu
Di Ali Reba düştükten sonra etkinliğe katıldı, siyah deri eteği kalçasından yeni geçti ama güzel bacakları ayakkabılarla mahvoldu.
RDD ilkeleri ve temel işlemler | Girişten ustaya Spark
Spark on Yarn | Girişten ustaya kıvılcım
Wang Sicongun kız arkadaşıydı, Kırmızı Başlıklı Kız giyiyordu, sevimli ve iyi huyluydu. Döndü ama ceketi tarafından kapıldı: çok bireysel
To Top