g u t x .com.tr İpek yolu - Çin'i anlamaya götürürüm

SIGIR 2017'nin en son teknolojisinin araştırma sonuçlarını beş dakikada anlayın

Ali Mei'nin Kılavuzu: SIGIR, bilgi erişim alanında yeni teknolojileri ve yeni başarıları sergileyen en iyi uluslararası bir konferanstır. SIGIR 2017 bugün açıldı ve bu yıl Alibaba'dan iki makale konferansta yer aldı.

Aşağıdaki içerik, dahil edilen makalelerin özünün kısa bir özetidir.

1. Olasılık gizli katman modeline dayalı alışveriş eşleştirme itme

Kağıt bağlantısı:

https://arxiv.org/pdf/1707.08113.pdf

Bu makalede, e-ticaret alanındaki pazarlama push senaryolarının tıklama oranını optimize ediyoruz. Pazarlama itme senaryosu ile geleneksel e-ticaret öneri senaryosu arasında birçok benzerlik vardır, ancak bunlar da farklıdır. Birincisi, pazarlama aktarımının tıklama oranı, metin yazarlığından büyük ölçüde etkilenir ve doğrudan kullanıcılarla ilgili metin yazarlığının tıklama oranı, genel itmeli metin yazarlığından önemli ölçüde daha yüksek olacaktır; ikincisi, itilen ürünlerin doğruluğu nedeniyle pazarlama itmesi başına yalnızca bir görüntüleme deliği vardır. Daha talepkar.

İlk sorunu çözmek için "alışveriş eşleşmesi" senaryosunu öneriyoruz. Alışveriş eşleştirme sahnesi, kullanıcının satın aldığı ürünle eşleşen eşleşen bir ürünü iter, örneğin, kullanıcı yüksek kaliteli bir çaydanlık satın aldığında, en iyi çayı iter (aşağıdaki şekilde ikinci itme mesajı). Alışveriş eşleştirmenin avantajı, kullanıcının satın aldığı ürünlerin kopyada gösterilebilmesi ve mesajın kullanıcıyla güçlü bir bağ kurabilmesidir, bu da mesajın açılma oranını artırır.

Eşleşen ürün çiftlerini bulmak için aşağıdaki iki göstergeyi tanımlıyoruz:

1) Aynı anda satın alma noktaları (Ortak Satın Alma Grafiği)

2) Görüntüle ve Sonra Satın Al Grafiği

İlk gösterge, iki meta arasındaki tamamlayıcılığı ölçer ve ikinci gösterge, iki metaın ikame edilebilirliğini ölçer. Alışveriş eşleştirme sahnesinde, tamamlayıcılığı yüksek ve öneri yerine düşük ikameli ürünler bulmayı umuyoruz. Bu nedenle, ürünün "eşleşebilirlik" puanını şu şekilde tanımlıyoruz:

Bu puan, öneri modelimizde önemli bir özelliktir

Öneri doğruluğu sorununu çözmek için. Kullanıcı hiyerarşisinin daha ayrıntılı bir karakterizasyonuna sahibiz. Ana fikrimiz, kullanıcı davranışına dayalı olarak kullanıcıların vektör temsillerini (Gömme) öğrenmek ve ardından kullanıcı davranışını tahmin etmek için bu vektör temsillerini kullanmaktır. Vektör gösterimi, kullanıcıların yüksek boyutlarda nicel bir soyut temsili olarak anlaşılabilir.

Vektör gösteriminin avantajı, hedefi daha doğru ve esnek bir şekilde ifade edebilmesidir. Örneğin, kullanıcı tanımımız, insanların sezgisel olarak düşünebilecekleri yaş ve harcama gücü gibi boyutlarla sınırlı değildir. Yapay zeka, kullanıcıların öneri platformları hakkındaki görüşleri gibi tüketici verilerinden daha kapsamlı ve soyut boyutları otomatik olarak öğrenebilir. Bağımlılık derecesi, kullanıcının ürün seçimindeki yeniliği vb.

Kullanıcı vektörlerinin öğrenilmesi için Olasılıksal Gizli Sınıf Modellemesini kullanıyoruz. Öncelikle kullanıcı tıklama modelini aşağıdaki gibi tanımlıyoruz,

Bu model iki katmana bölünmüştür: İlk katman, kullanıcıların hiyerarşilerini çok boyutlu lojistik regresyon sınıflandırması formunu kullanarak yüksek boyutlarda tasvir etmek için kullanılan gizli bir katmandır.

İkinci katman, tıklama oranı tahmin modelidir. Burada iki boyutlu bir lojistik regresyon modeli seçtik. Ancak derin sinir ağlarını kullanmak için kolayca genişletilebilir.

Bilinen kullanıcı özellikleri ve tıklama verileri koşullarında model parametrelerini tahmin etmemiz gerekir. Klasik EM (Beklenti-Maksimizasyon) algoritmasını kullanıyoruz.

EM algoritmasının önce Q fonksiyonunu çözmesi gerekir,

Q fonksiyonunu optimize etmek için parametreleri aşağıdaki gibi yinelemeli olarak optimize ediyoruz,

Yukarıdaki iki güncelleme, Gradient Decent yöntemiyle kolayca çözülür.

Aşağıdaki şekil çözüm modelimizin bir açıklamasıdır. Oldukça aktif kullanıcıların kendi tercihleriyle daha çok ilgilendiklerini ve kullanıcı tercih özelliklerinde tahmin modelinin ağırlığının yüksek olduğunu (kullanıcı tercih özelliklerinde yüksek model ağırlıkları); düşük aktif kullanıcıların platform önerilerine daha bağımlı olduklarını ve platform seçeneklerinin kombinasyonunu tercih ettiklerini gördük. İyi bir ürün için, tahmin modelinin ağırlığı, ürün sıralama özellik ağırlığında yüksektir (yüksek model ağırlıkları açık). Bu, derinlemesine kullanıcılar ürün seçiminde daha bağımsız olduklarından ve acemiler platforma daha bağımlı olduklarından sezgisel olarak anlaşılabilir.

Şu anda, çalışma çevrimiçi olarak iyi sonuçlar elde etti ve alışveriş eşleştirmesinin push önerisi sahnesinde ~% 50 tıklama oranı iyileştirildi.

Daha geniş bir ifadeyle, bu teknolojinin endüstri için faydası, kullanıcıları daha doğru ve kapsamlı bir şekilde karakterize edebilmesi ve ürünler, bilgiler ve videolar gibi diğer hedefleri tanımlamak için daha fazla tanıtımın kullanılabilmesidir. Bu teknoloji, pazarlama önerilerimizi daha kullanıcı dostu hale getirmeye (kullanıcıyı anlamaya) yardımcı olabilir ve aynı zamanda ticari olarak dönüşüm oranını (yüksek tıklama oranı) artırabilir.

İkincisi, bilgi erişim alanında GAN uygulaması-IRGAN

Kağıt bağlantısı : Https://arxiv.org/abs/1705.10513

Bilgi Erişiminin (IR) tipik problemi, bir miktar sorgu (sorgu) vermek ve sıralı bir belge listesi (belgeler) döndürmektir, ancak IR'nin uygulama kapsamı belge alma, web araması, öneri sistemi, QA soru cevaplama sistemi ve kişiliğe genişletilebilir Reklam vb. Uluslararası İlişkiler teorisi veya modeli alanında, iki tipik düşünme yolu vardır (şekilde gösterildiği gibi):

Üretken IR modeli: İlk fikir, belgeler ve sorgular arasında örtük rastgele bir üretim olduğudur ( üretken ) Süreç şu şekilde ifade edilebilir: q d, burada q sorguyu, d belgeyi, ok üretim yönünü ve üretken model modelleri p (d | q).

Diskriminant IR modeli: İkinci fikir, IR problemini bir ayrımcıya dönüştürmek için bir makine öğrenme yöntemi kullanır ( ayırt edici ) Soru; q + d r şeklinde ifade edilebilir, burada + sorgu ve belgenin özelliklerinin kombinasyonunu, r alaka düzeyini, r 0 veya 1 ise soru bir sınıflandırma problemi, r korelasyon puanı ise, O halde sorun bir gerileme problemidir; şimdi iyi bilinen yöntem Sıralamayı Öğrenmektir. Sıralama öğrenimi üç modele ayrılabilir: Pointwise, Pairwise ve Listwise.

IR'nin üretken modeli, Sorgu ve Belge özellik modellemesinde (metin istatistikleri gibi) çok başarılı olmasına rağmen, diğer ilgili bilgileri (bağlantılar, tıklamalar, vb.) Kullanırken büyük zorluklarla karşılaştı. Bu bilgi esas olarak mevcut internet uygulamalarında görülebilir. Aynı zamanda, sıralama öğrenmesi gibi IR ayırt edici modeller, büyük miktarda etiketli ve etiketlenmemiş veriden sıralama işlevlerini almayı dolaylı olarak öğrenebilse de, şu anda yararlı özellikler edinme veya büyük miktarda etiketlenmemiş veriden yararlı sinyaller toplama ilkesinden yoksundur. Cinsel yöntemler, özellikle metin istatistiklerinden (hem Belge hem de Sorgudan) veya koleksiyondaki ilgili belgelerin dağıtımından.

GAN fikrini uygulayan İRGAN, üretici IR modelini ayrımcı IR modeliyle birleştirmek için oyun teorisinde minmax oyununu tanıttı. Spesifik olarak, iki model için ortak bir geri alma işlevi (ayırıcı amaç işlevi gibi) tanımlıyoruz. Bir yandan, ayırt edici model p_ (r | q, d), etiketli verilerden öğrenerek amaç işlevini en üst düzeye çıkarmayı ve üretken modeli eğitmek için eğitici bilgiler sağlamayı amaçlamaktadır. Öte yandan, üretici model p_ (d | q, r) bir meydan okuyucudur, ayrımcının karar sınırını sürekli olarak sınırına iter, ayrımcı için yinelemeli olarak en zor durumu sağlar ve ayrımcı yüzleşme yoluyla hedefi en aza indirir. Kendini yeniden eğitme işlevi.

Aşağıdakiler özellikle İRGAN yöntemini tanıtır, GAN'da karşılık gelen yöntemi tanıtacaktır. Ayrımcı ( D ) ile Jeneratör ( G ) .

Ayrımcı : f_ (q, d), burada D'nin parametresidir. D'nin girişi Sorgu-Belge çifti verisidir (q, d) ve çıktı, veri çiftinin eşleşip eşleşmediğidir. Bu, lojistik regresyon ile verilebilen ikili sınıflandırma problemine eşdeğerdir:

Orijinal GAN ile aynı, D'nin amacı şunları maksimize etmektir:

Oluşturucu: p_ (d | q, r), burada , G'nin parametresidir. G'nin girdisi Sorgudur ve çıktı, Sorgu ile ilgili belgelerin olasılık dağılımıdır ve korelasyon bu olasılık dağılımı ile temsil edilir. p_ (d | q, r) Softmax fonksiyonu tarafından verilir:

G'nin amacı aşağıdakileri en aza indirmektir:

İRGAN'ın eğitim kısmı için G ve D çaprazlanmış ve güncellenmiştir. D için, gradyan iniş güncelleme yöntemi kullanılabilir; G için, G'nin çıktısı ayrı belgelerin olasılık dağılımı olduğundan, G'nin gradyanını bulmak için gradyan iniş yöntemini doğrudan kullanmanın bir yolu yoktur. Ayrık verileri eğitmek için GAN'ı kullanma sorunu için, Pekiştirmeli öğrenmede Politika Değişimi yönteminde, ödül D. Tüm eğitim süreci aşağıdaki şekil algoritmasında gösterilmektedir:

Deneysel bölümde, üç farklı IR görevi yapılmıştır: Web Araması, Madde Önerisi ve Soru Cevaplama Deneysel sonuçlar, IRGAN modelinin çeşitli güçlü temelleri yendiğini göstermektedir. Açık kaynak kodu şu adrestedir: https://github.com/geek-ai/irgan.