Dördüncü Paradigma Cheng Xiaocheng: Öneri Sisteminde Makine Öğreniminin Uygulanması

Konuşmacı: Cheng Xiaocheng | Dördüncü Paradigma Kıdemli Algoritma Bilimcisi

Qu Xin düzenlemeyi bitiriyor

Qubit Üretildi | Genel Hesap QbitAI

20 Eylül akşamı, Qubit, dördüncü paradigmada kıdemli bir algoritma bilimcisi olan Cheng Xiaocheng'i "Öneri Sistemlerinde Makine Öğreniminin Uygulanması" konusunu sizinle paylaşmak üzere davet etti. Öneri sistemiyle ilgili teknik sorunları optimize etmek için makine öğrenimi nasıl kullanılır? .

Cheng Xiaocheng, dördüncü paradigmanın kıdemli algoritma bilimcisi ve öneri sistemi hizmet algoritmasının başıdır. Şu anda, çeşitli senaryolarda ve iş ihtiyaçlarında müşterileri desteklemek için APP, denizaşırı mobil haber toplama APP News In Palm ve diğer öneri sistemlerini almak için mantıksal düşünmeden ve ayrıca öneri hizmeti işlevlerinin ve mimarisinin tasarımından sorumludur. Douban algoritma departmanında çalışıyordu ve Douban FM gibi çoklu öneri sistemlerinin yapımına ve iyileştirilmesine katıldı.

Bu sefer paylaşım kuru mallarla dolu.Okuyucuların isteği üzerine kübit aşağıdaki şekilde düzenlenecek ve organize edilecektir:

Herkese merhaba, kübit ve dördüncü paradigma tarafından ortaklaşa düzenlenen makine öğrenimi çevrimiçi paylaşım etkinliğine hoş geldiniz. Bugünün açılış konuşmacısıyım Cheng Xiaocheng ve bugün paylaştığım konu Makine öğreniminin öneri sisteminde uygulanması .

Bu konu oldukça büyük ve geçmiş deneyimlerimden bir satır buldum, bu yüzden sizinle daha genel bir anlayış paylaşacağım. Temelde üç yönden: Öneri sisteminin doğum toprağı ve erken evrimi; öneri sisteminin mevcut temel mimarisi; bir öneri sisteminin nasıl kurulacağı .

Öncelikle tavsiye sisteminin 1990'lardan 21. yüzyılın başına kadar doğduğu toprağı açıklayayım. İlk olarak birkaç önemli olayı anlatın: Amazon, 1995'te bir çevrimiçi kitapçı kurdu; Google 1998'de kuruldu; bu, önceki katalog arama tarzı web sitesinden kullanıcıların istedikleri zaman arama yapabilmelerine kadar arama motorunda devrim yaratmaya eşdeğer; 2004'te "Long Tail Theory" tanrısı Kitap çıktı ve bir Uzun kuyruk konsepti Basit bir ifadeyle, kavram, dünyanın kültürel ürünleri veya ürünleri kitle istatistikleri için kullanılırsa, kafa çok büyük olabilir, ancak kuyruk da çok uzun olacaktır. Kuyruk kitle küçük olsa da, bu kuyruktaki tüm izleyiciler artar Aynı zamanda çok büyük bir gruptur ve hatta baş grubunu bile aşabilir.

Örneğin Amazon o dönemde bir istatistik yapmış ve satışlarının% 50'si 130.000'lik satış sıralaması sonrasında kitaplardan gelmişti; o sırada Amazon'a benzer bir müzik plak sitesi, satışların% 50'si de o yılki 10.000'lik satış sıralamasından geliyordu. Netflix ilk olarak DVD kiralama olarak başladığında, satışlarının% 20 -% 30'u, 3000 satış sıralamasından sonra DVD'lerden geldi.

Aslında, uzun kuyruk teorisinden önce, insanlar iş yaparken, özellikle de çevrimdışı fiziksel işler yaparken, çoğunlukla 28. kurala uyuyorlardı. Yirmi Sekiz Kuralı, Haidian Bölgesi'nde bir kitapçı açılırsa, onun izleyicilerinin Pekin'deki insanlar olacağı anlamına gelir. Bir kitap yığınını ele almak istediğimizde, bir kitap özellikle popüler olmayan bir alana aitse, o zaman bu Çok az insan bu kitabı satın alabilir. Satışların% 80'inin kitap kuralının% 20'si tarafından getirildiğini düşünürsek ve mağazanın depolama alanı ve teşhir alanını göz önünde bulundurarak, sahibi kesinlikle popüler olanlardan bazılarını seçecektir. Kitap dükkanda geliyor.

Ancak Amazon o dönemde bu kavramı tersine çevirdi ve dünyanın kitaplarını internete koydu, böylece dünyadaki herkes ilgilendiği içeriği bulabilir, böylece doğrudan mağaza maliyetinden tasarruf ediyor ve tercihlerine göre doğrudan kendisine tavsiye ediyor. Para kazanılır.

Başka bir örnek vermek gerekirse, insanların kültürel tüketim kanallarının daha az olduğu ve bir şovun maliyetinin yüksek olduğu bir dönemde Bahar Şenliği Galası 28. kuralı izledi ve reytingleri dikkate alarak tüm izleyiciyi hesaba katmak gerekiyordu. Yani Bahar Şenliği Gala programı için, insanların% 80'i bundan hoşlanacak ve kimse bundan nefret etmiyor, bu iyi bir program. Aslında Bahar Şenliği Galası programları şarkı söyleme ve dil programlarıdır. Ama izleyici olarak bu alana ilgi duymuyorsam, bu alanda en iyi sanatçı olsam bile, mesela birisi bir şarkı söylemiş ya da birçok kişinin hoşuna giden bir performans programı yapmış olsam, o zaman mümkün. Sevdiğim niş uzun kuyruk alanını izlemek kadar iyi değil. Seyirci küçük olmasına rağmen profesyonel bir sanatçı olmasına bile gerek yok, belki de sanatçı sadece bir hayran, ancak yarattığı içerik beni diğerlerinden çok daha fazla çekiyor. programı.

Diğer bir deyişle, YouTube ve Tudou gibi bazı video siteleri Bahar Şenliği Galasından daha iyi tüketici platformlarıdır. İnternetin yayın eşiğinin daha sonra düşürülmesi ve yayın maliyetlerinin düşürülmesi ile birlikte, herkes bir üretici olduktan sonra, web sitesi içeriğinin satışı ve kitle tüketimi çoğunlukla uzun bir kuyruktur. Bu web sitesinin iş durumu çok büyüktür. Uzun kuyruğun nasıl dağıldığına bağlıdır.

İnsanların ilk günlerde ne yaptığına bir bakalım 2000 yılında ve 21. yüzyılın başında, bazı UGC web siteleri doğdu: forumlar için Reddit, Soru-Cevap için Quora, Stack Overflow, insanlara restoran önermek için kamuya açık yorumlar ve her gün bazı hikayeler yayınlayan utanç ansiklopedileri vb.

Henüz çok erken olan 2006 yılında Facebook, başlangıçta formül sıralaması ile yapılan bir ewsfeed versiyonunu yaptı.

Yukarıdaki ekran görüntüsü 2012 yılında Ruan Yifeng tarafından yazılan teknik bir blogdur. Sadece bazı web sitelerini sıraladı, bilgileri sıraladı ve ön kısımda daha iyi bilgileri sıralamak istedi.

Her şeyden önce aşağıdan yukarıya bakıyorum lezzetli ile hacker haberleri Reddit , Bazı ağırlıklı uygulamalardan geçiyorlar. Sağdaki ekran görüntüsü, Stack Overflow tarafından duyurulduğunda yaptıkları şeydir, yani, bir gönderinin sayfa görüntülemelerinin bir günlüğünü yaptım ve ardından 4 ile çarptım, artı aşağıdaki formülü cevap puanıyla çarpıp 5'e böldüm ve ekledim Cevaptaki puan.

Bu, insanların yaratıcılığını ve bir miktar PM ve düzenleme deneyimlerini içerdiği kabul edilir. PM, mühendislerle iletişim kurarken bu tür bir diyaloğa sahip olabilir:

PM: "İnsan sayısının 10 katı çok önemli. 4 puan değerinde. Kaç kişinin daha fazla olduğu sorusunun cevabı muhtemelen 100 kişi tarafından derecelendirilen kişi sayısıyla aynı. Bu süreci düzenleyebilirsiniz."

Aşağıdaki payda, yazım ne kadar yeni olursa puanın o kadar yüksek olduğu anlamına gelir. Aynı zamanda, bir başka gösterge de, bu gönderi ne kadar yeni güncellenirse, puanının o kadar yüksek olduğudur. Bu durum bu durumdan kaçınıyor: bu gönderi çok sıcak, ancak uzun süredir güncellenmedi, o zaman sadece çok sıcaktı ve sürekli bir popülerlik yoktu.

Şuna bak Newton'un Soğutma Yasası , Muhtemelen zamana dayalı bu çürüme biçimini de tanımlıyor. Muhtemelen prensibi, Newton'un bir fincan sıcak suyun yavaş yavaş oda sıcaklığına ne kadar hızlı düştüğünün fiziksel tanımını gözlemlemesidir.

sonra Wilson aralığı ile Bayes ortalaması Kabaca söylemek gerekirse, bir gönderi, onu beğenen ve beğenmeyen kişiler için, gönderinin iyi olup olmadığına karar vermek, beğenme sayısından beğenilmeyenlerin sayısını çıkararak elde edilen mutlak değer olmayabilir. Daha iyi bir yol, beğenmeme oranına bakmaktır , Çok az beğeni ve beğenmeme olduğunda, güven yeterli değildir, bu nedenle bu gönderiyi daha makroskopik olarak değerlendirmek için bir aralık verilir.

O zaman hakkında konuş Google'ın önceki arama sonuçlarını sıralama yöntemi: PageRank Aslında, iyi bir web sitesinin ne olduğunu ölçmek için bir formül kullanmaktır. Fikir daha çok bir makalenin alıntısına benziyor, bu da demek oluyor ki bir makale ne kadar çok alıntı olursa, o kadar etkili ve o kadar popüler oluyor. Başka bir itme, makalemden alıntı yapılırsa puanın daha yüksek olacağıdır.

İnternet dünyasında, Google bunu bir resim haline getirir ve bu, tüm web sitelerinin köprülerle bağlanmasına eşdeğerdir.Her web sitesi kendi puanını alır.Örneğin, web sitemde 10 bağlantı varsa, puanı puanlar. 10 hisseye bölün ve diğer web sitelerine oy verin. Sağdaki formül, en sağdaki R'nin web sitesinin ilk puanı olduğu anlamına gelir, belki her biri 1 / N'dir ve ardından bağlantı matrisini çarpın, bu matris, puanını her web sitesine atamaktır. Matris sürekli olarak çarpıldığında, yinelemeli oylamanın etkisi ortaya çıkabilir ve sonunda bir sıralama elde edilecektir.

Bu fikrin hala optimize edilmesi gerekiyor . İnternet dünyasında parçalanmış birkaç parça olabilir.Örneğin, başka bir web sitesine işaret etmeyen ve kimse onu işaret etmeyen bir web sitesi olabilir, o zaman puanı baştan sona 1 / N olabilir. Güncellenmedi, ancak bu aslında mantıksız. Bu yüzden ona sadece rasgeleleştirme ekleyin.Şimdi oylama yöntemini kullanarak, herhangi bir web sitesinde bulunma olasılığının aslında 1 / N olduğunu varsayarsak, o zaman kullanıcı bir sonraki web sitesine hangi web sitesine geçecektir? Öncelikle tüm bağlantıların eşdeğer olduğunu varsayın.Örneğin, 5 bağlantı varsa, sonraki web sitesine geçme olasılığınızın beşte biri var.Bu matris devam ederken, aslında herhangi bir rastgele olanı tıkladığınızı açıklıyor. Web sitesinin biteceği yerin olasılık dağılımı.

Gezinme kavramı açısından bakıldığında, bir kullanıcı bir link ardına gitmeye devam etmek zorunda değildir, istediği zaman durabilir, rastgele yeni bir web sitesine atlayabilir ve yeniden başlayabilir. Kaçma olasılığı nedir? Bu (1-d) 'dir, bu nedenle bu sıralamayı başka bir şekilde anlamak, Markov'un rastgele yürüyüş modeline benzer.

Bu sıralama da büyük bir başarı elde etti.Her sayıda güncelleniyor.Ayrıca İnternet web sitelerinin web sitelerinin ne kadar iyi performans gösterdiğini ve tanıtımlarının ne kadar başarılı olduğunu açıklayan yetkili bir gösterge haline geldi.

Amazon e-ticaret web sitesinin tavsiyelerde bulunma şekli.

Bir çağrı uygulanır "İşbirliğine dayalı filtreleme" Kavram, sayısız netizenin davranışını İnternette tıklayıp tüketmek ve sonra herkesin neyi seveceğini araştırmak ve tahmin etmektir. Kazılan bilginin kaynağı yukarıda belirtilen puanlama matrisidir.Dikey sıralar web sitesindeki tüm ürünlerdir ve yatay sıralar web sitesindeki kullanıcılardır.Her kullanıcının bir ürün için bir puanı vardır ve puan sıfır değildir.

Bir varsayım yapın: Kullanıcılar ürün satın almışsa, benzer ürünleri tüketme olasılıkları yüksektir.Ne tür ürünler benzerdir? Açıklamak için bu derecelendirme matrisini kullanmaktır.İki filmin derecelendirmeleri bir kullanıcı veya birçok kullanıcıda aynıysa ve iki vektör benzerse, kullanıcının buna yönelik tercihleri tutarlıdır. Benzerlik derecesi, daha yaygın olarak kullanılan CosSim yöntemi ile hesaplanır.

Öncelikle bu kullanıcı temelli öneriden bahsedeyim, bu başka bir hipotez, hayatımızda benzer zevklere sahip ve birçok konuda aynı fikirlere sahip insanlar bulacağımız anlamına geliyor. Bir filmi seviyorsa ama bu film benim değil. Onu gördüm, o zaman muhtemelen beğeneceğim. Etrafımda zevkleri benimkilerle uyuşmayan bir grup arkadaşım varsa, bazıları daha benzer, bazıları çok benzer ve ağırlıklı oylamaya gelirlerse, oy verdikleri filmler de muhtemelen çok beğeniyorum.

Aslında, benzer zevklere sahip bazı kullanıcılar için, kullanıcının izlemediği filmi beğenip beğenmediğini tahmin etmek için bir öğenin derecelendirmelerinin ağırlıklı ortalamasının kullanılabileceği görülebilir.

Kullanıcı benzerliği için birçok hesaplama yöntemi vardır. En basit olanı tıklama oranlarının benzerliğidir.Hepimiz bu filmi seversek, çarpmak daha büyük bir puan alır, aksi takdirde daha küçük bir puan alır. Bu kullanıcı ve ben sırasıyla iki puan vektörünü çarptık, bu bir karakterizasyon. Ancak iki kullanıcının zevkleri çok benzerse, ancak bir kullanıcı 1234 ile puanlamayı seviyorsa, ancak diğer kullanıcının normal puanlama alışkanlıkları onun iki katı ise, bu tıklama oranı formülünü kullanırsanız, sonuç da iki katına çıkar. Bu nedenle, bir normalizasyona ihtiyaç vardır ve CosSim kullanılarak daha tutarlı bir sonuç elde edilebilir.

Aslında başka puanlama yöntemleri de var. Örneğin, bir kullanıcının puanı 1234, diğerinin puanı 2345. Aslında zevkleri ve eğilimleri aynı. Şu anda birini kullanabilirsiniz. Pearson önce her bir kişinin puanından günlük puanının ortalamasını çıkarır. Ortalamadan düşük bir puan negatif bir puandır, aksi takdirde pozitif bir puandır. Benzerlik derecesini hesaplamak için bu pearsonu kullanın ve bu benzerliği bana ve bu arkadaşlara en çok benzeyen arkadaşları bulmak için kullanın ne istersin. Aynı şekilde maddeden kullanıcıya kadar olan puanları bir vektör olarak ele alırsam, benzer işlemleri yapabilirim.

Ancak önceki yöntemler dizisinin sorunlu olduğunu anlayacağız. Sabit kodlanmış formülden ve soyut hipotezden gelir, ancak bu özeti ölçmek için hesaplama yöntemi en iyisidir, ancak yine de sorunlar vardır.

Bir kullanıcı A'yı seviyorsa, A'ya benzer bir şeyden hoşlanır mı? Cevap zorunlu değildir. Bir kullanıcının davranış kalıbı, benzer zevklere sahip diğer kullanıcıların davranışlarıyla gerçekten özetlenebilir mi? Şart değil. Bu vektörde, her bir öğenin veya kullanıcının ağırlığı formül ifadesinden aynıdır, ancak sonuç doğru olmayabilir.

Örneğin, bazı kullanıcılar yetkili kullanıcılardır ve puanlarının açıklamak için belirli nedenleri vardır.Bazı kullanıcılar ruh hallerine göre puan alırlar ve iyi bir ruh halinde olduklarında puan daha yüksektir. O halde bu kullanıcı tarafından ifade edilen bilgiler öncekinden açıkça farklıdır. Her bir öğe kategorisinin ifade ettiği bilgilerin içeriği aynı olmayabilir, örneğin Douban'da çizgi film ise yüksek puan alabilir, müzikal ise filmin kendisinin bir sebebi olmasa bile tüm olay örgüsü daha keyifli. İnsanlar ayrıca daha yüksek puanlar verme eğiliminde olacaktır. Hatta bazı filmlerin seyirci seçme özelliğine sahip olduğu ve bu filmi izleyecek kişilerin şaşırtıcı bir şekilde tutarlı olacağı, yüksek veya düşük puanlar vereceği söyleniyor.

Bu nedenle bu varsayım doğru olmayabilir.Kullanıcı yüksek tıklama oranına sahip bir sayfayı beğenmeyebilir.Bazı kullanıcılar uzun süredir sessiz kalan eski gönderileri beğenebilir veya bazı kullanıcılar yönetmene göre filmleri seçebilir.

Ancak bu yöntemler rastgele olmaktan daha iyi olmalı, sonuçta bazı gerçekler var. Ancak en iyi durum, daha zengin bir seçimim ve hipotezim olması. Her kullanıcının kendi davranış mantığı vardır, böylece puanlama şekli onu yakalayabilir ve her kullanıcının sevdiği veya beğenmediği şeye göre bunu kendim yapabilirim. Düzeltmeler ve geri bildirim.

Bu makine öğrenimi kavramından bahsediyor, Makine öğreniminde, muhtemelen bu dünyada bir gerçek olduğunu varsayıyor ve bu gerçeğin yaptığı f. Mevcut duruma göre, bu nasıl bir insan, bugün hava nasıl, bu nasıl bir içerik ve tüm bu durumlar , Bu kişinin bu öğeyi beğenip beğenmediğini öğrenin.

F'nin tam olarak ne olduğunu bilmiyoruz, son bir hipotez bulduk. Bu hipotez, f'ye olabildiğince yakın olma umududur. Birçok veri grubu vardır, yani birçok grup (x, y) ve sonra bir hipotez uzayı vardır, bu H'dir. Bir algoritma aracılığıyla, A'da f'ye en yakın g'yi arayın ve arama genellikle bir kayıp fonksiyonunu tanımlar. Bu çıktıyı ölçmek için, yani g (x) 'in Y sonucuna yeterince yakın olup olmadığı, yani f (x), bu etkiye ne kadar yakınlarsa o kadar iyidir ve sonra bu boşlukta, bu g'yi sürekli olarak optimize edecek bir algoritma olacaktır, Onu f'ye yaklaştırıp yaklaştırın.

Örneğin, f (x) 'in ne olduğunu bilmiyoruz, o zaman bunun bir formül olduğunu hayal edebiliriz, örneğin

Y = ax1 + bx2 + c, ve sonra bir kayıp fonksiyonu maliyetini tanımlayın, Y eksi yaptığımız tahminin hatasının karesi, pozitif bir sayıdır, hata ne kadar büyükse, kare o kadar büyük olur, yani tahminimiz doğru değildir.

Bu konuyu optimize etmek için bir algoritma var, örneğin g'yi üretmek için maliyeti olabildiğince küçük yapmaya çalışın,

g (x) = 3x1 + 4x2 + 2. Bu şekilde Y tıklama veya tıklamama, film izleme süresinin uzunluğu olarak tanımlanabilir, film izleyerek verilen derecelendirme de olabilir veya kullanıcı deneyimi ve gelirini ölçebilir Tek yön.

Bu makine öğrenimi yöntemiyle, daha fazla ve daha iyi öneriler doğdu, Muhtemelen 2006 ve 2007'den önce, daha önce bahsedilen ortak filtreleme yöntemi genellikle tavsiyelerde bulunmak için kullanılıyordu. 2006'da Netflix, tıklama oranını% 10 artırabilen herkesin 1 milyon ABD doları ödül alabileceğini söyleyerek bir ödül oluşturdu. , Bu ödül yaklaşık bir yıl sonra kazanıldı ve bu yöntem Makine Öğreniminde Matris Ayrıştırma Yöntemi .

Bu yöntem, önce Y'nin ne olduğunu tanımlamamız gerektiği anlamına gelir Bu Y, kullanıcının bir şeyi derecelendirmesini tahmin etmek içindir. Bu tahmin süreci, kullanıcı kimliğini ve öğe kimliğini bilmek ve ardından puanı tahmin etmektir Tahmin ne kadar doğru olursa, iyileştirme etkisi o kadar büyük olur.

Bu yaklaşım şu şekildedir: konuyu soyutlayın ve filmleri örnek olarak kullanın.Herkesin çizgi film gibi, ne kadar sevdiği, gerilim filmlerinden hoşlanır mısınız, ciddi filmleri mi tercih edersiniz yoksa rahat mı, İngilizce veya Çince, kullanıcı tercihlerini 100 boyutlu, 200 boyutlu ve hatta daha fazla boyuta genişletin. Ve aynı filmin kendi öznitelikleri vardır.Kullanıcının tercihlerini ve film özniteliklerini çarpın ve toplam puan elde etmek için bunları bir araya getirin, bu kullanıcının film için tercihidir. Daha sonra bir kayıp fonksiyonunun hesaplama yöntemini, yani gerçek puan eksi tahmin edilen puanın karesini ve bu değeri en aza indirmek için bazı optimizasyon kılavuzlarını tanımlayın ve her kullanıcı ve her öğe için bir tane olduğu hesaplanır. Öngörülen bir sonuç elde etmek için ima edilen tercihler ve özellik vektörleri. Bu sonuç, yeni nesil içerik önerisi için referans haline gelen önceki sonuçtan% 10 daha doğrudur.

Ama aynı zamanda sorunlar da var.

Bu tahminde her eski kullanıcının sadece kullanıcı kimliği, öğe kimliği ve geçmiş derecelendirmelerinin kullanıldığını görüyoruz.Yeni bir içerik ve yeni bir kullanıcının tasvir edilememesi mümkün müdür? Örneğin, bir yönetmen geçmiş performansına dayanarak yeni bir film yaparsa, onu kimin beğeneceğini ve reytinginin ne olacağını belli bir dereceye kadar tahmin edebilir.

Daha fazla bilginin nasıl kullanılacağı da öneri etkisini iyileştirmenin bir yoludur.

Gerçek hayatta nasıl bir şey olduğunu hayal edelim. Yukarıdaki resme bir bakın.Resimde bir giyim mağazasındaki bir bayanı göstermektedir.Alışveriş rehberi onu ilk gördüğünde bazı kararlar verecektir: Müşterinin bir erkek arkadaşı olup olmadığı, bir erkek arkadaş getirmenin maliyeti daha fazla olabilir; Sonbaharda kalın kıyafetler alacağım; mağazanın bulunduğu yerin MİA'da mı yoksa Wudaokou'da mı olduğunu; kullanıcının diğer bilgilerini gözlemlemek, hangi marka giyiyor, aynı marka daha etkili olabilir; ne tür bir çanta taşıdı, gösteren Müşterinin harcama gücü; müşterinin mağazadan daha önce bir şey satın alıp almadığı; mağazaya girdikten sonra bir şeye mi bakıyor yoksa sadece gelişigüzel mi bakıyor? Ve alışveriş rehberinin her ürün hakkında zengin bir anlayışa sahip olması gerekir: geçmişte bu ürünü kim almış, stil ve kumaş nedir, anlatılacak bir hikaye olup olmadığı, indirimli mi, vb.

Bu daha fazla özellik, daha fazla seçenek sağlamak için makine öğrenimi algoritma modeline eklenebilir Yani daha fazla alan sağlıyoruz, bu alan önceki puanlama formülü ile sınırlı değil, önceki sıralama yöntemi ile sınırlı değil ve önceki ilgi boyutunun tahmin göstergeleri ile sınırlı değil. Kullanıcı bilgileri, ürün bilgileri, hava durumu gibi güncel bilgiler, son koşullar ve kullanıcının daha önce ne satın aldığı dahil olmak üzere daha fazla ve daha zengin bilgi ekleyebilirsiniz.

Her tür bilgi bir tür varsayıma karşılık gelir, hangi tür varsayımın işe yarayacağı ve hangi tür varsayımın daha ağır olduğu matematiksel yöntemlerle eğitilebilir ve öğrenilebilir. Makine öğreniminde denetimli öğrenmenin tahmin motoru, reklamcılık, arama sıralaması, e-ticaret ve içerik önerisi alanlarında temel motor haline geldi. Ayrıca isteğe bağlı bir sorudan zorunlu bir soruya ve hatta tavsiyenin ne kadar iyi yapıldığını doğrudan ölçen temel bir göstergeye dönüşmüştür.

Şimdi kabaca üç parçadan oluşan bir öneri sisteminin tipik mimarisinden bahsedelim: geri çağırma, sıralama ve öneri listesi oluşturma.

Önerilen tahmin modelini yeni tanıttık, iyi bir öneride bulunmak için doğrudan kullanabilir miyiz? Hayır, şu anki aday veri setlerinin hepsi on milyarlarca ve on milyonlarca. Bu muazzam miktardaki bilgi, çok detaylı bir sonucu hesaplamak için tek tek hesaplanabilir ve zaman maliyeti çok yüksektir.

Örneğin şirketimiz 5 kişiyi işe almak istiyor, 1000 özgeçmiş alırsak görüşme iyi bir yol olsa da görüşmenin tamamlanması kesinlikle imkansız. Genel olarak, önceki iş endüstrisi, okul, performans ve diğer göstergelere göre sıralanabilen nispeten yüksek kaliteli bazı kişileri görüşmeler için ayırmak için önce çeşitli yöntemler kullanacağız ve nihayet bir sıralama elde edeceğiz. Sıralama sonucuna göre, en iyi on kişiyi alacağız. Yirmi ve sonra bazı seçkin insanları görüşmeye davet edin.

İlk adım ön taramanın nasıl yapılacağıdır, Ön taramayı gerçekleştirmek için verimli bir yol kullanmaya çalışmalıyız. En basit yol, geri çağırmayı sıralamak, daha yeni ve daha sıcak içeriği ve kullanıcıya daha yakın olan içeriği hatırlamaktır. Uygulanabilecek daha az bilgiye sahip bazı basit modeller, çevrimiçi sıralama modeli kadar büyük değildir, ancak hesaplama verimliliği nispeten yüksektir; bazı kural geri çağırmaları da yapılabilir, örneğin bugün yağmurluysa, kullanıcılar şemsiyeleri satın alabilir, örneğin son göz atma, İlişkisi, arkadaşlarının ne satın aldığı vb. En iyi tavsiye yöntemini alabilmek için e-ticaret öneri siteleri sürekli olarak çeşitli kuralları dener ve hatta erkek arkadaşınızın düşündüğünden daha detaylı olabilir.

sonra Bu sıralama aşamasında, önceden daha fazla faktörün dikkate alınması gerektiğinden bahsetmiştim. Örneğin, sonbahar geldiğinde, daha fazla mevsimlik ürünler önermemiz gerekir mi; kullanıcılar şu anda 4G ağları kullanıyor, kısa metin içeriğine bakmayı tercih ediyorlar mı; kullanıcılar APP'de çok aktif, birçok davranış dizisi var, o zaman o Bu dizilerde davranışsal bir değişim olacak mı yoksa bu sosyal ilişkiler herhangi bir destek sağlayabilir mi?

Bu, artık en yeni sıralama modelidir widedeep modelleri , Aynı zamanda geniş ve derinliği birleştirmenin bir yolu. Öncelikle, tüm özellikler bu modele geniş bir şekilde eklenmiştir ve önerilen içeriğin görüntü bilgileri gibi bazı daha zor olan özellikler, özellik özniteliklerini hesaplamak için CNN aracılığıyla hesaplanabilir; metin bilgileri Word2vec aracılığıyla elde edilebilir; kullanıcıların görüntülemesi, Toplama, satın alma ve arama sırası gömülerek hesaplanabilir. Elbette, bu modellerin her biri tahmin edilen bir değer üretecektir, ancak genellikle geri adım atıp önceki katmanın bilgilerini karar vermek için kullanırız. Örneğin, bir yüzü, iki yüzü ve üç yüzü olan üç görüşmecimiz var ve bunların çıktısı: Basit bir nokta, geç ya da kal. Ancak, görüşmeciler, mühendislik yeteneği, akademik yeteneği ve şirkete gelme isteği gibi bu puanlamayı daha ayrıntılı hale getirebilirler. Bu bilgiler daha bol kullanılırsa bu model daha iyi sonuç alabilir.

Bu modelin ihraç edilmesi gerekiyor mu? Ne de.

Tıpkı bir lokantadaki bir kullanıcı gibi, her yemeği bitirdiğinde bir değerlendirme alabilir.Model eğitimi sayesinde, en çok kaburga yemeyi sevdiğini görebilir.Daha sonra, bu sıralamaya göre, ilk on, kızarmış kaburga, tatlı ve ekşi kaburga, buharda pişirilmiş kaburga olabilir. , Kaburga çorbası vb. Ancak açıkçası, böyle bir yemek masası sunulduğunda kullanıcı deneyimi iyi değil.

Bir öneri sistemi olarak, sonuçların olabildiğince çeşitli olmasını umuyoruz, Kullanıcının en sevdiği alan futbol ve Messi de favoridir. Messi'nin herhangi bir konusu bir zorunluluktur, ancak Messi'nin içeriğini ona sadece öneremeyiz. O zaman bu sistem konusunda çaresiz olabilir. Kullanıcılar hala güncel olaylar, eğlence ve askeri işler için gerekli olan çeşitlendirilmiş içeriği görmek istiyor. Tecrübe açısından, ödünleşim aynı zamanda madenciliğe odaklanmak ve bunu kullanıcıların sevdiği şu anda bilinen içeriğe göre sürekli olarak görüntülemek; ya da diğer alanlardaki bazı tercihlerini toplamak için kullanıcıya farklı içerik göstermeyi düşünmektir. Önerilen kullanıcıların tavsiye edilen içeriği beğenmeme riski olsa da aslında kullanıcıların beğeneceği yeni bir alan kazanmak mümkün ve daha geniş bir tavsiye yelpazemiz ve daha iyi bir kullanıcı deneyimi elde edeceğiz. Ek olarak, bu öneri sistemi, Doğruluk, çeşitlilik ve yenilik Ayrıca belirli bir değiş tokuşun olması gerekiyor.

Aşağıda bunun hakkında konuşalım, Bu öneri sisteminin mimarisini uygulamak için yapılması gerekenler.

Her şeyden önce, çevrimiçi bir talep oluştuğunda ne yapmamız gerekiyor? Çeşitli kurallar aracılığıyla tüm aday kümesinden seçim yapmamız ve ardından filtrelemeyi seçmemiz, kullanıcının gördüğü hoşlanmamaları filtrelememiz ve ardından sıralamayı girmemiz ve ardından bir hesaplama yapmak için model aracılığıyla parametreleri elde etmemiz ve son olarak, bazı kurallara göre, çeşitli Liste oluşturmak için tekilleştirme. Bu süreçte üretilen sonuçların tek bir gösterim için yeterli olmaması mümkündür ve geri dönüp içeriği daha geniş bir geri çağırma aralığı ile zenginleştirmeniz gerekir. Sürecin tamamında, kullanıcı deneyimi göz önüne alındığında, tamamlanma süresinin 200 milisaniye ve 100 milisaniye içinde kontrol edilmesi gerekir.Bu hala oldukça güçlü bir iş zorluğudur ve çok fazla optimizasyon çalışması gerektirir.

Bu makine öğrenimi modelinin yeterli veri elde edebilmesi için, Kapalı bir çevrimdışı veri akışı döngüsü oluşturun. Başlangıçta, tüm aday set bilgilerini depolamak, bu tabloya göre arama yapmak ve ardından gerçek zamanlı çevrimiçi kayıt yapmak ve son olarak dikmek için bir tablo olmalıdır.

Daha sonra bir tavsiyede bulunduğumuzda, kullanıcı özelliklerini ve öğe özelliklerini bir araya getirmemiz gerekir. Kullanıcı beğenmeyi veya satın almayı seçmeyi veya kapatmayı, silmeyi ve diğer işlemleri tıkladığında, kullanıcı davranışı önceki oluşturulan özelliklere geri beslenecek ve ardından bu özellikler eğitim için bu modele beslenecektir.

Tüm bu sistemin hızlı bir şekilde yinelenebilmesi, ürün ve performans algoritmik gereksinimlerine hızlı bir şekilde yanıt vermesi ve daha fazla ilerleme ve gelişme gerektirmesi gerekir.

"Bir satranç ustası her turda iki hamle yapan bir amatör tarafından kolayca mağlup edilir." Demek ki, ne kadar hassas düşünürseniz ve hedef doğru olursa olsun, çok yavaş yürürseniz, başkaları tarafından geliştirilirsiniz. Atmak.

Mimarimiz de, ürün talebi gelirse öneri sonuçlarından çok hızlı bir şekilde görüntülenmesi gerekiyor. Model bu kadar hızlı güncellenmezse, başka stratejiler veya başka kurallar kullanılarak görüntülenebilir mi? Ve modelin güncellenmesi gerekiyor, bu verileri toplamak için daha fazla deney yapmaya çalışın ve sonra daha iyi seçimler yapın.

Makine öğreniminde birçok zorluk vardır. Birincisi hız, Verilerin büyümesi teknoloji tarafından kontrol edilmez, özellikle ürün başarılı olduktan sonra daha fazla kullanıcı, daha fazla veri ve daha fazla özellik olacaktır.Model eğitiminin nasıl tamamlanacağı ve sınırlı bir süre içinde güncelleneceği makine öğrenimi hesaplama çerçevesinin en büyük zorluğudur. bir.

Bu kadar çok özellik ve daha karmaşık modelle, etki geliştirildi, bu nedenle bu etkilerin ve maliyetlerin nasıl dengeleneceği ve değiş tokuş edileceği de bir sorundur.

Makine öğrenimi görevleri için optimize edilmiş bir bilgi işlem çerçevesi de vardır.

Başka bir sorun da Ölçeklenebilirlik açısından, iş büyümesinin hızı sadece hacim büyümesi değil, aynı zamanda boyutsal büyümedir. Örneğin, daha fazla kullanıcı türüne ve daha fazla içeriğe sahibiz ve özelliklerin büyümesi de daha büyük zorlukları beraberinde getiriyor.

Bu şirket küçükten büyüğe büyüdü, farklı öneri modellerine uygun; bir şirket yeterli veri oranına sahip daha büyük bir şirket haline geldi, daha fazla veri aslında daha fazla çıktı üretmek için daha karmaşık modeller oluşturmamızı sağlayabilir İyi sonuçlar, bu verileri tam olarak kullanırsanız, bu öneri sonucu da daha büyük bir engel haline gelecektir. Başka bir deyişle, yeterince erken koşarsanız, başkalarının sadece bu engele güvenerek size yetişmesi zor olacaktır.

Makine öğrenimi araştırmasında da birkaç optimizasyon yönü vardır.

Örneğin, y = f (x) 'i optimize edersek, daha iyi ürün formu ve etkileşim tasarımı gibi daha iyi bir y toplayabilir miyiz, böylece kullanıcılar gerçek Geri bildirim, kullanıcılar ve öneri sistemi arasındaki etkileşimin daha entegre olmasına izin veren daha yenilikçi bir ürün formu olup olmadığı.

X açısından bakıldığında, önerilen içeriğin görüntü, ses, metin özellikleri ve oturum özellikleri gibi kullanılabilecek daha fazla özellik türü vardır. Daha fazla özelliğe sahibiz. Daha iyi bir kalite elde etmek için özellik kombinasyonu ve özellik dönüşümü nasıl yapılır X ve hipotez alanımızı nasıl zenginleştireceğimizi, uğraşmak istediğimiz problemi nasıl soyutlayacağımızı, onunla eşleşen bir optimizasyon algoritması tasarlamayı, bunlar gelecekteki optimizasyon yönergeleridir.

Evergrande J-Horse Dünya Kupası'nı mahvetti, ünlü Japon kalecisi artık yedek kulübesinde oturuyor
önceki
Saf Çin usulü tavuk yeme oyunu nedir? Oyuncular dövüş sanatlarında tavuk yemek isterlerse, Kalp Sutrasını öğrenmeleri gerekir.
Sonraki
Chengdu sokaklarında bu coupe SUV ile yürürken, geldiğimde gerçekten ayrılmak istemiyorum
Wu Lei bir zamanlar onun tarafından boğulmuştu, ama yine de sevgiyle "Üç Kardeş" olarak anılıyordu! Yüksek EQ ile Bundesliga'ya inerken söylenecek hiçbir şey yoktu
En iyi 12 yarışmanın en iyi golcüsü, ülkenin genç oyuncusu olan iki yaşındaki Wu Lei'den geliyor.
SUV pazarının tam kapsamı, Dongfeng Nissan NISSAN Global Challenge, adrenalinim kayboldu
Çin ve Tayvan'ın gollerini kıran adam Tayland takımını utandırdı
Taraflardan biri Chelsea'yi ileriye mi hedefliyor? İngiliz medyası: Schuster bir zamanlar oyuncunun son sesini övdü
League of Legends S8, RNG takımı neden şampiyonluğu kazanan favori oldu? Netizenlerden gelen birkaç kelime insanları sessizleştiriyor
Qiyun akıllı ceketinde 900.000 adet satan Trumpchi GS4, gelecekte kaç yeni zirve yapacak?
34 yıl önce Milli Futbol Takımı, 18 yaşındaki sihirli askerin ortaya çıkması nedeniyle Dünya Kupası'ndan reddedildi Can Lin Liangming mücadelesi!
Jianghu yardım! Wu Lei, ağır omuz yaralanması geçirdi ve çok yürek burkan. Ulusal Futbol Takımı, SIPG doktorlarını tedavi için BAE'ye davet ediyor
World of Warcraft 8.0'daki en iyi 4 yarışa göz atın! Kara demir cüceler en güçlüsüdür ve troller en hızlı şekilde mezun olur!
20186. SAIC Design International Challenge SDC China Top 30 European Division Top 5 List
To Top