Öneri algoritması yeterince doğru değil mi? Bilgi grafiği çözsün

Xiao Wang bir programcıdır. Sabah saat 8'de alarmla uyandı, telefonunu aldı ve APP'nin önerdiği en son haberlere telefonunda göz atmaya başladı:

Sonra Xiao Wang, dün gece alışveriş sepetinde bırakılan ayakkabıların henüz sipariş edilmediğini hatırladı. Bu yüzden bir alışveriş uygulaması açtı ve alışveriş sepetini kontrol etti:

Ancak aşağıda önerilen spor ayakkabıların kendisine daha uygun göründüğünü düşünerek bir çift aldı.

Xiao Wang kahvaltıdan sonra işe gitmek için metroya bindi. Metrodaki sıkılmış Xiao Wang belirli bir müzik uygulamasını açtı ve sistem zaten onun için önerilen şarkıları seçti:

Xiao Wang, şirkete geldikten sonra bitmemiş kod yazmaya devam etti, ancak parametreleri tatmin edici bir seviyeye ayarlayamadı. Bazı sinirli Xiao Wang, ara vermek istedi, bu yüzden bir bilgi uygulaması açtı ve kendisi için önerilen birkaç konuya baktı:

Dikkatlice okurken yönetici çalışmadığını fark etti ve çok kızdı, bu yüzden Xiao Wang'ı ciddi şekilde eleştirdi. Xiao Wang çok haksız olduğunu hissetti. Bu sırada telefonundaki bir iş arama uygulaması ona bir itme gönderdi:

Xiao Wang, bu pozisyonların kendisi için oldukça uygun olduğunu hissetti, bu yüzden kalbinden ayrılmayı planladı. Öğle yemeği vakti geldiğinde, Xiao Wang bir paket uygulama uygulaması açtı ve sistem tarafından önerilen yakındaki restoranları kontrol etti:

Xiao Wang, belirli bir eğlence uygulamasına göz atarken, akşamları kız arkadaşıyla birlikte izlemek için önerilen performansları kontrol ederken, yeni teslim edilen paketi yiyordu:

Akşam gösteriyi izledikten sonra Xiao Wang ve kız arkadaşı çok memnun kaldılar ve bu APP'nin sistem tavsiyesinin harika olduğunu düşündüler.

Önerilen sistem

Xiao Wang gibi, neredeyse hepimiz öneri işlevlerini her gün birden fazla uygulamada kullanıyoruz. Bu işlevlerin arkasında Kişiselleştirilmiş öneri sistemi (Kişiselleştirilmiş tavsiye sistemleri). İnternet teknolojisinin ve endüstrisinin hızla gelişmesiyle birlikte, İnternete bağlı sunucuların ve web sayfalarının sayısı da katlanarak artmıştır. Kullanıcılar muazzam miktarda bilgiyle karşı karşıyadır ve geleneksel arama algoritmaları, kullanıcılara yalnızca aynı öğe sıralama sonuçlarını sunabilir ve farklı kullanıcıların ilgi alanlarına karşılık gelen hizmetleri sağlayamaz. Bilgi patlaması bilginin kullanımını azaltır. Bu fenomene Bilgi bombardımanı (Bilgi bombardımanı).

Öneri problemi, esasen, kitaplar, filmler, haberler, müzik, restoranlar, turistik yerler vb. Dahil olmak üzere, hiç görmedikleri, dokunmadıkları veya kullanmadıkları öğeleri değerlendirmek için kullanıcıları ikame etmektir. Bilgi filtrelemenin önemli bir aracı olan öneri sistemi, aşırı bilgi yüklemesi sorununu çözmek için en etkili yöntemlerden biridir ve kullanıcı odaklı İnternet ürünlerinin temel teknolojisidir.

Öneri sisteminin görevleri ve zorlukları

Farklı tahmin nesnelerine göre, öneri sistemleri genellikle iki kategoriye ayrılabilir: Puan tahmini (Derecelendirme tahmini), örneğin, film uygulamalarında, sistemin kullanıcının filmi derecelendirmesini tahmin etmesi ve bunu beğenebilecekleri filmi ilerletmek için bir temel olarak kullanması gerekir. Bu senaryodaki kullanıcı geri bildirim bilgileri kullanıcının tercihini ifade eder, bu nedenle bu bilgiler aynı zamanda Açık geri bildirim (Açık geri bildirim); diğeri Tıklama oranı tahmini (Tıklama oranı tahmini) Örneğin, haber uygulamalarında, tavsiye planını optimize etmek için sistemin bir kullanıcının belirli bir habere tıklama olasılığını tahmin etmesi gerekir. Bu senaryodaki kullanıcı geri bildirim bilgileri yalnızca kullanıcının davranış özelliklerini ifade edebilir (tıklama / tıklamama), ancak kullanıcının tercihini yansıtamaz, bu nedenle bu bilgiler aynı zamanda Örtülü geri bildirim (Örtülü geri bildirim).

Geleneksel tavsiye sistemleri, yalnızca kullanıcılar ve öğeler arasındaki geçmiş etkileşim bilgilerini (açık veya örtük geri bildirim) girdi olarak kullanır ve bu da iki sorunu beraberinde getirir: Kullanıcılar ve öğeler arasındaki etkileşim bilgileri genellikle çok seyrek (seyrek) nın-nin. Örneğin, bir film uygulaması on binlerce film içerebilir, ancak ortalama olarak, bir kullanıcı tarafından abartılan yalnızca birkaç düzine film olabilir. Büyük miktarda bilinmeyen bilgiyi tahmin etmek için bu kadar az miktarda gözlemlenen veriyi kullanmak, algoritmanın Aşırı uyum gösterme (Aşırı uyum) riski; iki, Yeni eklenen kullanıcılar veya öğeler için, sistem geçmiş etkileşim bilgilerine sahip değildir Bu nedenle, doğru bir şekilde modellemek ve tavsiye etmek imkansızdır. Bu duruma aynı zamanda Soğuk başlatma sorunu (Soğuk başlatma sorunu).

Seyreklik ve soğuk başlatma problemini çözmek için ortak bir fikir, öneri algoritmasıdır. Giriş olarak bazı ek yan bilgileri tanıtın . Yardımcı bilgiler, kullanıcıların ve öğelerin açıklamasını zenginleştirebilir, öneri algoritmalarının madencilik yeteneğini geliştirebilir ve etkileşimli bilginin seyrekliğini veya eksikliğini etkili bir şekilde telafi edebilir. Yaygın yardımcı bilgiler şunları içerir:

  • Sosyal ağ (Sosyal ağlar): Bir kullanıcı bir öğeyle ilgilenir ve arkadaşları da öğeyle ilgilenebilir;
  • Kullanıcı / öğe özellikleri (Öznitelikler): Aynı özniteliklere sahip kullanıcılar, aynı tür öğelerle ilgilenebilir;
  • Resim / video / ses / metin ve diğer multimedya bilgileri (Multimedya): Örneğin, ürün resimleri, film fragmanları, müzik, haber başlıkları vb .;
  • Bağlam (Bağlam): Kullanıcı-öğe etkileşiminin zamanı, yeri, mevcut oturum bilgileri vb.
  • ...

Belirli öneri sahnesinin özelliklerine göre çeşitli yardımcı bilgilerin öneri algoritmasına nasıl etkili bir şekilde entegre edileceği her zaman olmuştur Öneri sistemi araştırma alanı Sıcak noktalar ve zorluklar, çeşitli yardımcı bilgilerden etkili özelliklerin nasıl çıkarılacağı da Önerilen sistem mühendisliği alanı Temel sorun.

Bilgi Grafiği

Çeşitli yardımcı bilgiler arasında, ortaya çıkan bir yardımcı bilgi türü olan bilgi grafiği, son yıllarda araştırmacıların ilgisini giderek daha fazla çekmiştir. Bilgi grafiği (bilgi grafiği) anlamsal bir ağdır ,onun Düğüm (Düğüm), varlık (Varlık) veya konsept (Konsept), yan (Kenar) çeşitli varlıkları / kavramları temsil eder Anlamsal ilişki (İlişki). Bir bilgi grafiği birkaç üçlüden (h, r, t) oluşur; burada h ve t, bir ilişkinin baş ve kuyruk düğümlerini ve r, ilişkiyi temsil eder.

Yukarıdaki resimde gösterilen üçlü, h = Chen Kaige, t = Farewell My Cariye ve r = Yönetmen olan "Farewell My Cariam'ı Chen Kaige'nin yönettiği" gerçeğini ifade etmektedir.

Bilgi grafiği varlıklar arasında zengin anlamsal ilişkiler içerir ve öneri sistemi için potansiyel bir yardımcı bilgi kaynağı sağlar. Bilgi grafiği, filmler, haberler, manzaralı noktalar, restoranlar, alışveriş vb. Gibi önerilen birçok senaryoda uygulanma potansiyeline sahiptir. Diğer yardımcı bilgilerle karşılaştırıldığında, Bilgi grafiğinin tanıtımı, önerilen sonuçların aşağıdaki özelliklere sahip olmasını sağlayabilir :

  • Doğruluk (Hassas). Bilgi grafiği, öğeler için daha anlamsal ilişkiler sunar ve kullanıcıların ilgi alanlarını derinlemesine keşfedebilir;

  • Çeşitlilik (Çeşitlilik). Bilgi grafiği, öneri sonuçlarının farklılaşmasına yardımcı olan ve öneri sonuçlarının tek bir türle sınırlı kalmasını önleyen farklı türde ilişki bağlantıları sağlar;

  • Yorumlanabilirlik (Açıklanabilirlik). Bilgi grafiği, kullanıcıların geçmiş kayıtlarını ve öneri sonuçlarını birbirine bağlayabilir, böylece kullanıcıların memnuniyetini ve öneri sonuçlarını kabul etmesini iyileştirebilir ve kullanıcıların öneri sistemine olan güvenini artırabilir.

Burada bahsetmeye değer Bilgi grafiği ve öğe özellikleri arasındaki fark . Öğe özellikleri Bilgi grafiğindeki bir öğeye doğrudan bağlı 1-sekmeli bir düğüm olarak görülebilir, Bilgi grafiğinin zayıflatılmış bir versiyonu . Aslında, eksiksiz bir bilgi grafiği öğeler arasında daha derin ve daha uzun menzilli bağlantılar sağlayabilir, örneğin "Elveda Cariyem-Leslie Cheung-Hong Kong-Tony Leung-" Cehennem İşleri ". Bilgi grafiğinin daha yüksek boyutluluğu ve daha zengin anlamsal ilişkiler nedeniyle, işlenmesi, bu nedenle öğe özelliklerinden daha karmaşık ve zordur.

Genel olarak, bilgi grafiklerini öneri sistemlerine sokabilen mevcut çalışma iki kategoriye ayrılır:

  • LibFM tarafından temsil edilmektedir Genel özellik tabanlı öneri yöntemi (Genel özellik tabanlı yöntemler). Bu tür bir yöntem, öneri algoritmasının girdisi olarak kullanıcıların ve öğelerin özniteliklerini aynı şekilde alır. Örneğin, LibFM bir kullanıcının ve bir öğenin tüm özelliklerini x , Ve sonra kullanıcı ile y öğesi arasındaki etkileşim gücünün ( x ) Özellikteki tüm birinci ve ikinci öğelere bağlıdır:

Bu tür yöntemin çok yönlülüğüne dayanarak, bilgi grafiğini öğe özelliklerine göre zayıflatabilir ve sonra bu tür yöntemi uygulayabiliriz. Elbette, bu yaklaşımın dezavantajları da açıktır: Bilgi grafiği için özel olarak tasarlanmamıştır, bu nedenle bilgi grafiğindeki tüm bilgileri verimli bir şekilde kullanamaz. . Örneğin, bu tür bir yöntemin çoklu atlama bilgisini kullanmak zordur ve ayrıca ilişki bilgisini tanıtmak da zordur.

  • PER ve MetaGraph tarafından temsil edilir Yol tabanlı öneri yöntemi (Yol tabanlı yöntemler). Bu tür bir yöntem, bilgi grafiğini bir Heterojen Bilgi Ağı (Heterojen bilgi ağı) ve ardından öğeler arasında meta-yol veya meta-grafik tabanlı özellikler oluşturun. Basitçe söylemek gerekirse, meta-yol, "Aktör-" gibi iki varlığı birbirine bağlayan belirli bir yoldur. > film- > yönetmen > film- > Aktörün meta yolu "iki aktörü birbirine bağlayabilir, bu nedenle aktörler arasındaki potansiyel ilişkiyi keşfetmenin bir yolu olarak görülebilir. Bu tür bir yöntemin avantajı, Bilgi grafiğinin ağ yapısını tam ve sezgisel olarak kullanın , Dezavantajları Meta yolu veya meta grafiği manuel olarak tasarlamanız gerekiyor Pratikte optimal olana ulaşmak zordur; aynı zamanda bu tür bir yöntem Varlıkların aynı alana ait olmadığı senaryolarda (haber önerisi gibi) uygulanamaz Çünkü bu tür senaryolar için meta-yolu veya meta-grafiği önceden tanımlayamıyoruz.

Bilgi grafiği özelliği öğrenme

Bilgi Grafiği Gömme, grafikteki orijinal yapıyı veya anlamsal bilgileri korurken, bilgi grafiğindeki her varlık ve ilişki için düşük boyutlu bir vektör öğrenir. Aslında, bilgi grafiğinin öğrenme özelliği, Ağ özelliği öğrenimi Bilgi grafikleri benzersiz anlamsal bilgiler içerdiğinden (ağ yerleştirme) alt alanı, bilgi grafiği özelliği öğrenimi, genel ağ özelliği öğrenmeye göre daha dikkatli ve hedeflenen model tasarımı gerektirir. Genel olarak, öğrenme modellerini içeren iki tür bilgi grafiği vardır:

  • Mesafeye dayalı çeviri modeli (Mesafeye dayalı öteleme modelleri). Bu tür bir model, bir üçlü olma olasılığını değerlendirmek için mesafeye dayalı bir puanlama işlevi kullanır ve kuyruk düğümünü baş düğüm ve ilişki çevirisinin sonucu olarak ele alır. Bu tür yöntemlerin temsilcileri TransE, TransH, TransR, vb .;

  • Anlam temelli eşleştirme modeli (Anlam temelli eşleştirme modelleri). Bu model türü, üçlülerin olasılığını değerlendirmek için benzerliğe dayalı bir puanlama işlevi kullanır ve benzerlik ölçümü için varlıkları ve ilişkileri örtük anlamsal alana eşler. Bu tür yöntemlerin temsilcileri KOBİ, NTN, MLP, NAM vb.

Bilgi grafiği özellik öğrenimi, her varlık ve özellik öğrenmesi için düşük boyutlu bir vektör elde ettiğinden ve orijinal görüntünün yapısı ve anlamsal bilgileri vektörde korunduğundan, iyi bir varlık vektörleri seti varlıklar arasındaki ilişkiyi tam ve tam olarak temsil edebilir Karşılıklı ilişkiler, çünkü çoğu makine öğrenme algoritması düşük boyutlu vektör girdisini kolayca işleyebilir. bu nedenle Bilgi grafiği özellik öğrenmeyi kullanarak, bilgi grafiğini çeşitli öneri sistemi algoritmalarına kolayca dahil edebiliriz . Özetle, bilgi grafiği özelliği öğrenimi şunları yapabilir:

  • Bilgi grafiğinin yüksek boyutluluğunu ve heterojenliğini azaltın;
  • Bilgi grafiği uygulamasının esnekliğini artırın;
  • Özellik mühendisliğinin iş yükünü azaltın;
  • Bilgi grafiklerinin kullanılmasının neden olduğu ek hesaplama yükünü azaltın.

Bu yazıda öneri sistemini, bilgi grafiğini ve öneri sistemindeki bilgi grafiğinin uygulama değerini tanıttık. Öneri algoritmasının yardımcı bilgileri olarak bilgi grafiğinin tanıtımı, öneri sisteminin doğruluğunu, çeşitliliğini ve yorumlanabilirliğini büyük ölçüde artırabilir. Önümüzdeki haftanın makalesinde, bilgi grafiklerini öneri sistemlerine tanıtmanın çeşitli fikirlerini ve uygulamalarını detaylandıracağız, bu yüzden bizi izlemeye devam edin!

Referanslar

Libfm ile faktorizasyon makineleri

Kişiselleştirilmiş varlık önerisi: Heterojen bir bilgi ağı yaklaşımı

Heterojen bilgi ağları üzerinden meta grafik tabanlı öneri füzyonu

Bilgi grafiği yerleştirme: Yaklaşımlar ve uygulamalarla ilgili bir anket

Orijinal metin WeChat Resmi Hesabı-Yapay Zeka Başlıklarında (AI_Thinker) yayınlandı

Akşam saat 2'de Zhejiang'lı bir kadın 120'yi aradı, ama ambulanstan çıkan kocasıydı! orijinal
önceki
Kar düştü! Bu yıldız şirkete ne oldu
Sonraki
Borsa birçok iyi hafta sonunun ardından neden düştü?
Qingdao, Shandong: İlkokul öğrencileri Dünya Kitap Gününü kutlamak için "Dört Bahar" etkinliği düzenlediler.
Kırsal canlanma için yetenek desteği sağlayın! Shantou "Binlerce, Yüzlerce ve Onlarca" yerel yetenek geliştirme projesini başlattı
Fengshun İlçesinin Jianzhen Kültür ve Spor Merkezi (altı salon ve altı merkez) projesi için 550 milyon yuan'dan fazla tam bağış ile bağış ve inşaat anlaşmasının imza töreni Guangzhou'da yapıldı.
Longhua Bölgesi Longteng Okulu Eylül ayında açılıyor ve ilk ve orta okullarda 54 sınıf açması bekleniyor
Qingfeng, Henan: 96 yaşındaki Japon karşıtı savaş gazisi Xia Wenyi ülkeye 70 yıldan fazla parayı ücretsiz bağışladı
Dongguan'daki bu okulun profesyonel planlama ve tasarım yarışması görüntülendi!
Vadeli işlem hesabı açılış avantajları
Bu ünlü imalat şehri "Guanyi Craftsman" ı seçecek, siz misiniz?
Japon turistler Çin'e seyahat ettiklerinde her şeyden çok memnunlar ama anlamıyorlar
Dünya Kitap Günü gelmeden önce bu okul bir "okuma alanı" inşa etti
Fourier FFT-spektrum analizi ayrıntılı öğretici gerçekleştirmek için python kullanın
To Top