E-ticaret bilişsel zeka çağının temel taşı: Alibaba'nın e-ticaret bilişsel haritası ortaya çıktı

Bugün, Arama Önerileri Bölümünün Bilişsel Harita Ekibi, e-ticaret bilişsel haritası oluşturmadaki mevcut araştırmayı kapsamlı bir şekilde özetledi, esas olarak bilişsel haritanın tanımını, genel inşaat fikirlerini, inşaat sürecindeki bazı özel algoritmik sorunları ve son olarak Önerilen uygulamaları arayın.

arka fon

E-ticaret arama ve öneri algoritmaları son yıllarda büyük ilerleme kaydetmiş olsa da, bu algoritmalarda, genellikle tavsiye ve yenilik eksikliği ile eleştirilen tekrarlanan öneriler gibi hala birçok sorun bulunmaktadır. Aslında bunun nedeni, mevcut algoritmaların esas olarak "maldan metaya" fikrini takip etmesi ve doğrudan kullanıcı ihtiyaçları tarafından yönlendirilmemesi ve hatta kullanıcı ihtiyaçlarının net bir tanımının olmamasıdır. Öte yandan, kullanıcı ihtiyaçlarını anlamak ve tatmin etmek bu algoritmaların nihai amacıdır ve ikisi arasında doğal bir engel vardır.

Bu engeli aşmak ve arama ve öneri algoritmalarının kullanıcıların ihtiyaçlarını daha iyi anlamasına izin vermek için, kullanıcı ihtiyaçlarını grafikte düğümler olarak açıkça ifade eden büyük ölçekli bir E-ticaret ConceptNet oluşturmayı öneriyoruz ( E-ticaret Kavramı) ve bu talep noktalarını e-ticaret alanındaki ürünler ve kategorilerle ve e-ticaret dışındaki genel alan bilgisiyle ilişkilendirerek ürün bilişi, kullanıcı bilişi ve bilgi bilişi için birleşik bir veri temeli sağlamak , Ve aşağı akış arama önerisi algoritmaları için yeni optimizasyon fikirleri ve daha fazla olasılık sağlayın.

E-ticaret kavramı nedir?

Daha önce bahsedildiği gibi, kullanıcı ihtiyaçlarına "e-ticaret kavramı" diyoruz: genellikle sağduyuya uyan, tam anlamsallığa ve yumuşak bir kelime düzenine sahip bir cümle ile temsil edilen meta ihtiyaçları olan bir kavram. Örneğin: "Kıyafet", "Çocuk Kaybı", "Barbekü Gerekiyor", "Bebeği Sıcak Tutuyor", "Bohem Kıyafeti", "Çin Yeni Yılı Kutlaması" vb. Bu kavramların aşağıdaki temel ilkeleri karşılaması gerekir:

Yukarıda gösterildiği gibi, sağdaki ifadeler e-ticaret kavramlarının temel ilkelerini ihlal ediyor, bu nedenle gerçek madencilik sürecinde filtrelenecekler. Ayrıca kavramı üç kategoriye ayırıyoruz:

  • Alışveriş senaryosu: "Çocukların kaybını önleme", "Çin Yeni Yılı hediyeleri" gibi güçlü bir sahne duygusuyla spesifik olmayan bir kategorideki kullanıcı ihtiyaçlarını temsil eder.
  • Kapsamlı kategori: Belirli bir kategoriye sahip bir kullanıcı ihtiyaçları kategorisini belirtir. "Kıyafet", "meyve" vb. Gibi değiştirilmeden saf bir kategori veya "Korece versiyonu" gibi özellik kısıtlamaları olan bir kategori olabilir. "Elbise", "Çocuk badminton raketi" vb.
  • Genel kavram: "Güneşten korunma", "barbekü", "yaşlılar" gibi e-ticaret dışındaki açık alan bilgisi ile ilişkilendirilebilecek genel bir kavram.

E-ticaret kavramı nereden geliyor?

Tanımı ve temel ilkeleri netleştirdikten sonra, çeşitli kullanıcı ihtiyaçlarını karşılamak için çok sayıda kavramı araştırmamız gerekiyor. Şu anda, Taobao veya Tmall'da arama yaparken kullanıcılar tarafından girilen arama teriminin (sorgu) ve ürün başlığının (başlık) konsept madenciliğinde kullanılabilecek en büyük kaynak olduğuna inanıyoruz. Ve bizim çalışmamız esas olarak, yukarıdaki ilkelerimizi gürültülü sorgulama ve başlıktan karşılayan kavram cümlelerini çıkarmaktır Bu adım "Kavram Madenciliği" olarak adlandırılır.

Kavram Madenciliği temelde iki aşamaya bölünmüştür, biri Aday Üretim ve diğeri Kavram Sınıflandırmasıdır. Genel süreç aşağıdaki gibidir:

Bunların arasında, aday nesil iki kısma ayrılmıştır; biri AutoPhrase kullanılarak kelime granülerliğine göre cümleden bölümlere ayrılan cümle bilgisi, diğeri ise Sequential Pattern Extractor tarafından sık sık sıralı madencilikten sonraki şablon bilgisidir. -gram istatistiksel dil modeli, kavram adayları alın. Adayları aldıktan sonra, kavramın gereksinimleri karşılayıp karşılamadığını belirlemek için dil modeli yerleştirmeyi, kavramın sıra bilgilerini ve ayrıca kural önekleri ve son ekleri gibi özellikleri ve pv istatistiklerini entegre etmek için diskriminant bir model kullanacağız.

Aday Oluşturma

Öncelikle mevcut pozitif ve negatif kavramlardan desen çıkarıcı ile kalıpları çıkarıyoruz ve ağırlıkları hesaplıyoruz.Daha sonra bu kalıplar aracılığıyla üç pencerede istatistiksel dil modelleri ile birlikte aday budama yapıyoruz. Nihai oluşturulan adaylar temelde aynı hizada. Kelime düzeni temel sağduyuyu tatmin eder.

Konsept Sınıflandırması

Bir yandan, özellik çıkarımı için bazı basit kuralları birleştiriyoruz, diğer yandan, kavramın rasyonalitesini yargılamak için WideDeep modelini eğitmek için mevcut sıra özelliklerini kullanıyoruz. İlk veri işleme açısından, kavramlarımızın çoğu kısa metinler olduğundan ve sorgu ve başlıktaki terim dizilerinin çoğu normal kelime sırasına uymadığından, aday çıkarma ve kesme, eğitim için uzun metinlerin ayrıştırma bilgilerini de kullanıyoruz ELMo, temel dil modeli olarak kullanılır ve kelime sırası, en iyi dizi bilgisini elde etmek için gramın aynı uzunluğu içinde ve ardından diskriminant modeline ayarlanır.

Ontoloji

E-ticaret kavramının tanımını netleştirdikten ve birçok kavramı ortaya çıkardıktan sonra kafamız karışacak: Bir kelime (kelime öbeği) olarak kavramın kategorisi (alan adı), açıklaması (açıklama) ve isim dışında hiçbir özelliği yoktur. (Nitelikler), "Tupu" yu nasıl çağırırsınız? Bu kadar küçük bir bilgi miktarı aşağı akış uygulamalarında nasıl bir rol oynayabilir? Kavram grafikte bir düğüm olmak istiyor, grafiğimiz tam olarak nedir?

E-ticaret kavramını daha iyi anlamak, dış bilgi grafiğiyle hizalamak ve daha genel bilgi sunmak için, varlıkların, kavramların ve diğerlerinin özelliklerini tanımlamak için e-ticaret bilişsel grafiğinin bir dizi ontolojisi tanımladık. Aralarındaki ilişki. Varlık, nesnel dünyanın varlığının belirli bir örneğini, örneğin şarkıcı Andy Lau'nun belirli bir örneğini temsil eder. Bir kavram, nesnel dünyadaki geniş bir kavramı temsil eder, örneğin, bir eğlence yıldızı genel bir kavramdır. Varlıkların ve kavramların tanımı ve varlıkların ve kavramların belirli öznitelikleri ve öznitelik değerleri dahil olmak üzere sınıflandırma sistemi ve öznitelik ilişkisi tanımı (Şema). Örneğin, sınıflandırma sisteminde şarkıcı Andy Lau, karakter eğlence karakteri şarkıcıya aittir ve nitelikler arasında doğum tarihi, şaheser vb. Yer alır.

Burada, Schema.org ve cnSchema.org'daki nesnel şeyleri açıklama yapısına atıfta bulunuyoruz ve e-ticaret bilgi grafiğinin temelindeki ontoloji sınıflandırma sistemini, Thing'i kök düğüm olarak oluşturuyoruz. Nesnelerin alt kategorilerinde 9 ana kategori vardır: "eylem", "yaratıcı çalışma", "aktivite", "soyut", "kategori", "tıbbi varlık", "kurum", "kişi" ve "konum". sınıf. Her alt sınıfın kendi alt sınıfı vardır ve her alt sınıf, ana sınıfın tüm niteliklerini ve ilişkilerini miras alır. Spesifik yapı aşağıdaki şekilde gösterilmektedir:

Parantez içindeki içeriğin Çince adı ve kategoriye karşılık gelen İngilizce kısaltması olduğu ontoloji sınıflandırma sistemi

Burada, ortadaki beyaz düğüm, tüm sınıfların kök düğümü olan şey sınıfıdır. Şey sınıfını çevreleyen 9 düğüm, şey sınıfının doğrudan alt türleridir. Her kategorinin kendi düğümü vardır. Somut olmayan kategoriyi bir örnek olarak ele alan bu şekilde, kitle kategorisi, soyut kategorinin alt düğümüdür ve hedef kitle: hayvan kategorisi, izleyici: vücut parçası kategorisi, izleyici: kalabalık kategorisi ve hedef kitle: bitki kategorisi, kitle kategorisinin alt düğümleridir. Yapılandırılmış, yarı yapılandırılmış ve yapılandırılmamış veriler aracılığıyla bilgi edinilirken veriler bu sınıflandırma sistemine göre girilir.

Daha önce belirtildiği gibi, e-ticaret bilişsel haritasının nihai amacı, kullanıcı ihtiyaçlarını tanımlamaktır.Bu nedenle, ontolojide, e-ticaret ortamındaki nesnel dünyayı modellemek için bir dizi e-ticarete özgü sınıf tanımlıyoruz:

  • Marka (marka) Kategorisi: Kategori, müşterilerin satın alma kararında yer alan son mal sınıflandırması seviyesidir.Bu kategori marka ile ilişkilendirilebilir ve ilgili satın alma seçimi bu kategoride tamamlanabilir. Kategorideki örnekler, ontoloji oluşturma sürecinde odaklandığımız şeylerdir.
  • Kitle (kitle): Kitle, e-ticaret sahnesinde çok önemli bir kategori olan ürüne doğrudan karşılık gelen alışveriş grubu veya popülasyondur. Hedef kitle kategorisi dört alt kategori içerir: izleyici: hayvanlar, izleyici: vücut bölümleri, izleyici: kalabalık, izleyici: bitkiler.
  • Stil (stil): Bir ürün için, satın alan kalabalığın ilgisini çekecek benzersiz bir stil olmalıdır ve stil kategorisi onu esas olarak tanımlar. Stil kategorisi altı alt kategori içerir: edebi stil, müzik ve dans stili, koku stili, dokunma stili, zevk stili ve görsel stil.
  • İşlev: Ürünün yerini doğru bir şekilde belirleyebilen ve ürünü ve talebi doğrudan bağlayabilen, ürünün işlevinin belirli bir açıklaması. İşlev kategorisi dört alt kategori içerir: güzellik işlevi, giyim işlevi, sağlık işlevi ve ev işlevi.
  • Malzeme: Sözde malzeme, basitçe nesnenin dokusunun neye benzediğidir. Ürünün malzeme üzerinden tanımlanması, ürünü daha spesifik hale getirebilir.

Nitelikler, kelimelerin "takma ad", "açıklama" vb. Gibi doğal nitelikleridir; ilişkiler, ontoloji kelimeleri arasındaki nesnel bağlantılardır, örneğin Person sınıfındaki bir örneğin "doğum yeri", Place sınıfının başka bir örneğine bağlanacaktır. Ontolojinin sınıflandırma sisteminde, her kategorinin kendine özgü nitelikleri ve ilişkileri vardır ve alt kategoriler, ana kategorinin tüm niteliklerini ve ilişkilerini miras alır. Burada, aşağıdaki şekilde gösterildiği gibi, nitelikleri ve ilişkileri tanıtmak için nesneleri ve kategorileri örnek olarak alıyoruz:

Şeyler ve kategoriler arasındaki ilişki

  • Öğe kategorisi: Bu kategoride, dört nitelik ve ilişki tanımlarız: "takma ad", "açıklama", "resim" ve "ad". "Alias" aslında mevcut kelime dağarcığının eşanlamlısıdır ve bir özniteliktir; "Açıklama", mevcut şeyin özelliklerinin bir açıklamasıdır; "Resim", aslında iki şey arasında olan başka bir "resim nesnesine" bağlanabilir İlişki; "ad", mevcut şeyin standart adıdır.
  • Kategori: Kategori, şeyin doğrudan bir alt kategorisidir ve nesnenin tüm niteliklerini ve ilişkilerini doğrudan miras alır. Aynı zamanda, kategori kendi benzersiz niteliğini "kategori türü" içerir.

Ontoloji sınıflandırma sistemi altındaki tüm sınıflar ve alt sınıflar kendi benzersiz niteliklerine ve ilişkilerine sahiptir.Otolojideki her kategoriyi modellerken, 140'tan fazla nitelik ve ilişki tanımladık.

Ontoloji kelime dağarcığını oluştururken, gruptaki başlıca BU'ların yüksek kaliteli yapılandırılmış kaynaklarını tamamen seferber ettik. Kaynaklar, birden çok kaynaktan yapılandırılmış ve yarı yapılandırılmış veriler hakkında bilgi sahibi olmak için Taoxi, Youku, Feizhu, Shenma vb. Organize edin ve birleştirin. Spesifik olarak, çok kaynaklı yapılandırılmış veriler farklı kaynaklardan oluşan bir bilgi sistemi olarak kabul edilirse, edinme ve füzyon ontoloji ve örnek eşleştirmeyi (Ontology / Enity Matching) ve bilgi füzyonunu (Bilgi Füzyonu) içerir.

Birden çok kaynaktan gelen verileri gruplar halinde birleştirmek için metin özelliğine dayalı bir eşleştirme yöntemi uyguladık. Tanımladığımız bilgi füzyonunun görevi şudur: aynı kategoride, aynı anlama sahip kelimelerin, en yaygın kelimelerin birincil anahtarlar olarak kullanıldığı ve diğer eşanlamlıların takma ad olarak kullanıldığı tek bir id'de birleştirilmesi gerekir. Örneğin, "yaşlı adam" ve "yaşlı adam" eşanlamlıdır Aynı id altında, "ad" özniteliğinin içeriği "yaşlı adam" ve "takma ad" ın içeriği "yaşlı adam" dır. Eşleştirme temelinde, çatışma tespiti yoluyla, Hakikat Keşfi ve diğer teknolojiler bilgiyi tutarlı bir şekilde birleştirir ve dağıtır. Çatışmalar için işleme yöntemleri, göz ardı etme, önleme ve çözmeyi içerir.

Yaygın çözüm yöntemleri şunları içerir: Oylama, Kaliteye dayalı ve ilişkiye dayalı yöntemler. Tek değerli öznitelikleri çözmek için Kaliteye dayalı bir yöntem kullanıyoruz. Son olarak, yapılandırılmış verilerin sıralanması ve birleştirilmesi yoluyla milyonlarca varlık ve Konsept verisi elde edildi.

Doğal metin, çok sayıda zengin anlamsal ilişki içeren, varlıkları, kavramları ve bunların nesnel dünyadaki ilişkilerini tanımlayan yapılandırılmamış bir formda bulunur. Bu nedenle, metnin anlaşılması da varlıklar ve kavramlar hakkında önemli bir bilgi kaynağı haline gelmiştir. Varlıklar ve kavramlar grafiğin temel öğeleridir ve metinde tanınmaları bilgi edinimi için önemli bir teknoloji haline gelmiştir. Bunlar arasında, adlandırılmış varlık tanıma (NER), metinde bahsedilen varlıkları böler ve kategorilere ayırır ve büyük cümlelerden belirtilen varlık kategorilerini çıkarabilir. Uzaktan Denetime dayalı bir sıralama etiketleme modeli kullanıyoruz.Etiketleme türü etiketleri olayları, işlevleri, nesneleri, zamanı, alanı, kategoriyi, stili ve yukarıda belirtilen diğer kategorileri içerir.

Şimdiye kadar, e-ticaret için tasarlanmış bir ontoloji sistemi oluşturduk ve sıradan bir e-ticaret bilgi grafiği olarak da kabul edilebilecek çok sayıda varlığı, kavramı, özniteliği ve ilişkiyi genişlettik.

Bilgi grafiğinden bilişsel grafiğe

Yukarıda sunulan bilişsel harita ontoloji yapısı (Ontoloji), nispeten eksiksiz bir taksonomi ve karşılık gelen şema içerir ve çok sayıda harici, e-ticaret varlığını, kavramı ve öznitelik ilişkilerini bütünleştirir. Nispeten temel bir e-ticaret bilgi haritasıdır Amacı, çıkardığımız büyük ölçekli e-ticaret kavramlarını yapılandırmak ve bu kavramları grafiğe bağlayarak düğümler haline getirmektir, böylece "bilgi grafiği" gerçekten bir "bilişsel grafik" olur. Bu adım, Kavram Etiketleme olarak adlandırılır.

İdeal olarak, kavram bölümlere ayrıldıktan sonra, ilgili bilgi sistemini elde etmek için her bir kelime biriminin ontoloji sözlüğünün kelime dağarcığına bağlanabileceğini umuyoruz, ancak ontoloji tüm kavram kelime dağarcığını kapsamayabilir, kavramın sadece bir kısmı olabilir Bağlantılı, öznitelik ilişkisi eksik. İkinci olarak, ontolojide çok anlamlılık problemi vardır ve aynı kelime dağarcığının farklı türleri vardır, bu nedenle kelime anlamında belirsizliğin giderilmesi gereklidir. Kavramlar genellikle çok sınırlı içeriğe sahip kısa metinlerdir.Geleneksel sıralı etiketleme modelleri önemli bir performans elde edemez ve mevcut ontoloji sınıflandırma sistemi, aynı büyük kategoride ancak farklı alt kategorilerde dağıtılmış bir kelime dağarcığının bulunduğu bir ağaç yapısıdır. Örneğin, "Danimarka" kelime türleri "boşluk ülke" ve "uzay idari bölge" dir ve bu da kelime anlamındaki belirsizliği gidermede zorluklar getirir.

Amacımız, kavramı ontoloji sözlüğünün kelime dağarcığına doğru bir şekilde bağlamaktır. Girdi, kavram listesi ve ontoloji kitaplığıdır ve çıktı, karşılık gelen sözcük dağarcığı ve türdür:

Yukarıdaki zorluklar ışığında, algoritmanın genel akış şeması aşağıdaki gibidir:

Aşağıda, şekildeki modülleri özellikle açıklayacağız:

1) Sözlüğe dayalı maksimum ileri eşleştirme ve önek eşleştirme : Bir kavram verildiğinde, algoritma önce sözcüğü bölümlere ayırmak için en küçük ayrıntı düzeyini kullanır, kavramı sözcüklere böler ve ardından sözcük bölümlemesinden sonra kavramın birkaç ardışık sözcüğünü ontoloji kitaplığının sözlüğü ile soldan sağa eşleştirmek için maksimum ileri eşleştirme algoritmasını kullanır. Yukarıdaki, ontoloji sözlüğünü ve türü (ID) döndürür.

Bu süreçte, ontoloji sınıflandırma sisteminde farklı pozisyonlarda eşleşen kelimeler vardır, yani çok anlamlı kelimeler problemi Burada, sonraki belirsizlik giderme işlemi için tüm olası adayları döndürüyoruz. Söz dağarcığını kullandığımızda tüm kelimeleri kullanmadığımızı belirtmekte fayda var.Marka listeleri ve IP listeleri (ünlüler, eserler, TV filmleri vb.) Çok geniş ve birçok belirsizlik var.

Örneğin, genellikle kullandığımız yüksek frekanslı bir kelime aynı zamanda bir IP kelimesidir, ancak çoğu durumda bir IP anlamına gelmez. Bu nedenle, maksimum ileri eşleştirme sürecindeki verilerin bu bölümünü kaldırdık, ancak tanımlanamayan ön eki marka tablosundaki ad tablosu ve IP ile eşleştirmek için kapsamı daha da iyileştirebilecek bir önek eşleştirme modülü ekledik.

2) Kelime anlamında belirsizlik giderme : Geleneksel netleştirme yönteminden farklı olarak, kavram genellikle kısa metinden oluşur ve bağlamın sağlayabileceği bilgiler çok sınırlıdır. Bu nedenle, kelime türlerinin kombinasyonunu öğrenmek için bir sıra etiketleme modeli seçtik, örneğin: "nesne" + "stil" + "kategori" vb. Farklı endüstrilerdeki farklı kelime dağarcığı türleri göz önüne alındığında, örneğin "giyim" alanında "ekleme" kelimesi, "eklenmiş örme elbise" deki "ekleme" türü "stil" iken "mobilya lambaları" alanında İçinde, "eklenmiş su borusu" tipi "işlev" dir, bu nedenle alandaki ilgili bilgileri öğrenmek için dikkat mekanizmasını kullanırız. Sıralı etiketleme modeli aşağıdaki şekilde gösterilmektedir:

Sekans etiketlemesinin model çıktısını elde ettikten sonra, nihai etiketleme sonucu, kelimenin anlam adaylarına göre çıktılanır. Daha sonra, özellik olarak dizi açıklamalarını kullanmaya çalışacağız ve ardından kavramın diğer özelliklerini birleştirip aday duyu puanlarını sıralamak için sınıflandırma modelini kullanacağız.

3) İnce taneli etiketleme : Mevcut problemler tartışmasında, bir kelime dağarcığının aynı büyük kategoriye ancak farklı alt kategorilere ait olduğu bir durum olduğundan bahsetmiştik. Genellikle sekans etiketleme modelleri için sadece bir düzine etiket kategorisi vardır ve ontoloji veritabanı sınıflandırma sistemimiz şu anda onlarca hatta yüzlerce tip içerir.Geleneksel sekans etiketleme modelleri bu sorunu çözemez. Bu nedenle, belirsizliği daha da ortadan kaldırmak için daha ince bir dizi açıklama modeline ihtiyacımız var.

4) Uzun metin hatırlamayı hizalayın : Kelime eşleştirme ve kelime anlamının netleştirilmesinden sonra, mevcut ontoloji kütüphanesi kavramdaki tüm kelimeleri kapsamadığından, tanımlanmamış terimi etiketlememiz ve ontoloji kütüphanesini geri döndürmek için karşılık gelen türü tanımlamamız gerekir. Uygulanabilir bir yol, e-ticaret alanında çok sayıda uzun metin cümlesi kullanmak, sıra etiketleme için konsepti uzun metne uzaktan hizalamak ve böylece tanımlanamayan terimleri hatırlamaktır.

Bilişsel Grafikte Kenarlar

Bilgi grafiğinin ilişkisi, makinenin bilgiyi anlaması için anahtardır. İlişki türü, baş ve kuyruk düğüm türüne göre belirlenir ve düğüm, kelime dağarcığı, kavram ve varlıktan herhangi biri olabilir. Şu anda, 19 tür ilişki tanımladık ve tüm düğümler arasındaki ilişkileri temsil etmek için üçlüleri kullandık. Bu ilişkiler "is_related_to (ilgili)", "isA (bir tür)", "has_instance (bir örneği vardır)", "is_part_of (bir parçadır)" ve benzerlerini içerir. E-ticaret senaryoları için en yararlı olan iki ilişki türü şunlardır:

kavram-bir-kavram

Örnek: Bohem elbise bir elbise.

E-ticaret gereksinimleri çoğunlukla kategori gereksinimleridir ve kategori gereksinimlerinin anlamsal ifadesi için çok önemlidir. İsA ilişkisi, konseptimizi düz bir yapıdan bir grafik yapısına dönüştürür; bu, makinelerin anlambilimini anlaması için çok önemlidir. Genel olarak, isA ilişkisinin oluşturulması iki adımdan oluşur:

  • Ayıklama, büyük ölçekli bir metin derlemesinden alınan, esas olarak şablon eşleştirmesini (örüntü tabanlı) içeren bir ilişki ve vektör gösterimine dayalı bir ilişki tahmini (dağılımsal)
  • İlk adımda çıkarılan isA ilişkileri kümesinde, tekilleştirme, belirsizliği giderme ve zil sesini kaldırma gibi hiyerarşik bir yapı oluşturun ve daha ince taneli isA ilişkilerini tamamlayın.
  • E-ticaret bilişsel harita oluşturmanın özel senaryosunda, isA ilişki kurmanın temel zorlukları şunlardır:

  • E-ticaret dikey bir alandır, özellikle "sadece sizin düşünemeyeceğiniz, hiçbir Taobao'nun satın alamayacağı" bir platform olan Taobao'da. İlgili birçok kategori var ve birçok kategori terimi nispeten popüler değil ama çok önemli.
  • E-ticaret ile ilgili metin külliyatı azdır ve külliyatta kategori kelimelerinin bir arada bulunması çok seyrektir, bu da çıkarımı büyük zorlaştırır. Bu zorluklara yanıt olarak, sonraki kavram anlama ve akıl yürütme uygulamaları için güvenilir destek sağlamayı umarak, aktif öğrenme sürecinin bir dizi manuel + algoritma sürekli yinelemeli optimizasyonunu tasarlamaya başlıyoruz.
  • concept-is_related_to-item

    Mevcut e-ticaret ortamında, konsept ile ürün arasında is_related_to ilişkisini kurmak da birçok zorlukla karşılaşacaktır: konsept çok kısa, ürün başlıkları yığılmış, alakasız kelimeler, ürün özellikleri yanlış, ürün grafikleri ve metin eşleşmiyor, vb. Bu da eşleştirme hatalarına veya Belirsizlik getirin.

    Yukarıdaki sorunlara yanıt olarak, benimsediğimiz genel çözüm süreci şu şekildedir: önce kavram ve öğeyi (başlık, açıklama) anlamsal olarak eşleştirmek için metin eşleştirme / i2i / anlamsal modeli kullanın ve ardından kavrama göre kategori puanına göre kalibre edin ve ardından belirsizliği giderme sürecinden geçin. Daha sonra ürün, kavramlar arasındaki ilişkiye göre birleştirilecektir. Aşağıdaki şekil, derin anlamsal eşleştirme modelinin şematik bir diyagramıdır:

    Tam büyük resmi

    Bundan bahsetmişken, e-ticaret bilişsel haritasının büyük resmi de ortaya çıkmaya hazır:

    Yukarıdaki şekilde gösterildiği gibi, tam bir bilişsel harita aşağıdaki bölümleri içerir:

    • Konsept: Kullanıcı ihtiyaçlarını ifade eden en önemli anlamsal düğüm.
    • Ontoloji: E-ticaret için tasarlanmış bilgi grafiğinin bir sınıflandırma sistemi ve şeması.Son bilişsel grafik, dış bilgi grafik verilerini entegre edebilen ve e-ticarette doğrudan madenciliği zor olan sağduyu sunabilen konsept ile bağlantı yoluyla oluşturulur.
    • İlişki: Farklı düğümler arasındaki anlambilimini tanımlamak için bir düzineden fazla ilişki türü tanımladık; bu, anlambilimin makine anlayışının anahtarıdır.
    • Öğe: Grafiğe dayalı olarak büyük ölçekli bir kavram, kelime haznesi ve ilişki oluşturun, böylece ürünü daha doğru anlayabilirsiniz.
    • Kullanıcı: Kullanıcı ihtiyaçlarını daha doğru bir şekilde anlayabilen ve gerekçelendirebilen, grafiğe dayalı olarak büyük ölçekli konsept, kelime bilgisi ve öğe nitelikleri oluşturun.

    uygulama

    Açık uygulama

    E-ticaret Bilişsel Grafiği, Taobao arama önerisi gibi birçok ürüne uygulanmıştır. Ana ürün formatı, taşıyıcı konseptli temalı karttır. Örneğin, ana sayfada, şelaledeki "Alışveriş Ansiklopedisi" ni beğendiğinizi tahmin edin:

    Bebek ayrıntıları sayfasındaki önerilen sahneler:

    Örtük uygulama

    E-ticaret bilişsel haritası tarafından sağlanan çekirdek olarak konseptli nokta ve kenar ilişki verileri, arama ve öneri algoritmasına yeni bilgi granülerliği ve bilgi yapısı ekleyerek daha fazla hayal gücü getirecek ve çeşitliliği daha iyi karşılayabilecek. Kullanıcı ihtiyaçları.

    Aynı zamanda, bilişsel harita uygulamalarına dayalı birçok yeni konu hala devam ediyor, örneğin:

    • Açıklanabilir öneri
    • Bilgi Grafiği Gömme
    • Gerekçe önerisi

    Özet ve görünüm

    Bilişsel bir haritanın inşası çok fazla kaynak gerektirir, çok çeşitli alanları kapsar ve içerik olarak karmaşıktır. Algoritmalar, mühendislik, operasyonlar ve çok sayıda kitle kaynak kullanımı / dış kaynak kullanımı kaynakları olmadan yapamaz. Bu makale, bir algoritma mühendisinin bakış açısından bilişsel harita yapımını sadece kısaca özetlemektedir.Birçok modül hala keşfedilmekte ve optimize edilmektedir.

    Kullanıcı ihtiyaçlarını daha iyi tanımayı amaçlayan e-ticaret bilişsel grafiğinin, davranış temelli bir yaklaşımdan davranış ve anlambilimin entegrasyonuna dayalı bir bilişsel zeka çağına geçiş için önerileri aramaya yardımcı olacağına inanıyoruz, istikrarlı ve büyüyen bir platform ekosistemi olacak. İlerleme için önemli bir temel.

    Hakkımızda

    Alibaba Group'un Arama Önerileri Bölümü'nün Bilişsel Harita Ekibi, dünyanın en büyük Çin e-ticaret bilgi haritasını oluşturmayı, Taobao, Tmall Youku ve hatta denizaşırı e-ticaret dahil olmak üzere tüm Alibaba Grubunun öneri ve arama işini destekleyerek her gün yüz milyonlarca dolar hizmet vermeyi hedefliyor. kullanıcı. E-ticaret senaryosunda kullanıcı ihtiyaçlarından başlayan e-ticaret "bilişsel" grafiği, geleneksel emtia grafikleriyle sınırlı olmayıp, malları, kullanıcıları, alışveriş ihtiyaçlarını ve çeşitli açık alan bilgisi ve sağduyuyu birbirine bağlayan geniş ölçekli bir anlamsal ağdır. .

    Yazar: Ali cloud Yunqi topluluğu

    Reba'nın asistanlara nasıl davrandığına ve ardından bebeğin asistanlara nasıl davrandığına bakın.
    önceki
    Röportaj | On Dört Yıllık Çocuk Arama
    Sonraki
    Nöral makine çevirisindeki dikkat mekanizmasını gösterin
    Eti kızartırken tavaya yapışması ve kızartması kolaydır.Endişelenmeyin, bu hileleri öğrenmek sorun değil!
    Meraklı köpek çöplüğe koştu ve ağzında ne olduğunu gördü.Herkes kımıldadı!
    Bilgi grafiği nedir
    Libra R-CNN: Tam dengeli bir hedef dedektörü
    Önerilen sistem, çok yönlü FM modelinin dört modelini hatırlatır
    2018 yıllık raporundan borsa şirketlerinin ihraççılarının potansiyel risklerine bakmak
    Para piyasası faiz oranlarının çoğu yükseliyor, faiz tahvilleri kısa ve orta vadede hala ayarlama baskısıyla karşı karşıya
    2017 Yıllık Fon Bireysel Yatırımcı Yatırım Anketi Analiz Raporu (10): Emeklilik Sorunları
    Gizli Markov modeli basit ve anlaşılması kolay örneklerle nasıl açıklanır?
    Karar Ağacının Çok Faktörlü Modelde Uygulanması
    Çinli öğrenciler American Airlines School Classmate'te intihar etti: Öğretmenler sanki hapisteymiş gibi fiziksel cezayı cezalandırıyor ve kötüye kullanıyor
    To Top