Bilgi grafiği nedir

Bilgi Grafiğinin Tanımı

Bilgi grafiği Çin'de nispeten yeni bir kavramdır. Şu anda Çin'de nispeten az sayıda makale bulunmaktadır. Uygulama tarafı esas olarak BAT gibi büyük miktarda veri tutan işletmelerde yoğunlaşmıştır. Bu kavram 2012'de Google tarafından önerilmiştir. O zamanlar esas olarak geleneksel Anahtar kelime tabanlı arama modeli, anlambilim tabanlı aramaya yükseltilir. Bilgi grafiği, karmaşık ilgili bilgileri daha iyi sorgulamak, anlamsal düzeyde kullanıcı niyetlerini anlamak ve arama kalitesini iyileştirmek için kullanılabilir.

Kişisel olarak, bilgi grafiklerinin en büyük avantajının, çok güçlü tanımlayıcı yeteneklere sahip olmaları olduğuna inanıyorum. Çeşitli makine öğrenimi algoritmalarının iyi tahmin etme yetenekleri olmasına rağmen, çok zayıf tanımlama yetenekleri var.Bilgi grafikleri sadece bu boşluğu dolduruyor.

Bilgi grafiklerinin birçok tanımı vardır. Burada kendi anlayışımdan bazılarını sunuyorum:

1. Bilgi grafiğinin temel amacı, gerçek dünyada var olan çeşitli varlıkları ve kavramları ve bunlar arasındaki güçlü ilişkiyi tanımlamaktır. İlişkiyi, Yao Ming ve Rockets arasındaki ilişki gibi iki varlık arasındaki ilişkiyi tanımlamak için kullanırız. İlişkiler, öznitelikleri, iç özelliklerini tanımlamak için "öznitelik-değer çiftleri" kullanırız. Örneğin, karakterimizin yaş, boy ve kilo öznitelikleri vardır.

2. Bilgi grafiği yapay olarak yapılandırılabilir ve çeşitli kavramlar arasındaki zayıf ilişkiyi tanımlamak için tanımlanabilir, örneğin: "unutulmuş sipariş numarası" ve "sipariş numarası geri alma" arasındaki ilişki

Bilgi tabanı kavramı

Bilgi tabanı türleri

Bilgi tabanları şu anda iki türe ayrılabilir: Küratörlü KB'ler ve Çıkarılan KB'ler

Seçilmiş KB'ler : Yago2 ve freebase tarafından temsil edilen, yapılandırılmış bir Wikipedia olarak anlaşılabilecek Wikipedia ve WordNet gibi bilgi tabanlarından çok sayıda varlık ve varlık ilişkisini çıkardılar.

Çıkarılan KB'ler: Temelde Açık Bilgi Çıkarma (Açık IE), Bitmeyen Dil Öğrenimi (NELL) ile temsil edilirler, yüz milyonlarca web sayfasından doğrudan varlık ilişkisi üçlülerini çıkarırlar. Freebase ile karşılaştırıldığında, bu şekilde elde edilen varlık bilgisi daha çeşitlidir ve varlık ilişkileri ve varlıkları, "Yao Ming Şangay'da doğdu" gibi daha doğal dil biçimindedir. ("Yao Ming", "Şangay" da doğdu). Doğrudan web sayfasından çıkarılan bilginin de belirli bir gürültüsü olacaktır ve doğruluğu, Küratörlü KB'lerden daha düşüktür.

Şu anda sektörde en çok kullanılan Seçilmiş KB'ler Temel olarak, Küratörlü KB'ler nispeten basit, yapımı kolay ve daha az gürültülü olduğu için.

Bilgi tabanı nedir

a) "Yao Ming, Şangay'da doğdu"

b) "Yao Ming bir basketbol oyuncusu"

c) "Yao Ming, Çin Basketbol Birliği'nin şu anki başkanıdır"

Yukarıdakiler bir bilgi parçasıdır ve büyük miktarda bilgi bir bilgi tabanı (Bilgi Tabanı) olmak için bir araya getirilmiştir. Wikipedia ve Baidu Baike gibi ansiklopedilerden pek çok bilgi edinebiliriz. Ancak bu ansiklopedilerin bilgisi, yapılandırılmamış doğal dilden oluşmaktadır.Böyle bir organizasyon, insanların okuması için çok uygundur ancak bilgisayarda işlemeye uygun değildir.

Şekil 1: Bilgi grafiği örnekleri

Bilgi tabanının temsili

Bilgisayarı işlemeyi ve anlamayı kolaylaştırmak için, bilgiyi, yani üçlüleri ifade etmenin daha resmi ve öz bir yoluna ihtiyacımız var.

"Yao Ming, Çin, Şangay'da doğdu" bir üçlü olarak ifade edilebilir (Yao Ming, PlaceOfBirth, Shanghai). Burada üçlüyü basitçe anlayabiliriz (varlık varlığı, varlık ilişkisi ilişkisi, varlık varlığı). Varlıkları düğümler ve varlık ilişkilerini (öznitelikler, kategoriler vb. Dahil) bir kenar olarak kabul edersek, çok sayıda üçlü içeren bir bilgi tabanı büyük bir bilgi grafiği haline gelir.

Bazen varlık, Justin Bieber gibi konu olarak adlandırılır. Varlık ilişkileri de iki türe ayrılabilir: biri mülkiyet, diğeri ilişki. Aşağıdaki şekilde gösterildiği gibi, öznitelikler ve ilişkiler arasındaki en büyük fark, özniteliğin üçlüsüne karşılık gelen iki öğenin genellikle bir konu ve bir dize olmasıdır, örneğin Tür / Cinsiyet, karşılık gelen üçlü (Justin Bieber, Type , Kişi) ve ilişkinin üçlülerine karşılık gelen iki varlık genellikle iki konudur. PlaceOfBrith ilişkisi gibi, karşılık gelen üçlü (Justin Bieber, PlaceOfBrith, Londra).

Şekil 2: Justin Bieber bilgi grafiği

(Şekildeki mavi kare konuyu temsil eder, turuncu elips bilgi tabanının varlıklarına ait öznitelik değerlerini içerir; mavi düz çizgi ilişkiyi temsil eder ve turuncu düz çizgi özniteliği temsil eder. Bunlar topluca bilgi tabanının varlık ilişkisi olarak adlandırılır. Her ikisi de üçlü kullanabilir. Varlıkları ve varlık ilişkilerini karakterize edin)

Bilgi tabanının veri yapısı

İşte veri yapısına kısa bir giriş: Bilgi ifadesi "Bilgi Grafiği Temelleri (2) - Bilgi İfade Sistemi Bilgi Grafiği" bölümünde ayrıntılı olarak açıklanacaktır.

Okuyucuların yalnızca ücretsiz temelin temel bilgi ifade biçimini hatırlamaları gerekir: (varlık) - (varlık), (varlık) - (değer) Yao Ming ve Ye Li arasındaki ilişki olan Şekil 3'e bakın.

Şekil 3 Bilgi ifadesi

Bilgi Grafiğinin Uygulanması

Bilgi grafiği aracılığıyla, İnternet'in bilgileri yalnızca insanın bilişsel dünyasına daha yakın bir biçimde ifade edilmekle kalmaz, aynı zamanda büyük bilgileri organize etmek, yönetmek ve kullanmak için daha iyi bir yol sağlar. Aşağıdaki şekil, yazar tarafından derlenen bilgi grafiği ile ilgili uygulamadır ve yazar ilerleyen makalelerde aşağıdaki uygulamaları analiz edecektir.

Şekil 4 Bilgi Grafiği Uygulaması

Şekil 4'ten, bilgi grafiklerinin uygulanması esas olarak arama ve tavsiye alanında yoğunlaşmıştır Robotlar (müşteri hizmetleri robotları, kişisel asistanlar), esasen arama ve tavsiyenin bir uzantısı olan soru cevaplama sistemleridir. Bunun nedeni, arama problemini çözmek için bilgi grafiği teknolojisinin (özellikle freebase) doğmuş olması olabilir. Bu bilgi depolama parçası, Qicha ve Qixinbao gibi işletmelerin grafik yapılı verilerin temizlenmesi ve işlenmesinin daha iyi olduğunu bulmuş olabilir.

Anlamsal arama açısından, bilgi grafiğinin aranması geleneksel aramadan farklıdır.Geleneksel arama, anahtar kelimeye dayalı olarak karşılık gelen web sayfası koleksiyonunu bulmak ve ardından sayfa sıralaması gibi algoritmalar aracılığıyla web sayfası koleksiyonundaki web sayfalarını sıralamak ve daha sonra kullanıcılara göstermektir; Bilgi grafiğinin aranması, mevcut grafik bilgi tabanındaki bilgiyi taramak ve ardından sorgulanan bilgiyi kullanıcıya geri vermektir.Genellikle, yol doğruysa, yalnızca bir veya birkaç bilgi sorgulanır ki bu oldukça doğrudur.

Soru cevap sisteminde, sistem ayrıca bilgi grafiği yardımıyla kullanıcıların doğal dilde sorduğu sorular üzerinde önce anlamsal analiz ve gramer analizi yapacak, ardından bunları yapılandırılmış sorgu cümlelerine çevirecek ve ardından bilgi grafiğindeki cevapları sorgulayacak.

Yazar: Benimle dalga geçme

Bağlantı: https://www.jianshu.com/p/cd937f20bf55

Meraklı köpek çöplüğe koştu ve ağzında ne olduğunu gördü.Herkes kımıldadı!
önceki
Libra R-CNN: Tam dengeli bir hedef dedektörü
Sonraki
Önerilen sistem, çok yönlü FM modelinin dört modelini hatırlatır
2018 yıllık raporundan borsa şirketlerinin ihraççılarının potansiyel risklerine bakmak
Para piyasası faiz oranlarının çoğu yükseliyor, faiz tahvilleri kısa ve orta vadede hala ayarlama baskısıyla karşı karşıya
2017 Yıllık Fon Bireysel Yatırımcı Yatırım Anketi Analiz Raporu (10): Emeklilik Sorunları
Gizli Markov modeli basit ve anlaşılması kolay örneklerle nasıl açıklanır?
Karar Ağacının Çok Faktörlü Modelde Uygulanması
Çinli öğrenciler American Airlines School Classmate'te intihar etti: Öğretmenler sanki hapisteymiş gibi fiziksel cezayı cezalandırıyor ve kötüye kullanıyor
36 ÖzelNetEase Koala'nın "küresel fabrika mağazası" çevrimdışı oluyor ve onu açmak için ülkeye katılmaya bağlı
A-hisseleri genellikle düşer, gizli tehlikeler kalır
HBase en iyi uygulama-yazma performansı optimizasyon stratejisi
Çin, 2020'de uzay istasyonu görev aşamasının ilk uçuşunu bekliyor
Guangdong'daki 22 İnternet hastanesinin ilk partisi piyasaya sürüldü!
To Top