Yapay zekanın hangi bölümünden sorumlusunuz? Bilgi grafiğinin oluşturulması esas olarak insanlara mı yoksa makinelere mi dayanıyor?

Kaynak: akademik manşetler

Bu makale toplam 4400 kelimedir, okumanız tavsiye edilir 10+ dakika.

"Tao Bilgi Grafiğinde: Bilgi, Zekayı Güçlendirir ve Zeka, Bilgi Üretir"

Herkes bilir ki mevcut bilgi grafiği, günümüz yapay zeka alanının büyük ilgi gören bir dalında "bilgi grafiği" denen bir kategori. Basitçe ifade etmek gerekirse, kavramları, varlıkları ve bunların nesnel dünyadaki ilişkilerini yapılandırılmış bir biçimde tanımlayan ve internetteki bilgileri insanın bilişsel dünyasına daha yakın bir biçimde ifade eden bir bilgi haritasıdır.

Bu aynı zamanda AI Time'ın temasının üçüncü sayısıdır: "Tao Bilgi Grafiği Üzerine: Bilgi Zekayı Güçlendirir ve Zekayı Bilgi Üretir", Sun Yizhou, Kaliforniya Üniversitesi, Los Angeles (UCLA) doçenti, Tang Jian, Montreal Öğrenme Algoritmaları Enstitüsü (MILA) ve Çin Bilimler Akademisi Otomasyonu Yardımcı araştırmacı Liu Kang bu tartışmaya katıldı.

Şimdi, lütfen bir senaryo düşünün. Bir tıbbi başlangıç şirketinden sorumlu kişi olduğunuzu ve bir sağlık sorusu cevap projesi başlatmak istediğinizi varsayalım. Artık zengin bir tıbbi bilgi grafiği oluşturmak için fon ve insan gücünü yoğunlaştırmayı veya verimli geliştirmek için fon ve insan gücünü yoğunlaştırmayı seçiyorsunuz. Soru-Cevap algoritması? Nasıl seçerdin?

Bilgi mühendisliğinin geçmişi ve bugünü

Bilgi grafikleri alanına girmeden önce, son 40 yılda bilgi mühendisliğinin gelişimini gözden geçirelim. Bilgi mühendisliğinin gelişim sürecini ve teknik ilerlemesini özetledikten sonra, bilgi mühendisliğini beş ikonik aşamaya ayırabiliriz: Turing test süresi, uzman sistem dönemi, Web1.0 dönemi, Web2.0 grup zeka dönemi ve Web 3.0 Aşağıdaki şekilde gösterildiği gibi bilgi grafiği dönemi:

Bilgi Mühendisliğinin Gelişim Tarihi

1950-1970 dönemi: Turing testi - bilgi mühendisliğinin doğuşunun erken aşaması

Yapay zeka, makinelerin insanlar gibi karmaşık sorunları çözmesini sağlamayı amaçlar ve Turing testi zekayı değerlendirmenin bir yoludur. Bu aşamada iki ana yöntem vardır: sembolizm ve bağlantısallık. Sembolizm, fiziksel sembol sisteminin akıllı davranış için gerekli ve yeterli bir koşul olduğuna inanırken, bağlantıcılık beynin (nöronlar ve bunların bağlantı mekanizmaları) tüm akıllı faaliyetlerin temeli olduğuna inanır.

Bu aşamadaki temsili çalışma Genel Problem Çözücüdür (GPS): problem resmileştirilir ve hedef durum, kurallar veya ifadelerle birlikte arama yoluyla sorunun ilk durumundan elde edilir. En başarılı uygulamalar arasında oyun teorisi ve makine teoremi ispatlaması bulunmaktadır.

Bu dönemdeki bilgi temsil yöntemleri temel olarak şunları içerir: matematiksel mantık, mantık tabanlı bilgi gösterimi, üretim kuralları ve anlamsal ağlar.

Bu çağda yapay zeka ve bilgi mühendisliğinin öncüleri olan Minsky, McCarthy ve Newell ve Simon dört akademisyen, 1969, 1971 ve 1971'de algılayıcılar, yapay zeka dili ve genel problem çözme ve biçimsel dil alanlarındaki olağanüstü çalışmaları nedeniyle ödüllendirildi. 1975'te Turing Ödülü.

1970-1990 Dönemi: Uzmanlık Sistemi - Bilgi Mühendisliğinin Güçlü Bir Gelişme Dönemi

1970'li yıllardan itibaren yapay zeka, makine zekası elde etmek için "bilgi tabanı + muhakeme motoru" aracılığıyla bilgiye dayalı sistemlerin kurulmasına yönelmeye başlamış, bu dönem MYCIN tıbbi teşhis uzman sistemi, moleküler yapının tanınması gibi birçok başarılı sınırlı alan uzman sistemi ortaya çıkmıştır. DENRAL uzman sistemi ve bilgisayar arıza teşhisi XCON uzman sistemi vb.

Stanford Yapay Zeka Laboratuvarı'nın kurucusu Profesör Feigenbaum, 1980'de bir proje raporunda "Bilgi Mühendisliği: Yapay Zekanın Uygulamalı Tarafı" adlı proje raporunda bilgi mühendisliği kavramını ortaya koydu ve o zamandan beri yapay zeka alanındaki bilgi mühendisliğinin temel konumunu oluşturdu.

Bu dönemde, bilgi temsili yöntemi, çerçeveler ve komut dosyaları dahil olmak üzere yeni bir evrim geçirdi. Uzman alan bilgisinin bilgisayarlar tarafından işlenebilen bilgiye dönüştürülmesine yardımcı olabilecek birçok uzman sistem geliştirme platformu 1980'lerin sonunda ortaya çıktı.

1990-2000 dönemi: Web1.0 World Wide Web

1990'dan 2000'e kadar, yaygın olarak kullanılan İngilizce WordNet, birinci dereceden yüklem mantık bilgisiyle temsil edilen Cyc sağduyu bilgi tabanı ve Çin HowNet dahil olmak üzere, yapay olarak oluşturulmuş birçok büyük ölçekli bilgi tabanı olmuştur.

Web 1.0 World Wide Web'in ortaya çıkışı, insanlara metnin içeriğini tanımlamak için HTML kullanan açık bir platform sağlar ve kamuoyunun bilgi paylaşabilmesi için metni köprüler aracılığıyla birbirine bağlar.

W3C tarafından önerilen genişletilebilir biçimlendirme dili XML'si, etiketleri tanımlayarak, geniş ölçekli bilgi temsili ve İnternet ortamında paylaşım için bir temel oluşturarak İnternet belge içeriğinin yapısını işaretleyebilir. Bu dönemde ontolojinin bilgi temsili yöntemi de bilgi temsili araştırmasında önerilmiştir.

2000-2006 dönemi: Web2.0 sürü zekası

2001 yılında World Wide Web'in mucidi ve 2016 Turing Ödülü'nü kazanan Tim Berners-Lee, İnternet içeriğinin anlamsal temsilini yapılandırmayı amaçlayan Scientific American dergisinde yayınlanan "The Semantic Web" makalesinde Semantik Web kavramını resmen ortaya koydu. , İnternet içeriğinin anlamsal yapısını tanımlamak için ontolojiyi kullanın ve web sayfasını anlamsal olarak işaretleyerek web sayfasının anlamsal bilgilerini elde edin, böylece web sayfası içeriğinin anlamsal bilgilerini elde edin, böylece insanlar ve makineler birlikte daha iyi çalışabilir. W3C ayrıca World Wide Web RDF (Kaynak Tanımlama Çerçevesi) ve OWL (World Wide Web Ontology Gösterim Dili) ve World Wide Web içeriğinin anlambilimini tanımlayan diğer bilgi tanımlama spesifikasyonlarında semantik işaretleme dilini önermiştir.

World Wide Web'in ortaya çıkışı, bilginin kapalı bilgiden açık bilgiye ve merkezi bilgiden dağıtılmış grup akıllı bilgisine değişmesini sağlar. Orijinal uzman sistem, sistem içinde tanımlanan bilgidir ve artık bilgi kaynakları arasındaki ara bağlantıyı gerçekleştirebilir ve tamamen sabit bir kişi tarafından üretilmek yerine ilişkilendirme yoluyla daha fazla bilgi üretebilir. Bu süreçte ortaya çıkan sürü zekası, en tipik temsilcisi Wikipedia'dır. Aslında kullanıcılar, internet kullanıcılarının bilgiye olan katkısını yansıtan bilgiyi inşa eder ve günümüzün geniş ölçekli yapılandırılmış bilgi grafiği için önemli bir temel haline gelmiştir.

2006'dan günümüze: Web 3.0 bilgi grafiği dönemi

Bu dönemin amacı, World Wide Web'in içeriğini, akıllı uygulamalara güç verebilecek makine tarafından anlaşılabilir ve hesaplama bilgisine dönüştürmek. 2006'dan bu yana, büyük ölçekli Wikipedia benzeri zengin yapılandırılmış bilgi kaynaklarının ortaya çıkışı ve ağ ölçekli bilgi çıkarma yöntemlerinin ilerlemesi, büyük ölçekli bilgi edinme yöntemlerinde büyük ilerleme kaydetmiştir. Cyc, WordNet ve HowNet gibi elle geliştirilen bilgi tabanı ve ontolojiye öncülük eden projelerin aksine, bu dönemde bilgi edinimi otomatikleştirildi ve bir ağ ölçeğinde işletildi.

Mevcut bilgi grafiği tarafından otomatik olarak oluşturulan bilgi tabanı, anlamsal arama, büyük veri analizi, akıllı öneri ve veri entegrasyonu için güçlü bir varlık haline geldi ve büyük endüstrilerde ve alanlarda yaygın olarak kullanılıyor. Tipik örnekler, Google'ın Freebase'i, Facebook'un grafik aramayı, Microsoft Satori'yi ve işletme, finans ve yaşam bilimlerindeki belirli bilgi tabanlarını satın almasının ardından 2012'de başlatılan Bilgi Grafiğidir. En temsili büyük ölçekli ağ bilgisi edinme çalışması DBpedia, Freebase, KnowItAll, WikiTaxonomy ve YAGO'nun yanı sıra BabelNet, ConceptNet, DeepDive, NELL, Probase, Wikidata, XLORE, Zhishi.me, CNDBpedia vb. İçerir. Bu bilgi grafikleri, on milyonlarca veya milyarlarca varlık ve milyarlarca veya milyarlarca gerçek (yani öznitelik değerleri ve diğer varlıklar ile ilişkiler) dahil olmak üzere grafik RDF veri modelini izler ve bu varlıklar, binlerce Anlambilim tarafından somutlaştırılan nesnel dünyanın binlerce kavramsal yapısı.

Çin'deki bilgi mühendisliği alanında, Çin Bilimler Akademisi Sistemler Enstitüsü'nden akademisyen Lu Ruqian, Hesaplama Teknolojisi Enstitüsü'nden araştırmacı Shi Zhongzhi ve diğer eski nesil bilgi mühendisliği akademisyenleri, Çin'deki bilgi mühendisliği araştırmalarına ve yetenek eğitimine olağanüstü katkılarda bulundu. Akademisyen Lu Ruqian, bilgi mühendisliği ve bilgi temelli konulara olağanüstü katkılarda bulundu. Yazılım mühendisliğindeki sistematik ve yaratıcı çalışmaları ve bilgi alanındaki öncü katkılarından dolayı, ilk "Wu Wenjun Yapay Zeka En Yüksek Başarı Ödülü" nü kazandı.

14 Şubat 2011'de IBM'in "Waltson" süper bilgisayarı Amerika Birleşik Devletleri'ndeki en popüler bilgi yarışması programı olan "Jeopardy" (Jeopardy) 'de göründü ve iki şampiyonluk Ken Jennings ve Brad- Rutel, tarihteki ilk insan-bilgisayar zekası bilgi yarışması düellosunu gerçekleştirdi ve 1 milyon ABD dolarına kadar ödül kazandı.

"Waltson" 10 IBM sunucusundan oluşur. Bu sunucular Linux işletim sistemini kullanırlar. İnternete bağlı olmamalarına rağmen Watson çok sayıda kitap, haber ve film senaryosu materyalleri, Cihai, antolojiler ve "Dünya Kitap Ansiklopedisi" ve diğer milyonlarca materyali saklar. Sorunun uyarılarını ne zaman okursanız , "Waltson" kendi veritabanını üç saniyeden daha kısa bir sürede "3 fit" kazdı ve 200 milyon sayfalık uzun bilgiyi araştırdı.

Peki bu geniş verilerden nasıl yanıt alabilir? Gerçek süreç elbette çok karmaşıktır.Kullanışlı verileri, yani dağınık orijinal verilerden bilgiyi çıkarmak ve ardından anlamını yani bilgiyi anlamak gerekir ve son olarak bu bilgi, bizim kullanımımız için istihbarat üretmek için kullanılabilir.

Bilgi grafiği çoğunlukla manuel olarak mı yoksa otomatik olarak makineler tarafından mı oluşturulmuştur?

Böyle komik bir sohbet bir zamanlar internette popülerdi.

A: "Ne yaparsınız?"

B: "Yapay zeka yapmak."

C: "Yapay zekanın hangi kısmından sorumlusunuz?"

B: "Manuel kısımdan ben sorumluyum."

Bu bir şaka olsa da aslında bir bilgi grafiği oluşturma sürecinde çok fazla yapay zeka vazgeçilmezdir. Bazı dikey alanlarda bilgi grafiklerinin oluşturulması birçok uzmanın katılımını gerektirmektedir. Hem akademi hem de endüstri, varlıklar arasındaki ilişkiyi otomatik olarak çıkarmaya ve varlıkları keşfetmeye çalışsa da, doğruluğunun sınırlamaları, tıbbi alan gibi çok iyi olmayan bazı hatalara toleransı düşük alanlara yol açmaktadır. Uygulamalar.

Üç öğretmen genellikle yarı otomatik ve el kitabının kombinasyonunun bir bilgi grafiği oluşturmanın ideal yolu olduğunu düşünüyor. Öğretmen Liu, bilgi temsili araçlarının ifade etmek istediğimiz bilgi için hala sınırlamaları olduğunu, ayrıca belirli bir alanda bir bilgi grafiği oluşturmanın çok zor olduğunu ve verilerin ihtiyaçlara göre sürekli güncellenmesi gerektiğini söyledi. Genel olarak, bir bilgi grafiği oluşturmak ve sürdürmek zaman alıcı ve zahmetli bir iştir.Manuel katılım doğruluğu artırır ve yapay zekayı tamamen terk etmek imkansızdır. Sun Öğretmen herkese, öğretmeni Profesör Han Jiawei'nin son çalışmasının bilgi grafiği yapısının otomasyonuna odaklandığını söyledi.

Bilgi grafiklerini entegre etmek gerekli midir?

Bilgi grafiği herhangi bir kuruluş veya birey tarafından serbestçe oluşturulabilir, arkasındaki veri kaynakları çok geniştir ve kalite eşit değildir, bu da aralarında çeşitliliğe ve heterojenliğe yol açar. Anlamsal entegrasyon, farklı bilgi grafiklerini birleşik, tutarlı ve özlü bir forma entegre etmek ve farklı bilgi grafikleri kullanan uygulamalar arasındaki etkileşim için işlerliği sağlamak için önerilmiştir.

Ortak anlamsal entegrasyon süreci

Yaygın olarak kullanılan teknikler arasında ontoloji eşleştirme (ontoloji haritalama olarak da bilinir), örnek kuvvet eşleştirme (varlık hizalama, nesne ortak parmak çözünürlüğü olarak da bilinir) ve bilgi füzyonu bulunur.

Bu bağlamda, Her üç öğretmen de bilgi grafiklerinin birleştirilmesinin gerekli olduğuna inanıyor . Bazı soruların birden çok alanın haritalarını birleştirerek yanıtlanması gerektiğinden, farklı bilgi haritaları farklı bilgileri kapsar ve füzyon daha kapsamlı bir bilgi haritası oluşturabilir. Öğretmen Sun, farklı diller arasında bilgi grafiklerinin kaynaşmasının en anlamlı olduğunu vurguladı Doğal olarak, grafikler için gereklilikler olabildiğince kapsamlı.Eğer dikey füzyon mümkün olduğu kadar çok bilgi elde ederse, muhakeme için daha yararlı olacaktır. Öğretmen Liu, füzyon sırasında iki problemle karşılaşıldığını söyledi: Birincisi, farklı haritalar arasındaki anahtar kelimeler ve karakterler arasındaki fark, diğeri ise farklı haritalar arasındaki örneklerin ilişkilendirilip ilişkilendirilemeyeceği.

Yapay zeka tarihinin en tartışmalı projelerinden biri olan Cyc

Bir zamanlar Amerika Birleşik Devletleri'nde gelişen Cyc projesi, tipik yapay zeka teknolojisini ve Web1.0 World Wide Web döneminin düşüncesini temsil ediyor. Daha da şaşırtıcı olan, 1984 yılında başlayan ve bugüne kadar devam eden ve her zaman yapım aşamasında olan bu proje. Yapay zeka tarihinin en tartışmalı projelerinden biri olduğu için eleştirilmesi kaçınılmazdır.Ana özet şu şekildedir:

  • Sistem karmaşıklığı: Sistem, ansiklopedik bir bilgi tabanı oluşturma hırsına sahiptir, ancak belirli bir bilgi mühendisi tüm bilgileri sisteme manuel olarak ekler
  • Bilgi, özellikle sabitler biçiminde çok çeşitli şeyleştirmenin neden olduğu ölçeklenebilirlik sorununu temsil eder.
  • Madde kavramının yorumunu tatmin etmek zordur ve iç ve dış özellikler arasındaki ayrım net değildir.

Öğretmen Liu açıkça bunun başarısız bir proje olduğunu söyledi ve Öğretmen Sun ayrıca insanların hızının, mümkün olmayan bilgi artış hızına ayak uyduramadığını söyledi.

"Ara, ara, bir göz at" a ek olarak, bilgi grafiğinin daha derinlemesine uygulama senaryoları nelerdir?

Bilgi uygulaması, bilgi grafiğinin benzersiz uygulama biçimini alan verileri ve iş senaryoları ile birleştirebilir ve alan adı iş dönüşümüne yardımcı olabilir. Bilgi grafiklerinin tipik uygulamaları arasında akıllı öneri, anlamsal arama, akıllı soru yanıtlama ve görsel karar desteği bulunur. Bilgi grafiği uygulamalarının iş ihtiyaçlarına göre nasıl tasarlanıp uygulanacağı ve bunların veri özelliklerine göre nasıl optimize edileceği ve ayarlanacağı, bilgi grafiği uygulamalarının temel araştırma içeriğidir.

Öğretmen Liu, kamuoyunun gördüğü ara, ara ve bir bak ın yanı sıra, bilgi grafiğinin arkasında rol oynadığı finans sektöründeki risk değerlendirmesi, bankacılık sektöründe kredi incelemesi ve e-ticaret sektöründe tavsiye gibi birçok senaryo olduğunu söyledi. Sahneler ve eğitim alanında uygulama; Öğretmen Tang, tıp alanının yanı sıra bilgi grafiği uygulamalarının da olduğu birçok sahne olduğunu söyledi.

Bilgi grafiği bu senaryolara daha akıllıca nasıl uygulanmalıdır?

Birçok kişi artık bilgi grafiklerinin akıllı soru yanıtlama, makine çevirisi ve öneri gibi senaryolara uygulanmasını inceliyor. Bununla birlikte, birçok senaryoda, bilgi grafikleri kullanmanın etkisi çok fazla iyileşmeyecek ve hatta azalabilir. Bunda iki zorluk olabilir: Birincisi, bilgi grafiğinin eksikliğinin etkisinin sınırlı kalmasına neden olması Diğeri ise bilgi grafiği her bir özel göreve bağlandığında, çok sayıda hata ortaya çıkabilmesidir.

Öğretmen Liu, olay yerinde bilgi haritasının uygulanmasının etkisinin azalmasının nedeninin iki noktadan kaynaklandığını söyledi: Birincisi, bilgi haritasının kapsamının çok düşük olması, ikincisi ise mevcut bilgi ve ifadenin eşleştirilememesi. Kullanıcı ihtiyaçlarını ve grafiğin uygulama senaryolarını önceden tahmin edebiliyorsanız, veriler rafine edildikten sonra sahneye daha iyi uygulanabilir.

Öndeki yol

Gelecekteki akıllı makinenin bir beyni varsa, bilgi haritası bu beyindeki bilgi tabanıdır ve büyük veri zekası için büyük öneme sahiptir ve doğal dil işleme, bilgi erişim ve yapay zeka alanlarında derin bir etkisi olacaktır.

Şimdi, ticari arama motoru şirketleri tarafından yönetilen İnternet devleri, bilgi grafiklerinin stratejik önemini fark ettiler ve bilgi grafiklerinin dağıtımına büyük yatırım yaptılar ve arama motorlarının biçimi üzerinde giderek daha önemli bir etkiye sahip oldular. Aynı zamanda, bilgi grafiğinin hala geliştirmenin erken aşamasında olduğunu ve çoğu ticari bilgi grafiğinin uygulama senaryolarının çok sınırlı olduğunu da kuvvetle hissediyoruz. Gelecekte bilgi grafiklerinin büyük veri zekasının sınır araştırma sorunu olacağı ve akademik ve endüstriyel çevreler tarafından acilen çözülmesi gereken birçok önemli açık konu olduğu görülebilmektedir.

Editör: Huang Jiyan redaksiyonu: Lin Yilin
- Bitiş -

Tsinghua-Qingdao Veri Bilimi Enstitüsü'nün resmi WeChat kamu platformunu takip edin " THU Veri Pastası "Ve kız kardeş numarası" Veri Pastası THU "Daha fazla ders avantajı ve kaliteli içerik elde edin.

Tarayıcıda makine öğrenimi modelleri oluşturmak için TensorFlow.js ve Python kullanın
önceki
Roger Data: Yaşam döngüsü dinamik simülasyon teknolojisi ve vergilendirmedeki uygulaması üzerine bir ön çalışma
Sonraki
360 cep telefonu işi askıya alındı; 37 şehrin ortalama aylık maaşı 8,452 yuan ...
Dünya Çölleşme ve Kuraklıkla Mücadele Günü: Sarı topraklar yeşil canlılıkla yeniden ortaya çıksın
NLP'ye yeni başlayanlar için paylaşılacak 8 ücretsiz kaynak
AI istihdam sıralaması: makine öğrenimi işleri listeye hakim ve AI işlerine olan talep yavaşlıyor (liste ektedir)
Riskleri önleyin, gizli tehlikeleri ortadan kaldırın, kazaları azaltın ve inşaat sektöründe güvenli üretim için sağlam bir temel atın
QS en son dünya üniversite sıralaması yayınlandı, Tsinghua ve Peking Üniversitesi tarihteki en yüksek sıralamayı kazandı
Derin sinir ağına dayalı rüzgar çiftliği ultra kısa vadeli güç tahmin sistemi
Çin'in Weihai Sahil Şeridi'nin 2019 Ulusal Trekking Konferansı başarıyla gerçekleştirildi
XGBoost'a Giriş: Yaşam beklentisini tahmin etmek için denetimli öğrenmeyi kullanma
Yi County, Anhui: Lotus Göleti ve Cuiying
Steam High oyun girişi makine öğrenimi övgü! Kod yok, herkes oynayabilir, Çince versiyonu piyasaya sürüldü
Qingdao, Shandong: Binlerce mu kırmızı kayısıdan iyi bir hasat
To Top