Machine Intelligence Accelerator: Büyük Veri Ortamında Bilgi Mühendisliğinin Fırsatları ve Zorlukları

Giriş: Bilgi grafiği, yapay zekanın gelişimini teşvik eden temel itici güçlerden biri haline geldi. Bu makale, Tsinghua Üniversitesi Bilgisayar Bilimi ve Teknolojisi Bölümü profesörü ve Tsinghua-Qingdao Veri Bilimi Enstitüsü Bilim ve Teknoloji Büyük Veri Araştırma Merkezi direktörü tarafından seçilmiştir. Li Juanzi 20 Aralık 2017'de öğretmen, Ali ve Çin Bilgi Toplumu Dil ve Bilgi Hesaplama Komitesi tarafından düzenlenen Bilgi Grafiği Seminerinde aşağıdakileri yaptı. "Bilgi Mühendisliği: Makine Zekasının Hızlandırıcısı" Başlıklı rapor. Raporda Öğretmen Li Juanzi Bilgi grafiği ile yakından ilgili olan büyük veri ortamında bilgi mühendisliğinde bilgi temsili, bilgi edinimi, bilgi muhakeme hesaplaması ve bilgi hizmetindeki araştırma zorluklarını özetler ve ilgili araştırma çalışmalarını bilgi grafiğinde sunar.

Sahne arkası cevap anahtar kelimeleri "Bilgi Mühendisliği" , PPT'nin tam sürümünü indirin.

Li Juanzi, Bilgisayar Bilimi ve Teknolojisi Bölümü Profesörü, Tsinghua Üniversitesi, doktora danışmanı. Tsinghua-Qingdao Veri Bilimi Enstitüsü Bilim ve Teknoloji Büyük Veri Araştırma Merkezi Direktörü, Çin Çin Bilgi Toplumu Dil ve Bilgi Hesaplama Komitesi Direktörü ve Çin Bilgisayar Topluluğu Terminoloji Komitesi Yönetici Üyesi. Araştırma ilgi alanları semantik web, haber madenciliği ve diller arası bilgi grafiği yapımıdır. Önemli uluslararası konferanslarda (WWW, IJCAI, SIGIR, SIGKDD) ve akademik dergilerde (TKDE, TKDD) pek çok makale yayınlanmıştır. Çin Ulusal Doğa Bilimleri Vakfı'nın önemli projeleri, yedinci AB işbirliği çerçevesi ve Xinhua Haber Ajansı projeleri de dahil olmak üzere bir dizi ulusal, bakanlık ve uluslararası işbirliği projesine başkanlık etti. 2013 yılında Yapay Zeka Derneği Bilim ve Teknoloji İlerleme Ödülü birincilik ödülünü ve 2013 yılında Elektronik Derneği Doğa Bilimleri Ödülü ikincilik ödülünü kazandı.

Aşağıdaki konuşma kaydıdır:

Bugünkü konuşmamın konusu "Bilgi Mühendisliği: Makine Zekasının Hızlandırıcısı". Ardından, son 40 yıldaki bilgi mühendisliğinin araştırma ve uygulama geliştirmesini, veri, bilgi, bilgi, zeka ve diğer ilgili kavramlar ve büyük veri çağındaki bilgiler de dahil olmak üzere bunların ilişkileri ile birlikte gözden geçireceğim. Mühendislik zorlukları ve ilgili işlerimizden bazıları.

1. Kırk yıllık bilgi mühendisliği: makineleri daha akıllı yapmak

Ölçek, çeşitlilik, sürat ve özgünlük özelliklerine sahip büyük veri çağını başlattık. Büyük veri, yaşama, çalışma ve düşünme şeklimizi değiştiriyor.

Bu bağlamda, büyük veriden akıllı hizmetlere olan talep, basitçe bilgi toplamaktan ve elde etmekten, bilgi mühendisliği için birçok zorlu sorunu ortaya çıkaran otomatikleştirilmiş bilgi içeren hizmetler sağlamaya doğru değişmiştir. Büyük veriye anlam / bilgi eklemek, verinin akıllı veri oluşturmasını sağlamak, veriden bilgiye, sonra bilgiye ve son olarak akıllı uygulamalara dönüşüm sürecini tamamlamak için bilgi mühendisliğini kullanmalıyız, böylece büyük veriye ilişkin içgörüler elde etmek ve kullanıcılara özen göstermek. Soruları yanıtlama, karar verme için destek sağlama ve kullanıcı deneyimini iyileştirme hedefi.

Bu yıl, bilgi mühendisliğinin önerilmesinden bu yana geçen 40 yıla denk geliyor. 40 yıllık bilgi mühendisliği geliştirme geçmişini, bilgi mühendisliğinin evrim sürecini, teknolojik ilerlemeyi ve makine zekasına katkıları özetleyerek sıraladık.

1950-1970'ler Turing Testi:

Yapay zeka, makinelerin insanlar gibi karmaşık sorunları çözmesini sağlamayı amaçlar ve zekanın değerlendirilmesi Turing testidir. Bu aşamada iki yapay zeka yöntemi ortaya çıktı: sembolizm ve bağlantısallık. Genel Problem Çözücü (GPS) o zaman temsili yöntem haline geldi: problem resmi olarak ifade edildi ve hedef durum problemin başlangıç durumundan elde edildi ve arama yoluyla tanımlanan kurallar veya ifadelerle birleştirildi. Tipik uygulamalar oyun teorisi ve makine teoreminin ispatlanmasıdır. Bu dönemdeki bilgi ifadesi temel olarak mantıksal bilgi ifadesi, üretim kuralları, anlamsal ağ vb.

1970-1990'ların Uzman sistemi:

Sadece genel problem çözme, zekanın gerçekleştirilmesini desteklemek için yeterli değildir. Feigenbaum, bilginin, zekanın makineler tarafından gerçekleştirilmesinin özü olduğuna inanır. 1970'lerin ortasında ve sonunda, uzman sistemler tarafından temsil edilen bilgi mühendisliği kavramı, bilgi tabanı + akıl yürütme yoluyla daha akıllı bir sistemi gerçekleştirmek için resmi olarak ortaya atıldı. Bu, yapay zeka alanındaki bilgi mühendisliğinin temel konumunu oluşturmak için problem çözme sürecinde alan bilgisinin enjekte edilmesi gerektiğini göstermektedir. Bu dönemdeki bilgi, çerçeveler ve senaryolar dahil yeni bir evrimi temsil eder. Uzmanlık alanındaki bilginin bilgisayarlar tarafından işlenebilen bilgiye dönüştürülmesine yardımcı olabilecek birçok uzman sistem geliştirme platformu 1980'lerin sonunda ortaya çıktı.

1990-2000'ler Web1.0 World Wide Web:

World Wide Web'in (World Wide Web) ortaya çıkışı, insanların metin içeriğini tanımlamak için HTML kullanmaları ve bilgileri paylaşmak için köprüler aracılığıyla metinleri birbirine bağlamaları için açık bir platform sağlar. Ardından, etiketleri tanımlayarak içerik yapısını belirleyen ve İnternet ortamında sonraki bilgi temsili için temel oluşturan XML-etiket dili geldi.

2000'den 2006'ya kadar Web2.0 sürü zekası:

Bu dönem, bilginin patlayıcı bir şekilde büyümesi süreciydi. World Wide Web'in ortaya çıkışı, bilgimizi kapalıdan açığa, merkezileşmeden dağıtılmışa doğru değiştirdi. Orijinal uzman sistem, sistem içinde tanımlanan bilgidir ve artık bilgi kaynakları arasındaki bağlantıyı gerçekleştirebilir ve tamamen belirli bir kişi veya birim tarafından üretilmek yerine, ilişkilendirme yoluyla daha fazla ve daha zengin bilgi üretebilir. Bu süreç sürü zekasıdır. En tipik temsilci Wikipedia'dır. Kitlesel kullanıcılar, İnternet kitlesel kullanıcılarının bilgiye katkılarını yansıtan ve günümüzün geniş ölçekli bilgi grafiğinin temelini oluşturan bilgiyi oluşturur. Aynı zamanda, 2001'de World Wide Web'in mucidi ve 2016'da Turing Ödülü'nü kazanan Tim Berners-Lee, İnternet içeriğinin yapısal anlamsal temsilini sağlamayı amaçlayan Anlamsal Web kavramını önerdi ve RDF ve OWL, içeriğin yapılandırılmış temsili için tanımlama tanımlarıdır. Bu tür anlamsal temsilin desteğiyle, insanlar ve makineler birlikte daha iyi çalışabilir.

2006'dan günümüze Bilgi Grafiği:

Bu dönemde, Wikipedia'nın yapılandırılması için DBpedia, YAGO ve Freebase gibi birçok çalışma yapıldı. Google'ın bilgi grafiği (bilgi grafiği), Freebase'in satın alınmasından sonra oluşturulan büyük ölçekli bir bilgi grafiğidir. Şimdi bilgi grafiklerinin geliştirilmesine ve uygulanmasına bakıyoruz.Genel büyük ölçekli bilgi grafiklerine ek olarak, yaşamın her kesimi aynı zamanda endüstriler ve alanlar hakkında bilgi grafikleri oluşturuyor. Anlamsal arama, soru yanıtlama sistemleri ve sohbet, büyük veri anlamsal analizi ve akıllı bilgi hizmetleri dahil olmak üzere büyük ölçekli bilgi grafiklerinden nefret eden uygulamalar da gördük.Bilgi grafiklerinin daha yenilikçi uygulamaları henüz geliştirilmemiştir.

2. Bilgi mühendisliği ve büyük veri makine öğreniminin birleşimi

Bilgi teknolojisinin ilerlemesi ve büyük veri çağının gelişiyle birlikte, büyük veri makine öğrenimi de hızla gelişti.Temsil öğrenmeye ve derin sinir ağlarına dayalı makine öğrenimi yöntemleri harika sonuçlar elde etti ve konuşma tanıma, görüntü tanıma ve makine çevirisine başarıyla uygulandı. Bekle.

Büyük veriye dayalı derin öğrenmenin avantajlarını ve sınırlamalarını özetlediğimizde, mevcut büyük veri odaklı makine öğreniminin kara kutu öğrenme süreci olduğu görülebilir. Bir bilgisayar akıllı olacaksa, insanların karmaşık görevleri yerine getirmelerine veya kararlar almalarına yardımcı olabileceği anlamına gelir. Mevcut büyük veri makine öğrenimi bir miktar karar desteği sağlayabilir, ancak kullanıcılar yalnızca sonuçları önermekle yetinmeyecektir.Kullanıcının umduğu öğrenilmiş model, verilen modelin neden başarılı olduğunu ve ne zaman başarılı olduğunu açıklar. Bu, insan bilişiyle birleştirilmesi gereken açıklanabilir yapay zeka.

Örneğin, makine bir resimdeki nesnenin kedi olduğunu otomatik olarak tanır.Ayrıca bize neden kedi olarak değerlendirildiğini de söylemesi gerekir.Örneğin kedinin saç, sakal ve pençe özelliklerine sahip olması, yani insanlara makinenin karar vermesinin temelinin olduğunu söylemesi gerekir. ne.

Sonuç olarak, büyük veri derin öğrenme, nesnelerin altında yatan özellik uzayını öğrenir ve insanların anlayabildiği şeylerin anlamsal alanına karşılık gelir.Bunun içinde anlamsal bir boşluk vardır ve bu boşluğu kapatmak için bilgi grafikleri kullanılabilir.

Şimdi bilgi odaklı bir uzman sistemin tipik yapısına bakıyoruz: bilgi tabanı, akıl yürütme motoru ve insan-makine arayüzü. O zamanlar, uzman sistemlerin gelişimi esas olarak uzman bilgisi edinme zorluğu ve bilgisayar hesaplama gücünün sınırlamaları ile sınırlıydı.

Büyük veri ortamında, büyük veri makine öğrenme yöntemlerini kullanarak büyük veriden bilgi elde etmek için otomatik veya yarı otomatik yöntemler kullanabiliriz, böylece büyük veri ortamında akıllı bir sistem kurabiliriz.

3. Büyük Veri Ortamında Bilgi Mühendisliğinin Araştırmaları ve Zorlukları

Büyük veri ortamında, açık İnternet ortamında büyük veriden bilgi almayı ve bu bilgiyi İnternet / endüstriyi geri beslemek için akıllı hizmetler sağlamak için kullanmayı umuyoruz. Bu, karşılıklı iyileştirmenin yinelemeli bir sürecidir Nihai amaç, İnternet bilgi hizmetlerinden akıllı bilgi hizmetlerine geçişi gerçekleştirmektir.

1994'te bilgi mühendisliği önerisiyle Turing Ödülü'nü kazanan Profesör Feigenbaum, bilgi mühendisliğini şu şekilde tanımlıyor: Yalnızca belirli bir alandaki uzmanların tamamlayabileceği karmaşık görevleri tamamlamak için bilgiyi bir bilgisayar sistemine entegre etmek. Büyük veri çağında, bunu daha da geliştirdik: Bilgi mühendisliği, büyük veriden otomatik veya yarı otomatik bilgi elde etmek ve anlamsal arama ve soru yanıtlama sistemleri gibi İnternet akıllı bilgi hizmetleri sağlamak için bilgiye dayalı bir sistem kurmaktır.

Mevcut bilgi güdümlü ve veriye dayalı yapay zeka yöntemlerini özetleyen sembolik temsil ile temsil edilen bilgi güdümlü yöntem, analoji ile açıklanabilen ve gerekçelendirilebilen açık bilgiye sahiptir. Büyük veri derin öğrenme ile temsil edilen veriye dayalı yöntem, algılama ve hafızayı gerçekleştirebilir ve ilişkili hesaplamaları yapabilir, ancak çıkarım hesaplama sürecini açıklamak zordur. Bu nedenle, iki yöntemin kaynaşması, bilgiye dayalı akıllı teknolojiyi incelememiz için bize bir fırsat sağlar.

Aynı zamanda, iki yöntemin entegrasyonu da birçok zorlu sorunu beraberinde getiriyor. Bilgi mühendisliğinin yaşam döngüsünü oluşturan bilgi modelleme, bilgi edinme, bilgi depolama ve hesaplama ve bilginin yeniden kullanımının dört aşamasından her aşamada karşılaşılan zorluklara bakalım.

Bilgi temsili açısından, esas olarak büyük veri bilgi temsilinin teorilerini ve yöntemlerini incelemektir, böylece bilginin yalnızca açık bir anlamsal tanımı yoktur, aynı zamanda büyük veri ortamında bilgi hesaplamasını ve muhakemeyi kolaylaştırır.

Bilgi edinimi ve füzyonu açısından, esas olarak bilgi edinimi ve anlamsal korelasyon teknolojisini inceler. Şu anda, sembollerle temsil edilen bilgi azdır.Büyük ölçekli ve yüksek hassasiyetli bilgi elde etmek için seyrek bilgi ve büyük veri ortamında bilgi güdümlü bilgi edinme yöntemlerinin nasıl çalışılacağı, karşılaştığımız zorluktur.

Bilgi hesaplama ve akıl yürütme açısından, mevcut sembol temelli muhakeme bazı iyi muhakeme araçlarına sahip olsa da, büyük ölçekli bilgi muhakemesinin etkinliği hala çok sınırlıdır. Derin öğrenme veya olasılıksal çıkarım yöntemlerinin hesaplanması kolaydır, ancak açıklaması zordur. Büyük veri ortamında bilgi hesaplama ve muhakeme, yeni bilgi keşfetme yeteneğini geliştirmek için derin öğrenme ve mantık kurallarını birleştiren bilgi muhakemesi ve evrim yöntemlerini incelemelidir.

Bilgi mühendisliğinin nihai hedefi, bilgi odaklı kişiselleştirilmiş akıllı hizmetler gerçekleştirmektir. Kullanıcı davranışlarını ilişkilendirmek ve analiz etmek için bilgi grafiklerini kullanın, bağlam farkındalığı yoluyla kullanıcı ihtiyaçlarını analiz edin ve bilgi gezintisi, anlamsal arama ve Soru-Cevap gibi farklı kişiselleştirilmiş hizmet türleri sağlayın.

Bilgi mühendisliğinin gelişme eğilimi dört boyutta özetlenebilir.

4. İlgili çalışmalarımız

Aşağıdaki ilk olarak, varlık bahsetme temsili öğrenmeye dayalı olarak ACL2017'de yayınlanan laboratuvarımızın varlık bağlantı çalışmasını tanıtmaktadır. Varlık bağlantısı, bilgi grafiğindeki temel bir araştırma problemidir. İki zorluk var: Birincisi, metinde Bağımsızlık Günü veya 1 Temmuz gibi aynı varlıktan birden fazla bahsedilmesidir. İkincisi, aynı cümle farklı varlıklara karşılık gelebilir Bağımsızlık Günü filmleri veya festivalleri ifade edebilir. Bu nedenle, kurucu kuruluşlarda bahsedilen kelimeler veya ifadeler belirsizdir.

Kelimelerin, varlık bahsetmelerinin ve varlıkların ortak bir temsil öğrenme modeli öneriyoruz, farklı anlamlara sahip varlık bahsetmelerinin vektör temsillerini öğreniyor ve varlık bahsetmelerine dayalı denetimsiz bir varlık bağlama yöntemi uyguluyoruz ve yüksek hassasiyetli varlık bağlama sonuçları elde ediyoruz. Ana teknoloji olarak bununla geliştirilen ve uygulanan bir diller arası varlık bağlama aracı olan XLink, tarafımızdan geliştirilen diller arası bilgi grafik sistemi XLORE'a uygulanmış ve Çince ve İngilizce metinler için varlık bağlantı hizmetleri sunmaktadır.

Bir diğer çalışma ise, Tang Jie'nin laboratuvarımızda barındırdığı, 2006 yılından bu yana online olan büyük veri madenciliği ve hizmet platformu AMiner. AMiner'in amacı, bilim ve teknoloji alanında bir bilgi grafiği oluşturmak ve araştırmacıların profilini çıkarmak, araştırmacı ilgi alanlarını ve araştırmacı bilgilerini elde etmek ve nihayetinde bilgi önerisi gibi akıllı hizmetleri gerçekleştirmektir.

Aminer, uzman aramasında iyileştirilmiş arama hizmetleri sağlamak için uzman yapılandırılmış bilgileri kullanır. Örneğin, kullanıcı ihtiyaçlarını karşılayan sonuçlar elde etmek için "Amerika Birleşik Devletleri", "veri madenciliği" ve "Çinli kadınlar" girin. Aminer ayrıca, temel uzman bilgilerine, araştırma sonuçlarına vb. Dayalı olarak uzman portreleri yapabilir ve araştırmacıların araştırma ilgi alanlarının gelişimini analiz edebilir; kullanıcı ihtiyaçlarına göre dinamik olarak küresel yetenek dağılımı haritaları oluşturabilir; konferans etkisini analiz edebilir; makaleler ve araştırma raporları incelemesi için uzman tavsiyeleri sağlayabilir Bekle. AMiner ayrıca 100'den fazla uzman düşünce kuruluşu kurmuştur.

Raporun içeriğini özetleyin. Birincisi, makine zekâsında bilgi mühendisliğinin önemi veriden, bilgiden, bilgiden akıllı kavramlara ve ilişkilere kadar görülür; ikincisi, bilgi grafiği İnternet bilgilerini insan bilişsel dünyasına daha yakın bir biçimde ifade eder ve bu da İnternet içeriğini sembollerden Bilgisayarların anlayabileceği ve hesaplayabileceği anlamsal bilgiler, İnternet içeriğini daha iyi anlayabilir; daha sonra, bilgi mühendisliği, büyük veriden elde edilen bilgiyi araştırabilir ve bu da büyük veri makine öğrenimi ile insan bilişinin temel özellikleri arasındaki boşluğu doldurabilir; son olarak, büyük bir veri ortamı oluşturabilir. Verileri bilgiye dönüştüren bilgi motoru, İnternet bilgi hizmetinden bilgi hizmetine kadar yeni iş biçimini gerçekleştirmek için temel teknolojidir.

Tsinghua-Qingdao Veri Bilimi Enstitüsü'nün resmi WeChat kamu platformunu takip edin, anahtar kelimeleri arka planda yanıtlayın "Bilgi Mühendisliği" , PPT'nin tam sürümünü indirin.

Bitirme: Liu Wenqing

Resimli Wuhan | Luojia Altın Sonbahar Uluslararası Kültür Festivali düzenlendi
önceki
Afet düzeyinde performans! Avrupa yarışmasına 5 takım gitti, sadece 1 takım ileri gitti, sadece Ligue 1 onlardan daha kötüydü
Sonraki
Hua Taohuayuan'ı arıyor Maobian Kitabevi · Taokei Koleji
Evrişimli sinir ağı CNN'yi anlamak için bir makale (çalışma notları)
Avrupa Ligi'nde büyük bir üzüntü daha! 119. dakika geri sayımı seyirci karnavalını öldürüyor, sahne kazanmak gibi
Reformun 40. yıldönümünü anma ve açılış
500 yıldan fazla bir süredir "Shangshudi", Wudi Wu Shifen'in eski konutu "Bahçe Tarzı" olarak restore edildi.
"Yetkilendirme" sergiler de düzenleyebilir Telif hakkı koruması Chengdu'nun kültürel ve yaratıcı gelişimine yardımcı olur
Bulanıklığı kontrol etmek için büyük veri yükseltme önlemleri: "tek boyut her şeye uyar" kazayla yaralanmayı reddetme
Binzhou Araç Yönetim Ofisi, ev kayıt penceresi ... Bahar Şenliği sırasında normal iş
Global Blockchain + Risk Sermayesi Raporu: Rüzgar yükseliyor ve yeni bir teknoloji yatırımı dalgasına öncülük etmesi bekleniyor
Dört büyük Dünya Kupası kalecisinden üçü Şampiyonlar Ligi'nin hayalini kuruyor! Sadece çeyrek finale yükselmek için ana ligden ayrıldı
Data Jiangtang JOIN Extension-Dimension Concept
Kanser tedavisi piyango bileti satın almak gibidir, ancak yaşam ve ölüm izlenemez
To Top