50 yıllık Web Tim Berners Leenin Turing Ödülünden Konuşma, Web 5.0a ulaşmadan önce neler deneyimlemeliyiz?

Xinzhiyuan önerilir

sıra

Tim Berners-Lee dün 2016 bilgisayar bilimi en yüksek ödülünü aldı: Turing Ödülü. Bu ödülü hak ediyor. Sahadaki insanlar her zaman ödülü kazanmasının sadece bir zaman meselesi olduğunu düşünüyor.

Timin hayatının iki büyük katkısı vardır (tabii ki başka birçok katkısı vardır): 1. Birbirine bağlı dünyanın dokümantasyonu, yani World Wide Web'in (Web) icadı ve W3C'nin çalışmaları da dahil olmak üzere ölçeklendirme çabaları; 2. İnternet İnsan bilgisi çabaları arasında Anlamsal Web, Bağlantılı Veriler, Açık Veri, Bilgi Grafiği vb. Yer alır. İlk katkı yaygın olarak biliniyor, ikinci katkı hala geliştirilme aşamasındadır ve pek kimse bunu bilmiyor. Ama ikinci katkının ilk katkıdan daha büyük bir katkı olacağını düşünüyorum.

Tim aynı zamanda harika bir düşünür. Her zaman teknik konuları tüm insanlığın bakış açısından düşünür. Sıradan tasarımcılar kullanıcıların bakış açısından düşünürken, büyük tasarımcılar insanların bakış açısından düşünür. Ve Tim Berners-Lee, insanlık perspektifinden tasarlandı. Tim Berners-Lee'nin günümüz insan sinir sisteminin baş tasarımcısı olduğunu söylemek abartı olmaz. Çalışmaları tarihin akışını yönlendiriyor. En az on yıllık düzen ve promosyonda çoğu endüstri liderinin önünde. Aynı zamanda organize etme ve etkileme konusunda da iyidir ve somut uygulamayı adım adım ilerletmek için akademik çevrenin en üst düzeylerinde ve Avrupa ve Amerika hükümetlerinde etkili olabilir.

Tim, Web'in hiçbir zaman sadece bir teknoloji icadı olmadığını, daha çok sosyal bir yaratım olduğunu söyledi. İster HTTP ister PageRank, ister Wiki, ister Facebook, insan faktörü baskın faktördür. Açıklık, iletişim ve işbirliği, yeni nesil Web teknolojisi hala insan ihtiyaçlarına, güçlü yönlerine, sınırlamalarına ve değerlerine dayanmalıdır. Teknoloji yalnızca küçük bir kısımdır ve sosyal modellerdeki değişiklikler en temel olanıdır.

RPI, MIT ve W3C'de çalışırken Tim ile yakın çalıştığım için şanslıydım. Web ve Anlamsal Web nasıl ortaya çıktı? Web'in geleceği nedir? Karşılaştığımız zorluklar ve olası çıkış yolları nelerdir? Yazar, bu yıl Ocak ayında Renmin Üniversitesi'nde bir konferans verdi. Bu konuşmaya dayanarak, bu makale Tim'in Web vizyonunu ve Web'in belge ara bağlantısından bilgi ara bağlantısına kadar olan sürecini kısaca gözden geçirdi ve gelecek hakkında bazı tahminler yaptı.

1. Katil bir uygulama olarak Web

Katil uygulama nedir? Wikipedia'daki tanıma göre, katil bir uygulama, bu uygulamanın veya teknolojinin bir nişten genel halka taşınmasını sağlayan ve kullanıcı sayısını büyük ölçüde artıran bir uygulamadır.

Sadece öldürücü uygulamalara birkaç örnek verin: ATM makinelerinin Web ve yapay zeka ile hiçbir ilgisi yoktur, ancak bunun hakkında düşünebiliriz, bu nasıl bir teknoloji uygulamasıdır? Veritabanı teknolojisi ve ağ teknolojisi. Büyükannemize soyut olarak açıklarsak veritabanı nedir? Ağ nedir? Hiç anlamıyor ama bir makine var derseniz, ona plastik bir kart verirseniz ve o size para verirse, anlayabilirsiniz. Bu, katil uygulaması.

Ne tür katil uygulamalar var? Visicalc'i kaç kişi duydu? Elektronik tablo teknolojisi 1970'lerin sonunda ortaya çıktı Elektronik tablo teknolojisi nedir? Tamamen teknik bir bakış açısıyla, elektronik formun herhangi bir önemli sorunu çözmediği söylenebilir.Elektronik formun çözebileceği tüm problemler veri tabanı ile çözülebilir. 1970'lerin başında zaten bir veritabanı vardı, peki neden 1970'lerin sonlarında bir elektronik tablonuz vardı? Sadece ortaokul eğitimi olan bir memur, veritabanını iyi kullanabilir mi diye düşündük. 1970'lerin sonunda ortaya çıkan elektronik tablo, makine odaklı problemlerle değil, insan odaklı problemlerle ilgiliydi. Sadece bir avuç SQL'in keyif alabileceği veri yönetiminin zevkini aldı ve milyonlar kazandı Sadece orta öğretim seviyesine sahip kişiler tarafından da kullanılabilir. Elektronik tabloların anlamı budur, dolayısıyla Excel daha sonra tanıtılmıştır. Artık elektronik biçim on milyarlarca büyük endüstri haline geldi.

Öyleyse diğerine bakın, bu nedir?

Bu, grafik arayüzlü dünyanın ilk tarayıcısıdır. İlk Web Sunucusu 1990 yılında CERN'de Tim Berners-Lee tarafından yazılmıştır. O zamanlar zaten bir tarayıcı vardı, ancak bu tarayıcı bir komut satırı tarayıcısıydı (satır satır tarayıcı). Çok az kişi kullanabilir. 1992'de, başka bir mühendis Erwise tarayıcısını yazdı, grafik arayüz X-window'a dayanıyordu. 1993 yılına gelindiğinde, Mosaic ile, aynı zamanda katil bir uygulama olan Netscape'e dönüştü.

Bir düşünelim. Aslında İnternet yeni değil. 1960'larda zaten İnternet vardı. Hypertext de yeni değildi. 1980'lerde zaten hipermetin vardı, ama neden 1994'e kadar devam etti (o yıl dünyada sadece 3.000 web sitesi vardı), Web gerçekten olağanüstü bir araç haline geldi mi? Çünkü bundan önce böyle bir katil uygulama yoktu. Tarayıcı çok katil bir uygulama, yani Mosaic'i 1993'te ve Amazon'u 1994'te görüyoruz. Bu tesadüfi değil, katil uygulamaların bir sahadaki etkisi.

Web'e geri dönüp baktığımızda, aynı zamanda katil bir uygulamadır.Aslında Web, İnternet'in bir uygulamasıdır, ancak şimdi kitle iletişim araçlarında herkes farklı olmayabilir. Herkes "İnternet" hakkında konuşuyor Herkes İnternet hakkında konuşurken, genellikle World Wide Web (Web) hakkında konuşuyorlar. Yani alt katman, veri bağlantı katmanından IP katmanına, taşıma katmanına sunum katmanına kadardır.Bu farklılıkları günlük medyada görmeyeceksiniz. Web yalnızca en üstteki protokollerdir: HTTP, HTML, URI. Bu üç anlaşma Web'in temelini oluşturur.

Web nasıl ortaya çıktı? Aslında, bu teknolojiler Tim'in Web'i icat etmesinden on yıldan fazla bir süre önce mevcuttu. Tim Berners-Lee neden 1991'de onları bir araya getirmiş gibi göründü?

Şu anda gördüğümüz şey dünyadaki ilk Web Sayfası. Bu, Tim Berners-Lee tarafından kişisel bilgisayarına 1990 Noel'inde yazılmıştır. O zamanlar sadece kendi bilgisayarı Web'i izliyordu. İlk Web sayfasını yazdığı andan sonra Avrupa Atom Enerjisi Örgütü içinde, neredeyse bir yılını herkesi Web'i kullanmaya ikna ederek geçirdi. Çoğu insan o şeyin değerine inanmıyor. Daha sonra, tüm dünyada yol gösterileri yapması tam iki yılını aldı, sadece çok az insan bunun değerli olduğuna inanıyordu.

TED hakkında bir konuşma var - Tim Berners-Lee'yi nasıl reddettim, yani bir kişi Tim Berners-Lee ile bir konferansta tanıştı ve Tim Berners-Lee ona şu anda ne yaptığınızı söyledi (Ansiklopedi başvurusu) Peki, bu ansiklopedi uygulamasını İnternet ile birleştirmelisiniz. Kafası çok karışıktı, neden bu şeyi internet ile birleştirmek istediğimi söyledi, bunun bir değeri var mı? (İlgili TED Talk linkleri: Ian Ritchie, Tim Berners-Lee'yi nasıl reddettim?; Tim Berners-Lee) Bu tesadüfi bir örnek değil. Eğer "Web'i Dokuma" kitabını okursanız, kitapta çok şey var.

İki, Web'in üç hedefi

Yeni bir teknoloji ilk doğduğunda, eksikti O zamanlar, çoğu insanın bu teknolojinin ne kadar yıkıcı bir değer getirebileceğini anlamasının hiçbir yolu yoktu. Web böyledir, Anlamsal Web böyledir ve bilgi grafiği de böyledir, bu nedenle bu gelişim sürecinde aşağıya baktığımız ve değersiz gördüğümüz günler yaşadık. Herkesin bu kitaba bir göz atmasını şiddetle tavsiye ediyorum, sadece Web'i okuyanlar için değil. Bu kitabın yapay zeka araştırmaları için olduğunu ve internet mühendisleri, ürün yöneticileri ve operasyon yöneticileri için de faydalı olduğunu düşünüyorum. Bu çok mantıklı.

Bu kitabı okuduktan sonra bir soru düşünüyorum, bilgi nedir? Bilgi nasıl üretilir? Birbirine bağlı bir bilgi ağı veya bir bilgi yönetimi ağı kurmak istiyorsak, en önemli şey nedir? Tim Berners-Lee'nin cevabı karşılıklı bağlantı, açıklık ve özgürlüktür. Bu kitabın ayrıca "Dokuma-Dünya Çapında Ağın Babası" kitabının Çince versiyonu da var Bu kitabın baskısı yok ve Taobao'da satılıyor.

Bu kitapta Tim Berners-Lee 1990'dayken bir teklifte üç şeyden bahsetti - aslında 1989 - ve o sırada çok iyimserdi. Kendisine altı ay süre verildiğini düşünüyordu. Tüm bunları yapabilir. Gerçek şu ki 25 yıl geçti ve bunlar henüz yapılmadı. Bu üç şey nedir?

İlki, birbirine bağlı belgelerden oluşan bir ağ, bir Belge Ağı, bunu gerçekten yaptı ve sonra onu iyileştirmek 15 yıl daha sürdü.

İkincisi, Anlamsal Web olarak adlandırılır, her belgemiz aslında insan bilgisini taşır. Bu belgeyi sadece insanlar tarafından değil aynı zamanda makineler tarafından da nasıl okunabilir hale getirebiliriz? Bilgi nedir? Bilgi bir yapıdır Makine tarafından okunabilir bir yapıya sahip olduğumuzda, aslında bir bilgi ağına sahip oluruz.

1999'dan beri Anlamsal Web'i zorlamaya başladı. 2001 yılında, Jim Hendler ve Ora Lassila ile birlikte, bir kavramı açıklamak için Scientific American üzerine bu makaleyi yayınladı.Eğer yapılandırılmış verilere ve ağ uygulamalarını bilgiyle etiketleme yeteneğine sahipsek , Bazı büyülü uygulamalara ulaşabiliriz. Aslında, Siri, IBM Watson ve Tim Berners-Lee'nin on yıldan fazla bir süre önce tarif ettiği bazı fikirler gibi anlattığı şeylerin çoğu şimdi gerçekleştirildi. O zamanlar bilim kurgu olarak kabul edildi, ancak şimdi bir gerçek.

Önerisinin üçüncü kısmı, bilgi sahibi olduktan sonra ne olacağını söyledi? En önemli şey insanlardır, Web'in attığı her adım, temel düşüncesi, bilgi ve gerçekten getirebileceği en değerli veriler makineler değil, insanlardır. Yani makineleri, insanları ve bilgiyi birbirine nasıl bağlayacağınız Tim Berners-Lee'nin ana düşüncesi. Tasarımda sadece bu verileri okuyabilmemiz gerektiğine değil, daha da önemlisi bu verileri çok kolay oluşturabileceğimize dikkat çekti. O zamanlar Wiki kavramı yoktu ama aslında Anlamsal bir Wiki sistemi olan böyle bir sistemi tarif etti.

25 yıl geçirdik ve muhtemelen ilk hedefine, ardından ikinci hedefin yarısına ulaştık. Yani Web sadece ilk yarıyı bitirdi ve yine de ikinci yarıda gitmek zorunda.

3. World Wide Web'den Anlamsal Web'e

Kalan 25 yılda, bugünden 2040'a kadar hedeflerimizin diğer yarısına da ulaşacağız. "Scientific American" makalesinde, Tim Berners-Lee bir kez daha iyimserliğini dile getirdi. Daha önce de bahsettiğimiz gibi, ilk kez teklifin gerçekleştirilmesinin altı ay süreceğini söyledi ve sonunda bu görevin zorluğunu büyük ölçüde hafife aldığını kanıtladı. Benzer şekilde, bu makalede, bu görevin karmaşıklığını bir kez daha hafife almış, Anlamsal Web'e on yıl içinde ulaşabileceğimizi düşünmüş, ama aslında başaramamıştır. 2007 ve 2008'e gelindiğinde, tüm sektördeki insanlar bu hayali gerçekleştirmemizin 30 yıl sürebileceğini çoktan keşfettiler. 2007'de, 30 yıldan çok sonra hissediyor, ama şimdi 2017'de. Bu tahminin aslında oldukça güvenilir olduğunu buldum. Bu tahminin neden güvenilir olduğunu ayrıntılı olarak inceleyelim.

Bunu W3C'de Semantik Web teknolojisi eski başkanı Ivan Herman'ın bir slayttan çaldım. 2010'da bundan bahsetti. 2005'te bu teknolojinin ne kadar geliştirildiğini düşünüyordu? Bu, Innovator'ın önceki seviyesindedir. 2010 yılına kadar Erken Benimseyenlere ulaştığını düşündü ve tahmini doğru olmalı.

Böyle bir eğri, normal disiplinlerin gelişimi için sorun değildir, onu başka bir yerde görmüş olmalısınız, buna teknoloji olgunluk eğrisi denir. Normal şartlar altında, başlangıçta kimse bir teknolojiyi bilmiyordu.Bir süre sonra herkes teknolojinin çok harika olduğunu hissetti ve sonra zirveye ulaştı; zirve geçtikten sonra, bir çukur geldi ve bir yalancı olduğunu hissetti ve herkes hayal kırıklığına uğradı. Hiç kimse yatırım yapmadı; bir kış döneminden sonra, tamamen aldatıcı olmadığı ortaya çıktı, ancak makul faktörler var. Yavaş yavaş geri tırmandım ve sonunda olgun bir pazara, genellikle "normal" bir teknolojiye tırmandım. İşte emeklemeye böyle geldi. Yani "normal" teknoloji için, bu aşamaya gelince, bir kışın geri döndükten sonra, bu tırmanma aşaması, öldürücü uygulamalar ortaya çıkacak.

Ancak yapay zeka teknolojisinin "normal teknoloji" olmadığını biliyoruz. Yapay zeka teknolojisinin olgunluk eğrisi şöyle görünüyor.Neredeyse her on yılda bir, bir kez azarlanmak zorundayız ve yalancıyız.

Özellikle, bilgi grafiği teknolojisi için birkaç kez azarlandık. Aslında, bu eğriden önce hala birkaç kez var ve ben çizmedim, aslında 1960'lardan beri oradaydı. 1980'lerde konuşmaya başladık, o zamanlar bir sürü Lisp Makinemiz vardı, o zamanlar Lisp olsaydı, Prolog olsaydı tüm insanoğlunun tüm bilgilerini modelleyebilirdik diye düşündük. Tüm insanın bilgisini mantıklı bir şekilde ifade etmeye çalışan Cyc adında bir şirket var. 1980'lerin sonunda, Japonlar o kadar kötü dolandırıldı ki, beş nesil bir makineye sahip olmak istedik. Yani bu sırada büyük bir balon vardı Beklendiği gibi, 1990'ların ortasında herkes yalancılardan bahsediyordu. O dönemdeki doktora öğrencileri çok üzüldü.

Sonra 1990'ların sonunda, yavaşça tekrar ilerlemeye başladım. O sırada Guha, RSS'yi Apple'da icat etti ve ardından 1997'de RDF, Apple'da icat etti. Daha sonra, 1999'da RDF bir endüstri standardı haline geldi ve ardından DARPA (ABD Savunma İleri Araştırma Projeleri Ajansı) bir DAML çalışma grubu kurdu. OWL 2000 yılı civarında kurulduğunda, tüm Semantik Web'in yeni bir umudu vardı. Herkes yeniden çok güçlü olduğunu hissetmeye başladı ve insanlık yeniden yok edilmek üzereydi, ancak gerçekler bunun olmadığını kanıtladı. Yani 2003 ve 2004'ten itibaren herkes bu teknolojinin beklendiği kadar güçlü olmadığını ve birçok sorunun çözülemeyeceğini gördü. Öyleyse aşağı inmeye başlayın. 2010 yılına gelindiğinde, Freebase gibi pek çok iyi iş yapmış olmamıza rağmen, o zamanlar temelde Anlamsal Web'den mezun olan doktora öğrencileri kendi işlerini bulamıyorlardı.

4. Anlamsal Web'den Bilgi Grafiğine

2012'de, Google'ın Bilgi Grafiğinin bir işaret olarak yayınlanmasıyla birdenbire tekrar hızlanmaya başladı. Ama aslında, medyada bizim hakkımızda çıkan haberleri bir kenara bırakırsak, bunun endüstrinin gerçek gelişimi ile hiçbir ilgisi yok, bu endüstrinin teknolojisi, bu "çukur" aşamasında bile ilerliyor. Sağlam işler sürekli ilerliyor. 2006 ve 2007'de DBpedia gibi bir sistem kurulduğunda, çoğu insan onun değerini anlamadı. Daha sonra Watson, yalnızca bu teknolojiyi kullanarak hassasiyetin son yüzde 10 puanının artırılabileceğini keşfetti.Başka hiçbir teknoloji bunu yapamaz, bu teknoloji medyaya bu zamanda girdi. Ancak medyaya girmeden önce, su altında çok fazla çalışma yapıldı.

Bu, Nova Spivack (Twine and Bottlenose CEO'su) tarafından 2008'de yapılan bir tahmindir. 2008'de herkes bu Tim Berners-Lee tahmininin yanlış olduğunu keşfetti. Bu görevin zorluğunu hafife aldık. Böylece Web'i Web 1, 2, 3 ve 4'e böldü ve Web 2 Sosyal Web'di.O sırada Sosyal Web'in çok başarılı olduğunu gördü. 2020 yılına kadar Anlamsal Web'e ulaşabileceğimize inanıyor. Şimdi 2017'deyiz ve 2020'ye kadar hala üç yıl var, Anlamsal Web'e ulaşabilir miyiz? İmkansız görünüyor, bu yüzden bu sorunun zorluğunu da hafife aldı. Web 4.0'ın Akıllı Web olduğuna inanıyor. Bu fikrin oldukça güvenilir olduğunu düşünüyorum, ancak Semantik Web planı konusunda hala biraz iyimser.

Bu konunun aslında iki aşamaya bölünmesi gerekiyor, bunu Veri ve Zeka olarak ayırmak gerekiyor. Az önce bahsettiğim gelgitte, sadece küçük şirketler değil, aynı zamanda büyük şirketler de bu düşüşten kurtulamadı. Bu büyük şirketler çöktüğünden değil, Google ve Yahoo'nun o sırada birçok Anlamsal Web Etkinliği vardı. Performans, bu projelerin çoğunun sonunda başarısız olmasıydı. Örneğin, 2008 ve 2009'da Google'ın Rich Snippets projesi sorunsuz bir şekilde sona erdi - elbette bir kısmı daha sonra Schema.org'a dönüştü, bu yüzden tam bir başarısızlık değildi. O zamanki standardizasyon çalışmaları da dahil olmak üzere bu tür pek çok proje var RDF ve OWL bir dereceye kadar başarılı. Ancak 2007, 2008'den 2010'a kadar olan RIF ve OWL2'nin başarısız olduğu söylenebilir. O zamanlar, bu şirketlerin çoğu, Hakia, Powerset, Twine gibi o zamanın bu ünlü İnternet şirketleri haline geldi ve temelde hiçbiri 2010'un ötesinde hayatta kalamaz, yani şu anda herkes Çok küçümsenmiş.

Ancak 2012 civarında yeniden toparlandık. Aslında, 2009 ve 2010'da pek çok çalışma başladı. Örneğin, 2009'da Tim Berners-Lee'nin dürtüsü altında, açık hükümet verilerine sahiptik. 2006 yılında, Tim Berners-Lee tarafından da desteklenen birbirine bağlı veriler elde ettik. 2010 yılında bir grafik veri tabanımız olduğunda, nihayet RDF veri tabanının yanı sıra bir seçeneğimiz daha vardı. 2010 ve 2011'de iki ikonik proje vardı, biri Siri ve diğeri IBM Waston'du. İki doz aşılamadan sonra, herkes bunu gerçekten yararlı buldu.

2011 yılına gelindiğinde, Palantir 250 milyon dolar gelir elde etti. Bunu yapabilen semantik teknolojiyi kullanan bir şirket hiç olmadı. Herkes, bu şeyin sadece teknik olarak değil, aynı zamanda ekonomik olarak da faydalı olduğunu gördü. Palantir bir ontoloji editörüdür. Şimdi yıllık geliri 2 milyar ABD dolarıdır.

Bu 2012'deki en büyük şeydi. Google, Freebase'i satın aldıktan sonra adını Bilgi Grafiği olarak değiştirdi. Google'ın gösteri etkisi açıktır. Herkes Google'ın onu kullandığını gördü ve herkes onu takip etti. Microsoft'ta Trinity vardı. O sırada, bir grup yerli İnternet şirketi olan Sohu ve Baidu'nun her biri Bilgi Grafiği ile ilgilenmeye başladı.

2013 yılında Amerika Birleşik Devletleri'nde bir finansal bilgi grafiği uygulaması olan Kensho vardı. 2015 yılına gelindiğinde bilgi grafiği terimi medyanın sevgilisi olmaya başladı. 2016 yılında Çin pazarında çeşitli diyalog robotları ve akıllı konuşmacılar ortaya çıktı.Bunlardan yüzlercesi olabileceğini düşünüyorum.Bunun arkasında bilgi grafikleri kullanılıyor. Bu yazı en erken 2012'de sormak için dışarı çıktığımda olmalı. Bunun gibi birçok şirket de var.

V. Bilgi grafiğinin dönüşünün arkasında

Böylece, bilgi haritası teknolojisinin geçtiğimiz beş yıl içinde mükemmel bir şekilde tersine döndüğünü görebiliriz. Ama üç ayak donmak bir günlük soğuk değil, bu da herkesin hor görülmesinden bu teknolojinin çok az işe yaradığı hissine varabileceğimiz anlamına geliyor. Aslında, bu noktaya sahip olduğumuz on yılı aşkın süredir tüm alanın aralıksız çabaları. Kazanım. Bu yıl gördüğümüz bilgi grafiği aslında binlerce farklı projeden oluşuyor.Son on yılda deneyler yaptık ve sonunda biraz öz bıraktık.

Örneğin, yukarıdaki resimde Bestbuy'un ürün meta verileri. Aslında, şu anki ekran görüntülerinin hepsi 2008'den 2010'a kadar yaptığım şeyler. Ancak o dönemde Çin'in henüz yapmadığı pek çok şey var. Aslında her alanda bu modelin Çin'de kopyalanmasının bir şansı olduğunu düşünüyorum. Bestbuy'un her ürün tanımlama sayfası, gördüğümüz sayfadır, sonra bu makinenin gördüğü sayfadır, arkasında GoodRelations adında bir Ontoloji vardır.

Bu Facebook. Görebildiğimiz sayfa burası Arkasındaki Meta Veriler nedir? Bu Açık Grafik. Bu LinkedIn, arkasında Microformat'ın Meta Verileri var. Bu SlideShare ve bunun arkasında RDFa biçiminde Meta Veriler var. Bu IMDb'dir ve bunun arkasında başka bir tür Mikroformat Meta Verisi vardır.

Bu, aslında şu anda çevrimdışı olan bir Semantik Veri Toplama portalı olan Sig.ma'dır. İnsanlar ve şirketler gibi internette bulunabilen her varlık için, her biri bir varlıktır.Her bir varlığın verilerini toplar. O zamanlar benim bir sayfam vardı. Efsane benim hakkındaydı. Kişisel özgeçmişlerin bir toplamı.

Sadece doğrudan oluşturulmuş çeşitli anlamsal verilere değil, aynı zamanda mevcut verilerden haritalanmış çeşitli verilere de sahibiz.

Bu RPI'da yaptığımız bir işti. Büyük miktarda devlet verisi var. Bunlar temelde elektronik tablolar şeklinde yayınlanıyor. Bunun üzerinde çeşitli planlama ve sıralama çalışmaları yaptık ve RDF formatına dönüştürdük ve ardından veri kalitesini iyileştirdik. . Bu, o zamanki orijinal veri biçimiydi. ABD hükümeti Data.gov web sitesindeydi. Federal hükümetten başlayarak, Birleşik Devletler'deki çeşitli departmanlar halka açık verilerin yayınlanmasını zorunlu kıldı. O halde, yukarıdaki verilerin çoğu çok kirli verilerdir ve arkasındaki çeşitli veri kümeleri temelde organize olmamıştır. Yani RPI'da böyle bir sıralama yaptık. Jim Hendler liderdir ve Beyaz Saray üzerinde etkisi olmuştur. Ding Li, ilk proje yöneticisidir. Tim Berners-Lee, İngiltere Başbakanı'nı etkiledi ve Birleşik Krallık'ta benzer projeleri destekledi.

Bu Open Link şirketi. Yayınladıkları veritabanına, veritabanı verilerini RDF'ye dönüştürebilen bir uygulama olan Virtuoso adı verildi. Daha sonra, W3C'de, İnternette zaten var olan büyük miktarda yapılandırılmış veriyi nasıl koyduğumuzu düzenleyen RDF'ye İlişkisel Veri Tabanı gibi bir standart olan R2R adlı bir standart da vardı. Tim Berners-Lee Web'i icat ettiğinde, bir kazı yapmak için, çoğu insan bunun yararlı olduğuna inanmadı. O iki şey yaptı: Birincisi, FTP'yi Web'e eşleştirmesiydi ve ikincisi oydu. CERN'in telefon rehberini Web'e eşlemek, yeni bir teknolojiyi başlatmak için mevcut verileri tam olarak kullanmaktır. Dolayısıyla, Excel'den, elektronik tablolardan yapılandırılmış verilere, İnternet'e koymak, yetişmemiz için bazı ipuçları. Şu anda (Wenyin Internet) yaptığımız şey, PDF dosyalarındaki verileri İnternet'teki stok transfer defterine koymaktır ki bu aslında benzerdir.

Bu, bu sabah yakaladığım Zhihu'nun üstündeki sayfa. Solda insanlar tarafından görülen Zhihu'nun sayfası, sağda ise makinelerin gördüğü Zhihu'nun sayfası Bu nedir? Aslında, bunlar HTML5'in bazı Anlamsal Ek Açıklamalarıdır.

Dolayısıyla, gördüğümüz web sayfalarının çoğu için, HTML kaynak koduna dikkatlice baktığınız sürece, ardındaki Anlamsal Meta Verileri bulabilirsiniz, bu nedenle veri açısından Anlamsal Web gerçekten uygulanmıştır.

Daha spesifik bir küçük örnek vereyim, MIT'de tanıştığım bu dört arkadaşım, Ocak 2010'da Tim Berners-Lee tarafından da organize edilen Bağlantılı Veri Girişimcilik Programı vardı. Öğrenciler biraz eğitim verirler, onlara üç gün içinde RDF'nin nasıl olduğunu öğretirler, vb. Sonra onlardan bir uygulama bulmalarını ve kendi başlarına bazı küçük örnekler yapmalarını isteyin. Sonra bu dört arkadaş bir menü uygulaması yaptı ve restorana sipariş menülerini internete koyması için yardım edip edemeyeceğimi sordu. Çok basit bir fikir gibi geliyor ama çok iyi uyguladılar ve bu dört kişi de çok girişimci, yatırımı çabucak aldılar ve sonunda 4 milyon dolar risk sermayesi topladılar. Bunu iki yıl yaptıktan sonra, şirketi 80 milyon dolara sattılar Bu, zenginlik yaratmak için semantik teknolojinin kullanılmasına bir örnek.

Elbette bunun gibi pek çok örnek var Amerika Birleşik Devletleri'nde her dikey alanda Anlamsal Arama yapan hala 200 firma var.Bunlar bazı büyük şirketler, ama aslında çok daha küçük şirketler var. Daha büyük bir düzen. Geriye dönüp baktığımızda, Gartner bu tahmini 2007'de yaptı. 2017'ye kadar Web sayfalarının çoğunun bir tür anlamsal hiper metinle süslendiğini tahmin etti. Bunu gerçekten yaptık.

Devir sürecinde Tim Berners-Lee büyük bir rol oynadı. 2006'daki bağlantı verileri, 2009'daki hükümet açık verileri ve W3C'nin toplumdaki liderlik rolü, Tim'in doğrudan liderliğinin sonucudur. Onun dışında sahada bir uygulama sapması olduğunda durumu gerçekçi bir şekilde düzeltmek için bu kadar büyük bir etki uygulayabilecek ikinci bir kişinin olmadığı söylenebilir. Tasarım Sorunları'nda, sürekli olarak Web geliştirmenin bazı ilkeli konuları üzerine düşünerek özetlemeye devam etti. Bu düşünceler genellikle uzun yıllar uygulamaya rehberlik eder.

Altı veya beş soru

Peki bu örneklerden ne öğrendik? Geçtiğimiz 15 yıl içinde bir aşağılanma aşamasından geçtik ve son beş altı yılda da bir geri dönüş için mücadele ettik. O zaman şimdi bazı temel konular üzerinde düşünmeliyiz,

İlk soru tasarım ve özet sorusudur, aslında bu mühendislik alanında da genel bir kuraldır, kullanışlı ve pratik bir sistemdir.Genellikle tasarlanmaktan ziyade özetlenir. 2001 yılında mantığa dayalı bir dizi ifade hayal ettiğimizde, gerçeklikle temasımız koptu. Böylece bu şeyler, gerçeklik tarafından acımasızca dövüldü. 2006'dan sonra verilerden başladık (Tim Berners-Lee'nin rehberliğinde), aşağıdan yukarıya doğru, gerçek dünyada ne tür verilerin olabileceğine baktık. Wikipedia'daki bilgi kutusu insanların halihazırda sahip olduğu bir davranıştır. Bu bilgi kutusunda bazı yarı yapılandırılmış verileri çıkardık ve DBpedia'ya dönüştürdük. DBpedia daha sonra soru-cevap sisteminin verimliliğini artırmak için diğer ürünlere uygulandı. Bu, ilk etapta onu kimin tasarladığı değil, aşağıdan yukarıya bizim tarafımızdan özetleniyor. İyi şeyler tasarlanmaktan çok özetlenir.

İkincisi, Anlamsal mı yoksa Web için mi? Bu aynı zamanda tipik bir okul anlaşmazlığıdır. Anlamsal Web alanında, Anlamsal ve Web yönelimli iki okul vardır: Jim Hendler, biri Anlamsal Kule ve diğeri Web Kulesi olmak üzere İki Kule adında ünlü bir derse sahiptir. Yine de yeni olan ne? Frank van Harmelen şunları söyledi: Anlamsal Web'in yeni kısmı Anlambilim değil Web'dir. Bu alana katılmak için sadece Web bizim, Web nedir? Web, bilginin ifadesi değil, kaynakların karşılıklı bağlantısı, karşılıklı bağlantısı ve dolaşımıdır. Şimdi bilgi grafiğine bakarsak, gözlemin odağı sözde dağıtılmış temsil, makine öğrenimi, derin öğrenme veya sözde mantıksal ifade olmamalıdır.Bunların hepsi önemlidir, ancak bu alandaki en kritik konu değildir. Bu alandaki en kritik konu, internette bilgi akışının nasıl yapılacağı ve insanların bilgiyi uygulama ve ifade etmelerinin nasıl kolaylaştırılacağıdır.Bu en önemli şeydir, bu alanda en önemli şey yetenek. Bu Web ve Web bir insan, makine değil.

Üçüncüsü yöntem odaklı mı yoksa sorun odaklı mı? Anlamsal Web veya bilgi grafiği, bir grup formül veya soru mu? Çekiçli çivi mi bulacağız yoksa zaten bir ihtiyacımız var mı? İstediğimiz talep nedir, çivi mi? Hayır, ihtiyacımız duvarda bir delik, ihtiyacımız bu. Bu yüzden, sorunu çözmek için mevcut yöntemimizle yüzleşmek yerine, ihtiyaçlarla karşılaşan sorunu çözmeliyiz. Sorunla karşı karşıya olduğumuzda, herhangi bir sorunu çözmenin, onu çözmenin bir yolu olmadığını görürüz. Şimdi geri dönüp Siri veya Watson'ın tüm mimarisine bakalım. Bu sorunu çözmek için çeşitli yapay zeka yöntemleri kullanır. İster istatistiksel bir yöntem ister derin öğrenme yöntemi olsun, tek bir yöntem yoktur. Ya da mantıklı bir yaklaşım şu anda karşı karşıya olduğumuz sorunları çözebilir. Yalnızca üç yöntem birleştirilebilir. Bana bu soruyu soran insanlarla sık sık karşılaşıyorum ve şöyle dedi: Bir grafik veritabanı kullanmalı mıyım artık bir bilgi grafiği uygulaması olacağım. Bu soruyu sormak ilk kırmızı bayraktır.Grafik veritabanını ikinci kırmızı bayrak olarak kullanmalı mıyım? Bu perspektiften soru sorarsanız, projenin% 90'ı problemden değil, yöntemden başladığı için başarısız olacaktır. Bu, kaçınmamız gereken bir risktir.

Dördüncüsü, büyük veya küçük sorunlarla yüzleşmek olup olmadığıdır. Başlangıçta düşündüğümüz şey aslında bazı büyük problemlerdi .. Anlamsal araştırma büyük bir problem. Tabi başlangıçta bu fikirden bahsettik, tıpkı Tim Berners-Lee'nin "Scientific American" makalesinde tasavvur ettiği problem gibi, aslında çok büyük bir problem, ki bu da saha planlaması için gerekli. Ancak pratikte olduğumuzda, büyük sorunlarla başlamak bizim için zor. Son zamanlarda bazı şirketlerden insanlarla da görüştüm. 2006, 2007'de aynı dönemde sınıf arkadaşlarım ve meslektaşlarım da dahil olmak üzere projelerinin çoğu iki veya üç yıl çalıştıktan sonra sona erdi. 2008 yılında mezun olan doktora grubu, şirkete katıldıktan sonra tabii ki çoğu kariyerini değiştirdi, ancak birkaçı bazı şirketlere gittikleri için şanslıydılar, bir Semantik Web Grubumuz olduğunu söylediler ve sonra ben girdim ve yaptım. İki veya üç yıl sonra bu grup dağıldı, neden? Bir şirket istiyorsunuz, Başkan Yardımcısı terfi için süre nedir? İki ila üç yıl. İki ila üç yıl içinde başarısız oldu ve çıkması gerekiyor. Büyük bir proje ise, şirketin ana işi için gelir yaratamazsa sürdürülebilir olamaz. Ayrıca Çin'de bir finansal bilgi haritası oluşturmak isteyen çok büyük bir internet şirketi var. Geçen yılın başında bir aracı kurumdan bir arkadaşımı işe aldım, bunu yapan 30 kişi olduğunu söylemekten çok heyecanlandım.Senin sonunda hüsranla geri döndüm ve projenin dağıldığını ve sadece 5 kişinin kaldığını söyledim. Çünkü bir yıl içinde gelir elde etmenin bir yolu yok. Yani büyük bir proje yapmaya başladığımızda ve büyük bir problemle karşılaştığımızda, kaçınılmaz olarak bu yenilikçiler ikilemiyle karşılaşacağız. Anlamsal Web teknolojisi yıkıcı bir teknolojidir. Büyük bir genel sistemden başlamak zordur.Çok küçükten başlaması gerekir, birkaç kişi tarafından yapılabilir bir şey, bu yüzden büyük görevlere değil küçük görevlere odaklanmalıyız. Yap.

Son olarak, insanların kalbini nasıl kazanırsınız? Akademiden çıkıp kurumsal dünyaya adım attığımda hissettiğim en büyük teşvik neydi? Para miktarı. Örneğin okuldayken bir teklif yazmak için uzun zaman harcıyoruz Başarı oranı nedir Amerika Birleşik Devletleri'nde doğal fon komitesi projesi yirminci birdir Ne kadar para alabiliriz? 300.000 ABD doları, yalnızca iki milyon yuan'dan fazla ve şimdi Çin'de yeni mezun olan bir çocuk, bir melek projesi için 10 milyon yuan'a mal olabilir. Bu fark nerede? Bazı bilim adamlarının bir dereceye kadar gösterme yeteneğinden yoksun olduğunu düşünüyorum, tüm iş gösteri işidir. Anlamsal Web veya Bilgi Grafiğimiz tamamen bilimsel bir alan değil, bir uygulama alanıdır. VC'ye, Funding Agency'ye veya kamuoyuna net bir şekilde açıklayamıyorsak, PR'da iyi bir iş çıkarmak için bazı iyi projeler kullanırsak, bu alanın gelişmesi imkansızdır. IBM Watson bunu yapmaya başladığında, aslında pek çok numara oynadılar, örneğin, yaptıktan sonra, test etmek için kimi aradılar? Kongre üyeleri, kendi sistemleri ile gelip PK yapmalarını istediler ve ardından Kongre'yi kazandılar. Aslında bu çok iyi bir PR. Tim Berners-Lee, Web'i geliştirmek için yaptığından çok Web'i tanıtmak için daha fazla çaba harcadı. Daha sonra Anlamsal Web'i tanıttı ve TED'e "Şimdi Ham Veri!" Diye bağırmak için gitti. Tim'den öğrenin.

Yedi, Web'in ikinci yarısı

Bunlar yukarıda düşündüğüm beş soru. Aslında, daha fazla sorun var, çünkü tüm alan ileriye doğru gelişiyor. 25 yıl geçmiş olmasına rağmen, daha önümüzde uzun bir yol var. Tim Berners-Lee'nin vizyonundan nihai farkımıza kadar, bu Tüm dünyanın bilgisini birbirine bağlama arzusu bir nesil sürebilir ve bugün birçok gencin çocukları sizinki gibi olduğunda bu arzuyu gerçekleştirebileceğiz.

Web'in 50 yıllık tarihini, aşağıdaki şekilde gösterildiği gibi 1990'dan beş aşamaya veya beş kuşağa böldüm.

Web'in önceki 2.5 neslinin hayata geçirildiğini söyleyebiliriz. Birinci nesil Web, belge Web; ikinci nesil Web, sosyal Web; ve Veri Web'in yarısı, şimdi bir bilgi grafiği biçiminde.

Burada biraz kusmak istiyorum Sosyal Web kelimesini Çince'ye Çinceye çevirmenin yanlış olduğunu düşünüyorum. Çünkü Sosyal, toplumu yansıtır.Sadece sosyal bir ilişki değil, tüm sosyal hayatın bir haritasıdır.Sadece insanlar ve kimleri bilir arasındaki bir ilişki değildir. Bu, belgelerden gerçek topluma Web'in ilk adımıdır. 30

Web Data Web Semantic SearchSiri Amazon echo

2020 2030 Intelligent Web 2030

2040 Meme Tim Berners-Lee

Social Machine Tim Berners-Lee 1999 Social Machine Tim Jim Hendler Social Machines Social Machine

Web Tim Berners-Lee Tim Berners-Lee 30 proposal 50 2040

Web Tim Berners-Lee Web 25

1994 Tim Berners-Lee W3CWeb

baojie@memect.co

27 Mart'ta Xinzhiyuan Açık Kaynak Ekolojik Yapay Zeka Teknolojisi Zirvesi ve Xinzhiyuan 2017 Girişimcilik Yarışması Ödül Töreni görkemli bir şekilde düzenlendi. "BAT" dahil olmak üzere Çin'in ana akım AI şirketleri ve 600'den fazla sektör eliti 2017 Çin'e ortak katkıda bulunmak için bir araya geldi Yapay zekanın gelişimi güçlü bir darbe aldı.

Elinde plastik bir oyuncak tabancayla silahlı adam "sakinleşecek" bir yer bulmak istediğini söyleyerek onu soydu ... Netizen: dileğini aldı
önceki
PetroChina ve Sinopec arasındaki fark nedir? Sonunda bugün öğrendim
Sonraki
Sürprizlerle dolu alışveriş merkezlerinin bir listesi, HİGGE'yi birlikte bulalım değil mi?
Çalışmanız faydasız, çalışkanlığınız değersiz mi? Çünkü bu noktada kaybettin
Jingdezhen Sergi Haberleri "Yoldaş Mao Zedong'un Doğumunun 125. Yıl Dönümü Anısına Sevgiyle Büyük Adam-Seramik Eserlerini Anımsatan Porselen Dili Sergisi" yakında başlayacak
12 Inamori Kazuo'nun yönetiminin yorumu
Birini bekle, "Dünyanın Sonu" nu görmek için bana eşlik et
Hokkaido için bir gezi rehberi yapmanın ne kadar zor olduğunu biliyor musunuz?
170 milyon cevapsız! Brezilyalı yıldız acı kusuyor: Süper Lig'e gitmediğim için üzgünüm, para kazanma fırsatı gitti!
Lin Yuanqing, Xiaodu'nun en güçlü beyin arzusunun üç prensibini çözdü ve Baidu AI, Wu Enda sonrası dönemde ortaya çıktı.
Araba izinsiz bir "haydut kancası" ile monte edildi ve arkadaki araçla arkadan çarpışma oldu. Sorumlu kim?
90'lardan sonra kolay değil! Metro istasyonundaki kadın bayıldı ve uyandı hemen şirkete koştu, sadece ...
Liang Dong: Tencent neden uzun yıllardır "yanlış anlaşılıyor"?
Jiangnan'ın ağır zevkinde felsefe, bir hafta sonunu sos ve pirinç şarabı havasında geçirin
To Top