Zhihu: Patlayıcı internette, değerli bilgiler mutlak bir kıtlıktır

Içerik kaynağı: 27 Nisan 2018'de 10. Küresel Mobil İnternet Konferansı'nda (GMIC) Li Dahai, "Yapay Zeka Algoritması ve İnsan Değeri" başlıklı bir açılış konuşması yaptı. Ortak olarak Not Defteri, organizatör ve konuşmacı tarafından incelenip yetkilendirildikten sonra piyasaya sürülür.

Conta tasarımı | çobanpüskülü Sorumlu editör | Jiaqi

Madde 2156 İyi ayrıntılı makale: 4502 kelime | Okumak için 6 dakika

İlk olarak tüm ağda, eksiksiz notlar, ürün operasyonu

Bu makalenin güncelliği: + Tat: Domango Topları

Bay Notes sizi önce düşünmeye davet ediyor:

  • Cevabın sorduğunuz gibi olmadığı durumlarla sık sık karşılaşıyor musunuz?

  • Akıllı bir topluluk oluşturmak için AI nasıl kullanılır?

GMIC'deki paylaşıma Zhihu adına katılabildiğim için onur duyuyorum.

Derin öğrenmenin neden olduğu AI patlamasındayız ve şimdi AI algoritmaları içerik platformunun tüm yönlerinde tam olarak uygulandı ve vazgeçilmez bir parçası haline geldi.

Sektör zaten yapay zeka algoritmaları, platformun ticari değeri ve iş değeri hakkında çok konuştu. Bugün bu fırsatı sizinle yapay zekanın insani değeri hakkında konuşmak için kullanmak istiyorum.

1. Topluluk atmosferini korumaya yardımcı olacak yapay zeka algoritmalarıyla tanışın

1. Zhihu'nun statükosu

Zhihu çok basit bir başlangıç niyetinden doğdu: İnternet okyanusunun çöplerle dolu olduğuna inanıyoruz, gerçekten değerli bilginin kesinlikle kıt olduğuna inanıyoruz.

Bu konsepte dayanarak böyle bir platform inşa etmek istiyoruz: Kullanıcıların beyinlerindeki en önemli bilgileri paylaşın ve birbirlerini kullanabilir. Ek olarak, bu bilgiler hızlandırılabilir.Diğer kullanıcılar benzer sorunlar yaşadığında, ilgili bilgileri hızlı ve kolay bir şekilde bulabiliriz, böylece tüm kullanıcılar dünyayı daha iyi anlayabilir.

İnanıyoruz, Kullanıcıların bilgilerini, deneyimlerini ve görüşlerini aktif olarak paylaşmalarına izin vermek için açık ve kapsayıcı bir tartışma ortamı bulunmalıdır.

Bu nedenle, Zhihu'nun doğumunun ilk gününden bu yana, iyi bir tartışma ortamı sağlamak için operasyonları ve ürünleri kullandık.Aynı zamanda, topluluk normlarının bir gereği olarak samimiyeti de dahil eden ilk topluluk biziz.

Bu karar çok önemlidir, çünkü iyi bir toplum tartışma ortamında Zhihu, Çin'deki İnternetteki en büyük bilgi paylaşım platformu haline gelmiştir.

Bu yılın Mart ayı sonu itibariyle, Zhihu'nun 140 milyon kayıtlı kullanıcısı var.Platformumuzun günlük 34 milyondan fazla aktif kullanıcısı var.Kullanıcılar Zhihu hakkında 23 milyon soru sordu ve yaklaşık 100 milyon cevap aldı.

Zhihu'da insanlar ve içerik arasındaki bağlantı ve insanlar ile içerik arasındaki bağlantı patlayıcı bir duruma ulaştı. Zhihu, 140 milyon sakini ve turisti olan süper bir şehir olarak kabul edilirse, bu şehrin yasaları ve düzenlemeleri Zhihu'nun toplum normlarıdır.

2. AI uygulamalarının avantajları

Bu büyüklükteki bir şehirde, yasaları ve düzenlemeleri manuel olarak sürdürmek verimsiz olmalıdır, bu nedenle küçük uşaklardan oluşan Zhihu ekibinin topluluk atmosferini korumasına yardımcı olmak için en yeni AI algoritma teknolojisini tanıttık.

Çözmek istediğimiz problemlerin hepsi doğal dil işleme (NLP) alanındaki problemlerdir. NLP alanındaki AI sonuçları olağanüstü olmasa da, Zhihu'nun AI uygulamalarında iki büyük avantajı vardır.

bir taraftan, Zhihu, çok yüksek kaliteli bir Çin külliyatına sahip olmuştur ve yalnızca çok sayıda yüksek kaliteli soru ve cevap metnine sahip değildir. Aynı zamanda, kullanıcının Zhihu üzerindeki davranışı da çok önemli bir veridir.

Bunu nasıl anlayabilirim? Kullanıcılar içerik üretmek ve tüketmek için Zhihu'ya geldiklerinde, bu topluluğu da inşa ediyorlar çünkü davranışları topluluk sisteminin bir parçası.

Örneğin, kullanıcının bir cevabı onaylaması veya onaylamaması, herhangi bir içeriğin raporlanması, soruların ve konuların kamuya açık olarak düzenlenmesi, vb., Bir dereceye kadar, hepimiz bunu ilgili metin külliyatını işaretlemek olarak görebiliriz.

Bu tür ek açıklamalarla, daha iyi bir anlamsal temsil elde etmek için denetimli makine öğrenimi algoritmalarını kullanabiliriz, böylece dil anlayışımız daha yüksek bir seviyeye ulaşabilir.

Ek olarak, pozitif bir kapalı döngü oluşturacaktır. Zhihu'nun iyi topluluk atmosferi nedeniyle, kullanıcıların Zhihu'daki davranışlarının çoğu yüksek kalitededir.

Bu yüksek kaliteli davranışlarla, Zhihu'nun tartışma ortamını sürdürmek veya geliştirmek için AI algoritmalarını kullanmamız için daha elverişli olan yüksek kaliteli açıklama verilerine sahip olacağız.

diğer yandan, Yedi yıldan fazla bir süredir çalıştıktan sonra, Zhihu ekibi zengin bir topluluk yönetimi deneyimi geliştirdi. Bir topluluğun normlarının formüle edilmediğini, platform ve kullanıcılar arasında keşfedilmesi gerektiğini biliyoruz.

Topluluk normlarını keşfetme sürecinde, farklı kullanıcıların farklı taleplerini anladık ve ardından normları, bu farklı taleplere göre çeşitli karmaşık ve değiştirilebilir senaryolara uyarladık.

Bu zengin deneyimler, Zhihu'nun atmosfer yönetimi için AI algoritmalarını kullanması için sağlam bir temel oluşturdu ve AI algoritmalarının uygulanması için çok faydalıdır.

3. Yapay zekanın çözebileceği sorunlar

Çünkü atmosferin büyük ve boş problemini çok sayıda küçük ve net hedefe ayırabilir, bu problemin zorluğunu azaltabilir ve çözülebilir bir problem haline gelebilir.

Topluluk atmosferine zarar veren bazı örneklerden bahsedeyim:

Birincisi, soru olmayanlara cevap vermektir. Sözde cevapsız soru, noktaya ulaşmadan sorudan uzak bir cevaptır. Bu cevaplar genellikle değersiz bilgilerdir ve hatta bazıları duygusaldır. Dolayısıyla okuyucular bu tür geçersiz bilgiler gördüklerinde aslında zamanlarını boşa harcıyorlar.

İkinci tür dostça olmayan yorumlardır . Başka bir şekilde düşünün, eğer bir yazarsanız ve bir cevap yazmak için uzun bir zaman harcadıysanız, ancak yorumlar alanı dostça olmayan cevaplardır.Nasıl hissediyorsunuz? Bir okuyucu olarak bile, her harika cevabı gördüğünüzde, aşağıdaki tartışma alanı o kadar puslu bir atmosferde ki bu sizin için iyi bir deneyim değil.

Üçüncü tip yin ve yang tuhaflığıdır. Bu çok önemli görünmese de deneyimlerimize göre içerik oluşturucunun yaratıcı tutkusuna ve yaratıcı deneyimine daha da fazla zarar verecektir.

Tabi cemaatin atmosferine zarar veren örnekler sadece bunlar değil, sadece size temel bir algısal anlayış kazandırmak için bunlardan bahsediyorum.

İki yıldan fazla çalıştıktan sonra, artık çevrimiçi olarak hızlı ve gerçek zamanlı olarak yanıt verebilen ve ayrımcılık, kötü niyetli etiketleme, kötüye kullanım ve diğer düşük kaliteli içerikler gibi soru içermeyen ve dostça olmayan içeriklerle başa çıkabilen algoritmik bir robot olan Wali'yi geliştirdik. Zhihu uşak ekibinin, kullanıcılara düşük kaliteli ve alakasız içeriğin neden olduğu müdahaleyi azaltmasına yardımcı olmak ve kullanıcılara insani bakım sağlamak için elimizden geleni yapacağız.

2. Algoritmik Robot: Wali

Şu anda, Wali'nin doğruluğu bazı sahnelerde% 99,13'e ulaşabilir. Bu çalışmada iki yönümüz var:

  • İlk olarak, farklı alanlarda doğruluğunu ve geri çağırma oranını daha da iyileştirin;

  • İkincisi, doğruluk oranının sağlanması temelinde, Wali robotunun uygulama kapsamını sürekli olarak iyileştirin.

1. Kullanıcıların derin katılımı

Wali Robot'un yeteneklerinin iyileştirilmesi, kullanıcılarımızdan ayrılamaz. Kısa süre önce 50.000 kullanıcının katıldığı bir "itiraz etmek için makul" özelliği kapalı beta başlattık. Sözde "makul muhalefet", kullanıcının itirazı tıkladığında, itirazın nedenlerini de seçtiği anlamına gelir; bunlara gerçek hatalar, cevapsız sorular, duyguları tahrik etme ve açıklamama.

Her kullanıcının seçimi Wali'nin öğrenmesi için bir fırsattır. Kullanıcı seçimi yargısı ve Wali'nin dahili test sırasında akıllı öğrenmesinin birleşimiyle, sorulmayan toplam 20.000'den fazla yanıtı işledik.

2. Modeli yükselt

Walli robotumuzun teknik açıdan nasıl yapıldığından kısaca bahsedeyim.

Kısaca açıklamak için sorunun cevabını örnek olarak alın:

Bu problemi ilk çözdüğümüzde rastgele orman modelini kullandık: Rastgele orman nedir? Basitçe ifade etmek gerekirse, birçok sınıflandırma ağacından oluşan bir orman oluşturmak için rastgele bir mekanizma kullanır Sınıflandırma ağacı, bu örneği sınıflandırma için her ağaca yerleştirmektir.

Örneğin: Zhihu ile ilgili bir soruyu tartışın, Zhihu'nun maskotu köpek mi yoksa tilki mi? Her ağacın kendisine oy vermesine izin verin. Bu modeli tamamladıktan sonra,% 97 gibi çok yüksek bir doğruluk oranına ulaşarak iyi bir sonuç elde ettik.

Ancak iki sorun var:

Birincisi, hatırlama oranı sadece% 58, yani "kötü adamları" özleyeceğiz ve hatta sorulmayan bazı cevapları koyacağız. Bu durumda, kullanıcılarımıza kötü bir deneyim getirecek, bu nedenle geri çağırma oranı bizim önemsediğimiz bir şeydir.

İkinci olarak, bu model, kullanıcıların davranışlarının istatistiksel özelliklerini kullanacaktır ve cevaplamak için kaç kullanıcının tıkladığını veya özellikleri bildirmek için tıkladığını görmemiz gerekir. Ancak bu özelliği kullanırsanız, cevabın yanlış olup olmadığına karar vermek için yeni bir cevabı sınıflandırdığınızda, buna karşı tıklayıp tıklamadığınızı veya çevrimiçi olarak bildirip bildirmediğinizi görmek için bir süre çevrimiçi olarak tutmalısınız.

Çevrimiçi olduğu için bu bir sorundur. Cevap gerçekten yanlışsa, kullanıcının cevabı görme deneyimi gerçekten incinmiştir ve zaman farkı vardır.

Bu nedenle, ağ yapısının ifade yeteneğini geliştirmek için ikiz model fikrine dayalı bir model geliştirdik. Aynı zamanda, kullanıcı davranışının yukarıda belirtilen istatistiksel özelliklerini kullanmaktan kaçınmak için özellikleri seçerken çok dikkatli bir şekilde değerlendirildi.

Nihai sonuç şudur:

Geri çağırma oranında% 60'tan% 80'e çok büyük bir iyileşme var. Aynı zamanda, herhangi bir cevap gönderildiği sürece, cevabın yanlış olup olmadığına bakılmaksızın hızlı bir şekilde sınıflandırılabilir.

Tabii ki eksiklikleri de var, doğruluk oranı düştü. Ancak bu senaryoda, bu boşluğu doldurmak için diğer iş stratejilerini birleştirebiliriz. Sonunda eski modelin yerine yeni bir model çıkardık.

Algoritma ekibimiz bu ay Zhihu sütununda Walli Robot'un Zhihu'daki çalışmalarını daha ayrıntılı olarak açıklayan üç makale yayınladı. Eğer ilgileniyorsanız, sütuna bir göz atabilirsiniz.

Özellikle sizinle senkronize olmak ve yin ve yang tuhaflığı alanında biraz pratik yapmak istiyorum, çünkü bu çalışma tamamlanmamasına rağmen bu çok zor ve çok ilginç bir problem.

3. "İronik" tanıma algoritması

Yin ve Yang'ın tuhaflığı ironidir. Üzerinde durduğumuz düşünme ilk önce derin anlamsal anlayışa, yani anlambilimsel analize dayanmalıdır, ancak bu yeterli değildir.

Bizim pratiğimizden, genellikle aynı cümle, iki iyi arkadaş arasında olursa, şaka ve flört olabilir. Ancak iki yabancının arasındaysa, düşmanca veya düşmanca olmalıdır. Bu düşünceye dayanarak, iki yönden kapsamlı bir şekilde yargılayacağız.

İroni konusunu sizlerle paylaşmak istememin nedeni, bunun duygu analizi alanında sınır meselesi olması ve çok zor olması. İroni, olumsuz anlamı ifade etmek için tamamen olumlu bir kelime olduğu için çok ileri bir söylemdir, robotların anlaması zordur.

Eğitimde, metin özellikleri, bazı sayısal özellikler, ironik kelime bilgisi ve bazı ifade özellikleri dahil olmak üzere içeriğin kendi özelliklerini mümkün olduğunca modele entegre edeceğiz. Ancak kullanıcı istatistiksel özelliklerini içermeyecektir.

Kullandığımız ağ topolojisi modeli, CNN (Evrişimli Sinir Ağı) ve LSTM (Uzun Kısa Süreli Bellek, bir zaman tekrarlayan sinir ağı) kombinasyonudur. En önemli şey aslında son kısımdır. Sınıflandırma katmanında, ek açıklama verilerini oluşturmak için çok sayıda tutarlı külliyat kullanıyoruz. Bu, daha önce bahsettiğim kullanıcı davranışıdır.

Basitçe söylemek gerekirse, bir yorumda çok sayıda iyi kullanıcı varsa ve hepsi itiraz ediyorsa, bunun olumsuz olduğunu düşünebiliriz. Birçok kullanıcı başka bir yorum üzerinde hemfikir olursa, bu olumlu olabilir.

Buna dayanarak büyük miktarda ek açıklama verisi oluşturabiliriz, ancak hala bu çözümün geliştirme sürecindeyiz.Sonuçlar alındıktan sonra Zhihu sütununda yayınlayacağız, buna da dikkat edebilirsiniz.

Elbette bu problem daha zor ... Uzun zaman alacak birçok detaylı problemi çözmek zorunda kalabiliriz. Bununla birlikte, büyük ve yüksek kaliteli kullanıcı davranışı verilerinin analizi ve öğrenilmesi yoluyla, Zhihu'nun, duygu analiziyle boğuşan "ironinin tanınması" nı kırma fırsatına sahip olmak için anlambilim ve kullanıcı ilişkilerinin iki yönünü daha derin bir şekilde anlayıp modelleyeceğine inanıyoruz. Alandaki en yeni konular. Bu, Çin İnternetinin ve hatta dünya İnternetinin tartışma ortamını olumlu bir şekilde teşvik edecektir.

Yukarıdakiler, AI algoritmaları ve insani değerler hakkındaki paylaşımlarımdan bazıları. Açık ve hoşgörülü bir atmosfer çok önemli, gelişen bir kültürü beslemek için çok önemli bir toprak. Tabii ki Zhihu, bir teknoloji şirketi olarak, yalnızca bu alanda yapay zekayı kullanmakla kalmıyor, aynı zamanda Zhihu'nun içerik üretiminde, dolaşımında ve tüketim bağlantılarında da yaygın olarak kullanılıyor.

3. Akıllı bir topluluk oluşturun: AI derin katılımı,

Daha hassas ve verimli bağlantılar elde etmek için teknolojiyi kullanın

Bir sonraki planımız, akıllı bir topluluk oluşturmak için insan ve makineyi birleştirmek için yapay zekayı kullanmak.

Daha değerli sorular sorulsun, cevap vermeye en uygun kullanıcıları davet edin, içgörü ve deneyim paylaşma konusunda daha fazla istek uyandırın, daha profesyonel ve ciddi bilgilerin önerilmesine izin verin ve daha fazla kişinin merakını tatmin etsin, 140 milyon kayıtlı kullanıcının ve hatta yüz milyonlarca netizenin birbirine bağlanmasına izin verin.

Bu, Zhihu'nun çok çalıştığı ve başlangıçta oluşturduğu Zhihu akıllı topluluğu ve aynı zamanda Zhihu'nun asıl niyeti ve uzun vadeli vizyonudur. Bu yüzden uzun zamandır ne yaptığımı biliyorum Her şey bu benzeri görülmemiş bağlantıyı kurmak ve birbirimizin ihtiyaçlarını karşılamak içindir.

Çok uzak olmayan bir gelecekte, Zhihu'ya gelen herkesin ilgilendiği kişileri ve içeriği hızlı bir şekilde görebileceğine ve sorularının hızlı bir şekilde cevap vermeye istekli ve muktedir olanlara gönderilebileceğine inanıyoruz. Ayrıca, kendisini bir dava açmaya, yalnızca kendisinin en iyi bildiği bilgileri paylaşmaya, kendisi için en tatmin edici ve hoş tanınırlığa sahip olmaya ve tanışmayı umduğu insanlarla değerli alışverişler ve tartışmalar yaratmaya istekli kılan iyi sorunla hızlı bir şekilde karşılaşacaktır. Anlaşmazlıklar bile.

Bütün bunlar bu çağın düşüncesi ve özeti olacak. Eşi görülmemiş bir verimlilikle düşünme bağlantıları oluşturacağız, Böylece her bireyin düşünce ve deneyimi hızla paylaşılabilir, taranabilir, özetlenebilir ve bu çağın bilgisine dönüştürülebilir. Bununla birlikte, bilgi üretim yöntemi ve yinelemeli verimlilik bu bağlantı altında niteliksel değişikliklere uğrayacaktır. Akıllı bir topluluk olarak düşündüğümüz şey bu.

Böylesine akıllı bir topluluğu yönetme sürecinde, çok iyi verilere sahibiz ve sorunlar açık. Asıl zorluk insanlarda yatıyor.

Çözülmesi gereken sorunların zorluğuyla karşılaştırıldığında ekibimiz çok iyi; ancak bu sorunların sayısı ile karşılaştırıldığında insanlarımız hala görece küçük. Bu nedenle, sektördeki güçlü insanların Zhihu'yu insani değere sahip akıllı bir topluluk haline getirmek için bize katılacağını umuyoruz.

hepinize teşekkür ederim.

Bu makale "Notesman" dan. WeChat'te "Notesman" araması yaparak takip edin. Bize "Toutiao" dan olduğunuzu söylemeyi unutmayın.

Çin'in altın rezervleri 27 ayda ilk kez arttı, ABD borcu dertte ve ABD dolarının görmek istemediği şeyler oluyor
önceki
Çocukluğunuzun geçtiği Norveç'e gidin!
Sonraki
Feng Xiaoting, Ronaldo tarzı bir kutlama rüyasında hedefi patlattı! Netizenler yorumu: Ronaldo'ya hakaret etmeyin!
Ana markalarının 19 yıllık yeni araba planları ortaya çıktı! Changan CS85 ve Lynk & Co 04 geliyor!
Romantikler için önerilen Yunanistan'da dokuz güzel yer
Çifte yenilik ve çifte onarım devam ediyor | Jingdezhen: ülkenin güzel manzarası
Neden Japon arabaları nadir bulunurken Alman arabalarının arka sırası şişkin? Buna ne sebep oldu?
Şiir Yılların Mezmurları: Çok kısa, çok güzel
Rakip ilk olmaya devam ediyor, şok edici karşı atağı 2 yılda nasıl tamamlıyor? Junzhi Danışmanlık Yao Rongjun
Jiangxi Kamu Güvenliği | Rüzgar ve soğukla mücadele, buzla ve karla mücadele, bu cesur adamlar arasında bir yarışmadır
Kamboçya'daki Angkor Wat, ömür boyu mutlaka ziyaret edilmesi gereken bir yer!
AI girişimlerinin ortalama fiyatı 25-50 milyon ABD doları ve mühendislerin ortalama fiyatı 2,5 milyon ABD dolarıdır
Lütfen kışın Kuzeydoğu'ya gitmeyin! Hahahahaha
Fuzhou'da cazibeyle dolu 10 sokak ve sokak, ağır atmosferi hissedin
To Top