Tencent Zhiwen ekibinin başkanı Zhong Li: 0'dan 1'e, yeni nesil akıllı diyalog motorunu yaratmak için CCF-GAIR 2018

AI Technology Review Press : 2018 Küresel Yapay Zeka ve Robotik Zirvesi (CCF-GAIR) Shenzhen'de düzenlendi.Zirve, Lei Feng.com ve Hong Kong Çin Üniversitesi (Shenzhen) ev sahipliğinde Çin Bilgisayar Topluluğu (CCF) ev sahipliğinde gerçekleştirildi ve Shenzhen Baoan Bölge Hükümeti'nden güçlü rehberlik aldı. Yerli yapay zeka ve robotik, akademi, endüstri ve yatırım olmak üzere üç ana alanda üst düzey bir değişim etkinliği ve yerli yapay zeka alanında en güçlü sınır ötesi değişim ve işbirliği platformunu oluşturmayı hedefliyor.

1 Temmuz sabahı NLP oturumunda, Tencent Zhiwen Algorithm'in başkanı Zhong Li, "0'dan 1'e Yeni Nesil Akıllı Diyalog Motorunu Oluşturmak" başlıklı bir açılış konuşması yaptı.

Tencent'in Zhiwen algoritmasının başkanı olan Zhong Li, akıllı diyalog sistemiyle ilgili araştırma deneyimlerini sizinle paylaştı.

Endüstride genel bir akıllı soru cevaplama platformu oluşturmanın genellikle aşağıdaki üç tür soru ve cevabı çözmesi gerektiğini söyledi: biri göreve dayalı, diğeri bilgi edinme ve üçüncüsü genel küçük sohbet.

İkinci türe, yani soru cevap sisteminin kullanıcının bilgi edinme problemini çözmesine nasıl izin verileceğine odaklandı. Bu tür etrafında, akıllı soru cevaplama sisteminin temel yapısını ve burada denetimsiz öğrenmenin ve denetimli öğrenmenin rolünü açıkladı.

Bundan sonra, endüstride daha yaygın olan hızlı geri çağırma şemalarını detaylandırdı: ilk yöntem kelime saymaya dayanır (Sözcüksel terim sayma); ikinci yöntem dil modeline dayanır; üçüncü yöntem vektörleştirmeye dayanır.

Konuşmanın sonunda, Zhiwen ekibinin sektörün soru-cevap sistemini kurmadaki bilgi ve deneyiminden bahsetti.

  • Öncelikle Baseline'a önem vermeliyiz.

  • İkinci olarak, tüm sürecin ardışık düzenini olabildiğince erken oluşturun.

  • Üçüncüsü, bedava öğle yemeği teoremi yoktur ve evrensel bir algoritma yoktur.

  • Dördüncüsü, alanla ilgili veri hazırlama ve veri temizleme çok önemlidir.

Aşağıdakiler, orijinal niyetini değiştirmeden Leifeng.com tarafından düzenlenen Zhong Li'nin konuşmasının içeriğidir.

Herkese merhaba, ben Zhong Li, Tencent Zhiwen'in sorumlu kişisiyim ve bugün burada durmaktan, ekibimizin geçen yıl akıllı soru-cevap oluşturma konusundaki deneyimlerinden bazılarını sizinle paylaşmaktan onur duyuyorum. Önceki öğretmenler, akademik bir bakış açısıyla doğal dil işleme teknolojisinin en son gelişiminden bahsetti ve sektörde kullanılabilecek akıllı bir soru-cevap platformunun nasıl oluşturulacağı hakkında daha fazla konuşacağım.

Öncelikle ekibimize kısa bir giriş yapacağım Ekibimiz uzun süredir kurulmuyor ve bir yıldan az bir süredir üyelerimiz dünyanın her yerinden geliyor. Araştırmamızın odak noktası, doğal dilin akıllı etkileşimidir.Bu araştırma odağının çağrışımı ve uzantısı etrafında, soru-cevap, diyalog ve arama alanlarında bazı keşifler ve girişimler yaptık.Ayrıca AAAI, IJCAI, SIGIR, EMNLP gibi akademisyenlerle de ilgileniyoruz. Konferansta birçok bildiri yayınlandı. Finans sektörü için akıllı müşteri hizmetleri çözümleri oluşturmak için Tencent Financial Cloud'daki meslektaşlarımızla, Tencent Video Cloud'daki meslektaşlarımızla da genel sektörler için küçük ve mikro akıllı müşteri hizmetleri çözümleri geliştirdik, ayrıca Tencent Cloud içerik anlayış ürünleri geliştirdik ve destekledik.

Aşağıdaki resim Microsoft'tan Bay Zhou Ming'in bir fotoğrafı ve aynı zamanda benim de çok katılıyorum bir sınıflandırmadır. Sektörde genel bir akıllı soru cevaplama platformu oluşturduğumuzda, aşağıdaki soru ve cevap türlerini çözmemiz gerekiyor:

İlk tür göreve dayalıdır. Bu tür genellikle kullanıcının hava durumunu kontrol etme, döviz kurunu kontrol etme gibi bazı görevleri tamamlamak istemesidir.

İkinci tür, kullanıcı bilgisi edinme sorununu çözer. Bu tür aynı zamanda bu sefer paylaşımımızın odak noktası ve biz esas olarak bu noktayı genişleteceğiz. Bu aynı zamanda sektörde en çok kullanılan soru-cevap sistemi türüdür.

Üçüncü tür, genel küçük sohbet türü. Örneğin, Microsoft'un Xiaobing'i ve Apple'ın Siri'si genel sohbeti destekler. Genel sohbetin eklenmesi, diyalog sistemini daha insancıl hale getirecektir.Ayrıca, profesörler tarafından bahsedilen duygusal bilgiler dahil, kişiselleştirilmiş bilgiler ve kullanıcı profili bilgileri de ekleyebilirsiniz.

Bugün, ikinci tür soru ve cevabı paylaşmaya, yani soru cevap sisteminin kullanıcının bilgi edinme problemini çözmesine nasıl izin verileceğine odaklanacağım. Bu bir soru cevap olarak kabul edilebilir Soru cevap alanında veriler üç türe ayrılabilir:

Birincisi, SSS ve KG gibi standart tabanlı, yapılandırılmış bilgidir. SSS sık sorulan sorulardır, KG, her ikisi de göreceli olarak yapılandırılmış veri türleri olan organize bir bilgi grafiğidir.

İkincisi, veriler, tablolar ve belgeler gibi yapılandırılmamış formlarda bulunur.

Üçüncü tür, VQA gibi çok modlu, çapraz medya soru ve cevabıdır veya bir video ve sesli soru ve cevap külliyatı olabilir.

Ardından, yapılandırılmış SSS'de nasıl akıllı bir soru ve cevap sistemi oluşturduğumuzdan bahsedelim.

Aşağıdaki şeklin sağ tarafında gösterilen çok genel bir çerçevedir, bu çerçeve arama motoru çerçevesine çok benzer, esas olarak aşağıdaki modülleri içerir:

Birincisi problem işleme modülüdür Bu modülün çalışmaları sorgulama, sorgulama yeniden yazma, yanlış kelime düzeltme ve eşanlamlı değiştirmeyi içerir. İkinci adım, SSS'deki belgeleri geri çağırmaktır. Asıl amaç, hızlı bir şekilde geri çağırmaktır, geri çağırma oranı yüksek olmalıdır, doğruluk nispeten düşük olabilir ve daha az alakalı bilgi geri çağrılabilir. Ondan sonra bir maç yapacağız.

Bunun aramadan farkı nedir? Arama, arama sonuçlarının bir listesini alır, liste tabanlı değerlendirme gibi birçok değerlendirme yöntemi vardır ve ardından arama sonuçlarının kalitesini değerlendirmek için bazı göstergeler kullanır. Sorular ve yanıtlar daha zahmetlidir. Bazen liste gösterimi yoktur, yalnızca bir cümle veya yalnızca bir yanıt vardır. İlk 1'in doğruluğunu takip etmemiz gerekir ve eşleştirme gereksinimleri daha yüksek olacaktır.

Burada bahsedilen iki yöntem vardır: denetimsiz öğrenme ve denetimli öğrenme Hızlı bir şekilde hatırlamak için denetimsiz öğrenmeyi kullanabilirsiniz, ancak denetimli sinyallerin eklenmesi, eşleştirme doğruluğunu büyük ölçüde artırabilir.

Bize popüler olan veya sektörde daha çok kullandığımız hızlı geri çağırma şemalarından bahsedin.

İlk yöntem, Sözcüksel terim sayımına dayanır. Herkes bu tür bir yönteme aşinadır.Literal eşleştirmeye dayanır.Avantajı, çok basit ve uzun kuyruklu kelimelere karşı iyi bir sağlamlığa sahip olmasıdır.Standart soruda göründüğü sürece, eşleştirme sırasında geri çağrılabilir. Ancak eksiklikleri açıktır, sembollere dayanmaktadır ve anlamsal bir anlayışa sahip değildir, bu nedenle benzer anlambilimlere sahip farklı edebi ifadelerle uğraşmak zordur.

İkincisi, dil modeline dayalı olarak ana fikir, bilgi tabanındaki SSS ve kullanıcı sorgularından hangisinin olasılığa daha yakın olduğunu belirlemek için olasılıklı yöntemler kullanmaktır. Gerçek savaş performansı daha iyidir, ancak dil modeli parametrelerinin optimizasyonuna çok duyarlıdır, bu nedenle çok sayıda yumuşatma deneyi yapılmalıdır.

Üçüncü yöntem vektörleştirmeye dayanmaktadır. Kullanıcının sorularını böyle bir vektör uzayına yansıtıyorum ve bilgi tabanının SSS bölümünü bu vektör uzayına yansıtıyorum ve vektör uzayında ölçüm yapmak için uzaklık yöntemini kullanıyorum. Şu anda, vektörü çıkarabilen veya diğer bazı yöntemlere göre vektörleştirebilen matris tabanlı ayrıştırma gibi birçok projeksiyon şeması vardır.Ayrıca, vektör uzayında mesafeyi hesaplamanın, ikisini hesaplamak için ortalama toplamı gibi birçok yolu vardır. Noktalar arasındaki mesafe.

KİS, 2015 yılında yapılan bir çalışmadır. Bu mesafeyi hesaplamak için bazı yeni yöntemler kullanır.Bu yöntem basit ortalamadan daha iyidir. Ama bir sorun var, bu yöntem belirsizliği çözmek için pek iyi değil.

Önce TF-IDF'den bahsedeyim, bu fikir çok sezgisel. TF, mevcut belgedeki sözcüğün sıklığını belirtir ve IDF, sözcüğün doğasını belirtir. IDF çok yüksekse, kelimenin nispeten benzersiz bir kelime olduğu anlamına gelir.Görece düşükse, birçok belgede yaygın olduğu ve nispeten genel bir kelime olduğu anlamına gelir. TF-IDF skorunu elde etmek için çarpabiliriz.

Dil modelinin temel fikri, cümleleri olasılık dağılımı şeklinde tanımlamaktır. Dil modelleri, makine çevirisi ve yazım hatası düzeltme gibi birçok yerde yaygın olarak kullanılmaktadır. Hangisinin daha olası olduğunu belirleyebilir. Kendi hatırlamamıza göre, mevcut kullanıcı Sorgusunun olasılığını belgeye veya standart SSS'ye göre oluşturuyoruz ve ardından puanı belirliyoruz.Bu, IR'de kullanılan dil modelinin temel fikridir.

Çözülmesi gereken sorun ve karşılaşılan zorluk, kullanıcı Sorgusundaki sözcüğün SSS'de görünmemesinin çok muhtemel olmasıdır, bu nedenle aşağıdakileri düzeltmemiz gerekir - ya sözcük görünürse, ya görünmezse.

Farklı yumuşatma yöntemleri, farklı dil modellerine karşılık gelir. Pratik bir bakış açısından, TF-IDF ve dil modelini karşılaştıran dil modelinde görece büyük bir gelişme var Şeklin sağındaki karşılaştırmalardan beşinin önemli gelişmeler kaydettiğini görebilirsiniz.

Kelime kaydırma mesafesi yönteminden az önce bahsettiğim gibi, bu yöntem KİS'dir, ağırlıklı ortalamaya dayalı yöntem nispeten basittir, burada esas olarak KİS ile ilgilidir. Yansıttığımız her kelime mesafeyi hesaplamalı ve sadece bu kelimeyi ve yayılacak tüm kelimeleri ağırlıklandırmak yerine kelimeye en çok benzeyen kelimeyi bulmalıyız.

Bu örneğe baktığımızda "Obama" kelimesi için Obama'ya en yakın kelime başkan ... Bu kelimeyi hesaplarken en küçük mesafeyi bulmalısınız. Bu biraz seyahat problemi gibi.Buradan oraya taşınmam gereken bazı eşyalarım var.Her hareket ettiğimde minimum mesafeyi bulmam ve bu mesafeleri toplamam gerekiyor.

KİS'in etkisini aşağıdaki şekilden görebilirsiniz: Birçok değerlendirmede, hata oranı nispeten düşüktür, diğer yöntemlerden yaklaşık yüzde on ila yirmi puan daha düşüktür. Gerçek etkisi gerçekten iyidir, ancak algoritma karmaşıklığı nispeten yüksektir, çünkü hesaplamak için tüm ikili karşılaştırmaları yapması gerekir, biraz daha uzun sürecektir. En büyük gereksinimlerimizden biri hızlı olmaktır.KİS hakkında uzun araştırmalarımız var.İlgilenen öğrenciler aşağıdaki işlere dikkat etmeye devam edebilirler.

Az önce bahsettiğim şey hızlı hatırlama, bir sonraki kilit nokta derin eşleştirme yapmak. Çoğu denetimli eşleme olmak üzere birçok derin eşleştirme yöntemi vardır, bunlardan biri Siyam ağı ve diğeri etkileşim matrisine dayalı ağ olmak üzere iki yöntem daha vardır.

CNN gibi ARC-1, Siyam ağının tipik bir örneğidir. Siyam ağı nispeten sezgiseldir. Fikri çok basittir. İki girişi tek bir ifadede yapmak için aynı kodlayıcıyı kullanın. İfade yapıldıktan sonra, benzer yapmak için bir modül kullanabilirsiniz Derecenin hesaplanması, ağ yapısı ve parametrelerinin paylaşılmasıyla karakterize edilir. Sağdaki özel uygulama, Kodlayıcıyı uygulamak için CNN'yi kullanabilirsiniz.

Etkileşim matrisine dayalı ağ arasındaki fark, alaka ölçüsünün son ifadesine ek olarak, ortadaki bazı sözcüklerin, özellikle belge çok uzun olduğunda daha güçlü etkileşimlere sahip olabilmesidir. Siyam ağıyla karşılaştırıldığında, bu tür bir ağ iki soru çok kısa olduğunda bağlanır, ancak soru çok uzunsa, çok fazla içerik içeriyorsa ve bazı önemli bilgiler içeriyorsa, ağ daha iyi olacaktır. İyi bir ifade yaptığımızda, bu ifadedeki her küçük cümle arasındaki etkileşime bakacağız.

Aşağıdaki şekil daha iyi bir ağdır: Sol taraf az önce bahsedilen yapıdır ve sağ taraf ek etkileşim eklemiştir. Sol taraf çok basit.Soru ve Cevap'ı girdikten sonra, ifade matrisini, ardından vektörü ve sonunda puanı alıyorsunuz.Bu çok sezgisel bir süreçtir. Dikkatli Havuzlama ağında, etkileşim vektörün önüne yerleştirilir.Eğer etkileşim matrisinde satırın değerini ve sütunun değerini almak istiyorsanız, bunların yeniden ifadesini almalı ve ardından difüzyon puanını bulmak için son ifadeyi kullanmalısınız. Uzun belgeler için, özellikle SSS çok uzunsa, etkileşim matrisine dayalı bir ağ daha fazla bilgi getirecektir.

Yapılandırılmış belge yapımının durumundan bahsettim. Gerçek senaryolarda, çok az yapılandırılmış veri vardır, çünkü yapı insan yatırımı anlamına gelir, bu da birçok insanın veri açıklaması yapmak ve bilgi tabanı oluşturmak zorunda olduğu anlamına gelir. Şu anda daha yapılandırılmamış veriler var.Bu aynı zamanda ekibimizin araştırmasının odak noktası ve aynı zamanda yapılandırılmamış belgelerde bilgi ve cevapların nasıl bulunacağına dair çok umut verici bir yön.

Çok benzer bir alan, aşağıdaki türlere sahip olan makine okumayı anlama alanıdır:

  • Cloze. Makalede birkaç varlık kelimesi kazın ve varlık kelimelerini doldurmak için model algoritmasını kullanın.

  • Çoktan seçmeli. Bu makaleyi okuduktan sonra sorularım olacak ve sonra birkaç cevap olacak, bunlara karşılık gelen cevabı onlardan seçeceğim.

  • Cevap uyuyor. Genellikle bir soru verildiğinde, bu soru orijinal metinde görünür, orijinal metindeki hangi içeriğin bu soruya cevap verebileceğini bulun.

Aşağıdaki şeklin sağ tarafı, Stanford'daki ünlü SQuAD yarışması olan cevap eşleştirmenin daha tipik bir örneğidir. SQuAD şimdi 2.0'ı yayınladı. 1.0 zamanında, soruların tüm cevapları orijinal metinde yer aldı, pek çok bilim insanı bunun özellikle gerçekçi olmadığını düşündü, bu yüzden şimdi 2.0 sürümüne yükseltiyorlar. Şu anda üzerinde çalıştığımız senaryo hala cevabın orijinal metinde olduğu ve cevabın hükümete benzer bazı belgelerde, materyallerde ve belgelerde bulunabileceği gerçeğine dayanmaktadır.

Aslında gerçek okuduğunu anlamadan hala farklıyız.Sektörde okuduğunu anlama yaptığımızda önce hatırlamalıyız çünkü sorunun cevabının hangi makalede olduğunu bilmiyoruz. Burada geri alma işlemini hızlı bir şekilde yapmalıyız ve ardından bir sonraki bölüme, belge okuduğunu anlama modülüne geçeceğiz. Doküman okuduğunu anlama son iki yılda geliştirilmedi.Onunla ilgili çalışmalar uzun yıllar önce vardı.Üçlülere dayalı ilişki çıkarma yöntemi gibi geleneksel özelliklere dayanıyordu.Şimdi bazı derin model yöntemleri kullanmak istiyorum. Okuduğunu anlama yapmaya gel.

Aşağıdaki genel bir Doc Reader çerçevesidir. Son yıllarda okuduğunu anlama çerçevesi çok popüler ve ilgili birçok çalışma var. Sağdaki şekil, Google'ın en yüksek puana sahip yeni tek model QANet'ini göstermektedir. Kullanıcının tüm sorularını okuyacak bazı Kodlayıcılar olacağını görebilirsiniz. Özü Dikkattir ve kelime tabanlı gibi birçok Dikkat mekanizması ayarlanabilir , İfadeye veya zamana ve adım uzunluğuna göre dikkat. Dikkat büyük bir aşamadır, birçok yöntemi deneyebilirsiniz. Sorunun içerik bilgisini ve belge etkileşimini aldığınızda, belgenin makaledeki konumunu oluşturmak için bunu Kod Çözücü kısmına gönderin. Yani bu bir sınıflandırma problemidir, yani dosyanın başlangıcıdır, diğeri ise sonunu bulmak, dosyanın dosyanın sonu olup olmadığını anlamaktır. Bu daha genel bir çerçevedir.

Son olarak, sektördeki bazı deneyimlerimizden bahsedin.

Her şeyden önce, Baseline'a dikkat etmek çok önemlidir. Baseline'ı çok karmaşık hale getirmeyin, çünkü verileri ve sorunları Baseline aracılığıyla anlamanız gerekir.

İkinci olarak, boru hattını mümkün olan en kısa sürede inşa edin. Ardışık düzenimiz, veri işleme, model eğitimi, model yükleme, model tahmini ve model değerlendirme dahil olmak üzere eksiksiz bir sistem setidir. Değerlendirme göstergelerine ve tüm sürecin bağlantısına özellikle dikkat edin. Yalnızca boru hattı kurulduğunda yineleme için bir temel olabilir. Boru hattı yoksa, hiçbir Yinelemenin, modeli değerlendirmenin, çerçeveyi güncellemenin bir yolu yok.

Üçüncüsü, bedava öğle yemeği yok, Yitian Tulong Knife yok ve tüm problemleri çözebilecek bir algoritma yok Algoritma, uygulanabilir veri ve senaryolara sahip olmalıdır. Kıyaslamalar ve değerlendirme kriterleriyle, modelin hangi koşullar altında daha uygun olduğunu bilmek ve güçlü yönlerimizi en üst düzeye çıkarmak ve zayıf yönlerimizden kaçınmak için daha fazla model deneyebiliriz.

Son olarak, alanla ilgili veriler olmalıdır. Alanla ilgili veriler sadece eğitim verilerini ifade etmekle kalmaz, aynı zamanda alandaki uzman deneyim ve bilgisini ve alanla ilgili çerçeveler ve modelleri içerir. Deneyimlerimiz açısından, etki alanı verilerini temizleme veya etki alanı sözlükleri ve kelime dağarcığı oluşturma gibi etki alanı verilerinin optimizasyonu, modellerin getirdiği iyileştirmelerden bile daha önemli olan önemli iyileştirmeler getiriyor, bu nedenle etki alanı verilerine dikkat etmeliyiz. Meslekler.

Hepsi bugün paylaşımım için. Herkese teşekkürler!

Daha Fazla CCF-GAIR Konferansı Kayıtlı Makalesi:

AI teknolojisi inceleme raporu. Makalenin sonundaki tıklayın Orijinali okuyun AI etki faktörünü görüntüleyin.

( 0 ) Paylaşmaya hoş geldiniz, yarın görüşürüz!

27 yaşındaki kadın 4 yıldır evli ve hamile kalmamış, cildi siyah ve sertleşmiş ve sakalı var! Çünkü ...
önceki
Virgil Abloh kırmızıdan mora mı? İşte arkandaki hikaye
Sonraki
Araba yapımının sanatsal güzelliği Lexus LS 500h deneyimi
Stephen Chow ile birlikte yürütülen "Tang Bohu Spots Sonbahar Kokusu" na dönüp baktığında, Gong Li cömertçe görünmediğinden pişmanlık duyuyor.
Android P güncellemesinin Çin'deki ilk resmi sürümü! OnePlus 6 Hydrogen OS push yükseltme paketi
Makine öğrenimi konferansı ICML 2018 Stockholm'de açılıyor, adalet araştırması hale geliyor
Denim ceketler elde boyanabilir mi? Luke Vicious, yeterince dikkat çekmek için sonbahar ve kış aylarında sınırlıdır!
Tsui Hark "The Legend of Condor Heroes" filmini yapacak ve aktör Lin Gengxin olacak Bu versiyonda Yang Guo hakkında ne düşünüyorsunuz?
Honor Tablet 5 ilk çıktı, Kirin 659 hala savaşabilir mi?
Zarar eden Orange Sky Golden Harvest'ın 3,2 milyar satın alınması, dünyanın fiyatının 2 katı gerçekten aptalca mı?
Çin Bilimler Akademisi Otomasyon Enstitüsü'nden Wang Jinqiao: Yapay zeka sahnesine yardımcı olmak ve uygulamayı çeşitlendirmek için yapay zeka orta aşama motorunu derinlemesine geliştirin
Yeni Range Rover / Range Rover Sport casus fotoğraflarının ortaya çıkması veya yıl sonunda piyasaya sürülmesi
Birçok sınırlı ürünün ilk teşhiri! VETEMENTS yurtiçi sınırlı mağazasının büyük etkinliği nasıldı?
O zamanlar, Zhou Xun, Li Xiaoran ve Chen Kun, "Sis, Yağmur ve Rüzgar" ı hala hatırlıyor mu?
To Top