g u t x .com.tr İpek yolu - Çin'i anlamaya götürürüm

Soru-Cevap Algoritma Sistemi Oturumu AIS Ders Öncesi Oturumu Tam Kuru Mal Paylaşımı

AIS (ACL, IJCAI, SIGIR) 2018

Oturum 6: Soru Cevaplama

1. Lin Yankai Tsinghua Üniversitesi

Uzak Olarak Denetlenen Açık Etki Alanı Sorusunu Yanıtlama

Okuduğunu Anlama (Okuduğunu Anlama) artık bizim için çok popüler bir konu, mevcut makinenin doğal dili işleme ve anlama yeteneğini yansıtabilir. İlk olarak, makine okuma ve anlama görevlerinin belirli tanımlarına bir göz atalım. Makine okuduğunu anlama, size bir soru ve ilgili paragraflar verilmesi ve verilen paragraftan sorunun cevabını çıkarmanızdır.

Şu anda, makine okuma anlama görevlerinde çok iyi sonuçlar elde ettik. Şu anda, araştırmacılar birçok makine okuduğunu anlama modeli önerdiler ve kamusal değerlendirme görevlerinde iyi sonuçlar elde ettiler. Ancak makine okumayı anlamanın bir sorunu var: soruyla ilgili önceden bir metin vermemizi ve ardından verilen metinden sorunun cevabını çıkarmamızı gerektiriyor. Bu makine okuduğunu anlama sorunu, onu pratikte uygulamayı imkansız kılıyor. Genel olarak günlük hayatımızda soru-cevap senaryolarında bu soruyla ilgili dokümanları önceden elde etmek imkansızdır.

Bu nedenle, araştırmacılar daha pratik bir görev önerdiler: Açık Alan Soru Cevaplama ve bu görevi çözmek için bilgi alma ve okuduğunu anlama teknolojisini birleştirmeye çalıştı. Örneğin, "Pekin'in nüfusu nedir" diye bir sorumuz var. İlk olarak, bu konuyla ilgili paragrafları metin veritabanından almak için bir arama motoru (veya başka bir bilgi alma sistemi) kullanıyoruz ve sonra bu alınan paragrafları okuyup anlıyoruz. , Pekin'in nüfusu olan son cevabı çıkarın.

Mevcut açık alanlı soru cevaplama sistemi sadece bilgi alma ve okuduğunu anlama teknolojisini kullanır ve alınan paragrafları kapsamlı bir şekilde kullanmaz ve ayrıca, alınan paragraflardan hangisinin soruyla gerçekten alakalı olduğunu belirleyemez.

Bu soruna yanıt olarak, soruları insan yanıtlama sürecini temel alan verimli ve pratik bir açık alanlı soru yanıtlama sistemi önerdik. İnsanlar bir soruyu cevapladığında, önce soruyla ilgili bir dizi paragrafı almak için arama motorunu kullanacağız ve ardından soruyla ilgili paragrafları belirlemek için bu belgeleri hızlıca okuyacağız ve ardından soruyla ilgili paragrafları detaylandıracağız. Sorunun cevabını almak için tüm paragraflardaki bilgileri okuyun ve son olarak özetleyin.

Bir soru verildiğinde ve ilgili paragraflara erişildiğinde, sistemimiz önce her paragrafın cevabı içerme olasılığını vermek için hızlı bir okuma yapmak için bir Paragraf Seçici kullanır ve ardından cevabı içerebilecek paragrafta okuduğunu anlama yapar ve her birini çıkarır. Paragraftaki cevap parçası ve son olarak cevabı almak için tüm paragrafların bilgilerini özetleyin.

Deneyimiz, Quasar-T, SearchQA ve TrivialQA veri kümelerini yanıtlayan yaygın olarak kullanılan üç açık etki alanı sorusunu kullanır. Sistemimiz, üç veri setinde nispeten büyük bir iyileştirme elde etti ve ayrıca sistemimizin, en alakalı paragrafların yalnızca küçük bir kısmı ile temelde eşdeğer sonuçlar elde edebileceğini gördük. Buna ek olarak, sistemimizin ilk 5 etkisinin, ilk 1 etkisine kıyasla iyileştirilmesi için hâlâ bir düzineden fazla yeri vardır ve yanıtları yeniden sıralayarak etkisini daha da artırabiliriz.

Son olarak bir Örnek Olayı paylaşın. Soru, hangi sanatçının sol ve sağ elini aynı anda çalışmak için kullanabileceğidir.Cevabı Leonardo da Vinci'dir. Bu soruya dair ipuçları üç farklı paragrafta yer alıyor: İlk paragrafta Leonardo'nun bir sanatçı olduğundan, ikinci paragrafta Leonardo'nun sol eliyle çalışacağından ve üçüncü paragrafta Leonardo'nun sağ eliyle çalışacağından bahsediliyor. . Da Vinci olarak sorunun cevabını belirlemek için tüm bilgi paragraflarını kullanmamız gerekiyor.

Son olarak çalışmamızı özetleyin. Çalışmalarımız, insanların okuduğunu anlama şeklini modeller ve daha az paragrafla iyi sonuçlar elde edebilir. hepinize teşekkür ederim!

2. Wang Zhen Baidu NLP

Okuduğunu Anlamak için Aday Çıkarma ve Cevap Seçimi Ortak Eğitimi

Önce görev hakkında konuşayım. Burada düşündüğümüz şey, açık alanda da okuduğunu anlamadır.Bu senaryoda, birden fazla ilgili belge parçasını oluşturmak için genellikle bir soru geri alınacaktır.Bu belge parçalarına dayanarak, nihai cevap verilir. Bununla birlikte, mevcut ana akım yöntemlerin hiçbiri iyi değerlendirilemez, pek çok cevabım var.

Okuduğunu anlama örneğine bakalım. Soru ne tür bir kokteylin rom, limon ve kolayı oluşturduğudur ve cevap bedava Küba'dır. Açık alanda okuduğunu anlamanın üç özelliğini bu örnek üzerinden görebiliriz: Birincisi fazlalıktır.Doğru cevap birden çok metin parçasında görünebilir. İkincisi kafa karıştırıcıdır: Yanlış cevapların parçaları da sorudaki bilgilerle eşleşebilir. Üçüncüsü tamamlayıcılıktır Bazen bu soruyu doğru yanıtlamak için birden çok metinden alınan bilgileri kullanmamız gerekir.

Bu üç özelliği dikkate alıyor, çözümler öneriyor ve aday cevapları modelliyoruz. İlk olarak, bir dizi aday cevap üretilecek ve aday cevaplar arasındaki korelasyon dikkate alınarak nihai cevap verilecektir.

İlk olarak, önce adayların çıkarılması ve ardından cevapların seçilmesi için iki aşamalı bir yöntem oluşturuyoruz.Cevap seçimi aşamasında, adaylar ve adaylar arasındaki ilişkiyi modellemek için dikkat mekanizmasına dayalı bir korelasyon matrisi sunuyoruz. Pekiştirmeli öğrenme yöntemi ile bu iki aşamanın modelleri ortaklaşa eğitilebilir. Metodumuz gerçekten nispeten etkilidir ve okuduğunu anlamanın çeşitli veri setlerinde iyi sonuçlar elde etmiştir.

Öncelikle modelimizin ilk aşaması olan adayların çıkarılmasına bakalım.Problem ve metin kümesi göz önüne alındığında, aday kümenin olasılığını modelliyoruz.

Modelimizin ikinci aşaması cevap seçme aşamasıdır.Amaç, soru verilen her adayın, metin setinin ve aday setinin ve nihai cevap olarak seçilme olasılığının modellenmesidir. Zaten burada aday cevap bilgisi olduğu için, bu aşamada problemi modellemek için esas olarak aday cevaptan başlayarak düşünüyoruz.

Öncelikle aday cevapların temsilini oluşturacağız.Her aday cevabın temsiline göre, Dikkat mekanizmasına göre bir korelasyon matrisi oluşturulmuş, korelasyon katsayısı ile her aday için bir referans madde miktarı üretilmekte ve diğer tüm aday cevaplar kullanılabilmektedir. Bilgi.

Bu bilgilerle, aday cevaba ilişkin diğer bazı özellikleri tasarladık ve bu özellikleri birleştirdikten sonra tekrar metin bölümünden geçeceğiz ve sonunda aday cevabın nihai puanını alacağız. Normalleştirilmiş form aracılığıyla, son cevap olarak her son aday cevabın olasılığını oluşturabiliriz.

Üç veri seti üzerinde deneyler yaptık. İlk ikisi İngilizce iki veri seti. Problem türleri bulmaca problemleridir.

Deneysel sonuçlarımız, ortak eğitim yöntemi bireysel eğitimden veya önceki çalışmalardan daha iyi olsun, sonuçlar daha iyidir.

Du-Ranker'da da deneyler yaptık ve modelimiz önemli bir gelişme kaydetti. Cevap seçme modülünde sunduğumuz özelliklerin tümü, özellikle önerdiğimiz aday cevapları ile modelimize en çok yardımcı olan aday cevapları arasındaki ilişki modelimiz için yararlıdır.

Son olarak bir vakaya bakın. Dikkat matrisi aracılığıyla, aday cevaplar arasındaki güçlü korelasyonu gerçekten yakalayabilir ve bu korelasyon yoluyla özellikleri daha iyi bütünleştirebilir; bu, sonunda doğru cevabı vermek için çok yararlıdır.

3. Wang Yizhong Peking Üniversitesi

Çapraz Geçişli Yanıt Doğrulama ile Çoklu Geçişli Makine Okuma Anlama

Bugün, bu yılın ACL'sindeki uzun kağıt çalışmalarımızdan bazılarından bahsedeceğim. Esas olarak, birden çok bölümü anlama sorununu çözmek istiyoruz. Bu sorunu, bölümler arasında yanıtları doğrulayarak çözebileceğimizi öneriyoruz. Bu çalışma, Baidu'daki stajım sırasında yapıldı. iş.

İlk önce çok bölümlü okuduğunu anlamanın ne olduğunu tanıtın. İki konuşmacının getirdiği okuduğunu anlama ile aynı değildir. Çok bölümlü okuduğunu anlama yaptığımızda, genellikle arama motorları tarafından alınan birden çok paragraf veririz. Son cevabı birden çok paragrafta bulmalıyız.

Birkaç özelliği vardır: Okuduğunu anlamayı gerçek bir web verisi altına uyguladığımızda, bir problemle yüzleşmek zorundayız, çünkü arama motorları tarafından alınan makaleler genellikle problemle ilgili birden fazla bağımsız makaledir. Yani bu makaleler arasında bazı makalelerin doğru cevapları var ve bazı makaleler soruyla ilgili ancak cevap doğru değil veya cevap yok. Ve bu adaylar genellikle çok kafa karıştırıcıdır. Bu özelliklere dayanarak, bu sorunu çözmenin bir yolunu keşfedebiliriz. Deneyimiz esas olarak iki veri kümesi için yapılmıştır: Microsoft tarafından önerilen MS-MARCO veri kümesi ve diğeri Baidunun Çince bir sorgu olan kendi DuReader veri kümesidir. Her iki veri kümesi de arama motorlarından alınmıştır. Gerçek kullanıcılar, gerçek olarak elde edilen belgelerde okumaya ve anlamaya başlar.

İlk olarak, bir örneğe bakalım. Bu, MS-MARCO verilerinden bir örnek. Asıl soru, karışık kültür ile saf kültür arasındaki fark nedir? Doğru cevap altıncı geçiştendir. Alınan makaleler arasında, 3, 4 ve 5'in hepsinin doğru cevaba benzer cevapları vardır. Doğrulamamızı geçebilir ve altıncı doğru cevabı 3, 4 ve 5'te bulabilir.

Bu özelliğe dayanarak modelimizi öneriyoruz. Her şeyden önce, cevabın sınırını tahmin etmeliyiz ki bu geleneksel okuduğunu anlama ile aynıdır, yani başlangıç ve bitiş konumunu bulmaktır. İkincisi cevabın içeriğini tahmin etmektir, yani az önce söylediğimiz başlangıç ve bitiş konumlarına ek olarak, cevabın içeriğinin iyi olup olmadığını tahmin etmeliyiz, böylece modelimizi daha fazla sinyalle eğitebiliriz. . Üçüncüsü, makalemizin odak noktası olan çapraz belge cevap doğrulamasıdır. Bu, dikkat mekanizması ile elde edilir. Önce, ağırlıklı toplam olan yeni hesaplanan içerik puanına göre cevabın temsilini hesaplamalıyız ve sonra Belirli bir güncel cevap hakkında bilgi toplamak ve diğer bölümlere gitmek için dikkat ederiz. Bu şekilde, mevcut cevabın temsili ve toplanan doğrulama kanıtları bir vektör ile temsil edilebilir. Nihai doğrulama puanını elde etmek için bunları bir ileri besleme katmanıyla birleştirebiliriz.

Tüm Modelimizin mimarisi bu şekildedir.Belirli sayıda geçiş için ayrı ayrı kodlayın.Kodlama yapıldıktan sonra, geleneksel olanla aynı olan Q-P eşleştirmesi yapacağız. Alt katman paylaşılır ve dış katman üç tahmin yapar, biri sınır tahmini, ikincisi içerik tahmini ve üçüncüsü çapraz belge yanıt doğrulamasıdır.

Bu üç Model ortaklaşa eğitilebilir. Üç hedef vardır, bu üç hedef üç kayıp işlevine karşılık gelir ve ağırlığı basit 1 ve 2 tarafından kontrol edilir. Son tahminde, üç Modeli birleştirin ve çarpın. Buradaki çarpma yöntemi biraz basittir, ancak aslında biraz sezgisel bir kural hissediyor, bu gelecekteki çalışmalarda daha da geliştirilebilir. Sadece burada çarpmak da geçerlidir.

Bu, modelimizin MS-MARCO ve DuReader dahil olmak üzere iki veri seti üzerindeki performansıdır. Bu iki veri setinde, o sırada en iyi sonuçları elde ettik ve önemli bir gelişme sağladık. MS-MARCO veri setinde bir Ablasyon çalışması yaptık ve hem İçerik Modeli hem de Doğrulama Modelinin büyük katkılar sağladığını ve ortak eğitimin de çok önemli olduğunu görebiliyoruz.

Üç modülün tahmin ettiği puanlara bir göz atalım. Sınır Modeli ile İçerik Modeli arasındaki boyut ilişkisinin nispeten tutarlı olduğunu görebiliriz. Doğrulama Modeli eklendikten sonra, tüm sıra önemli ölçüde değişti. Yani Doğrulama Modelimiz, Sınır ve İçerikten farklı bilgileri, yani genişletilmiş belgenin bilgilerini yakalayabilir.

Başka bir soru da İçerik Modelinin neden etkili olduğu? Bu resim aracılığıyla, bir göz atmak için model tarafından tahmin edilen Sınır Olasılıkları ve İçerik Olasılıklarını yazıyoruz. Her şeyden önce, Boundary'nin iyi öğrendiğini görüyoruz, başlangıç ve bitiş konumlarını öğrendi, ancak cevabın içindeki bilgiler için cevaptaki hangi kelimelerin iyi ve hangi kelimelerin olduğunu öğrenmedi. Kötü, ancak İçerik Modeli aracılığıyla cevaptaki bazı kelimelerin ağırlığını öğrenebiliriz. Dolayısıyla İçerik Modeli ile öğrenilen ağırlıklar üzerinden bu kelimelerin temsillerini toplayarak daha uygun bir cevap temsili elde edebiliriz.

4. Wu Wei Peking Üniversitesi

Çapraz Geçişli Yanıt Doğrulama ile Çoklu Geçişli Makine Okuma Anlama

Bugün sizlerle ACL'de topluluk Soru-Cevapları için kullandığımız cevapları paylaşacağım. Şimdi alt görevin soru sıkıştırma ağı nispeten uzun. Size üç topluluk sorusu ve cevapları ile cevap seçimini tanıtmama izin verin ve soru sıkıştırma ağı her ikisi de Ne demek istiyorsun.

Her şeyden önce, internette bir topluluk Soru-Cevap web sitesi olan topluluk Soru-Cevap web sitesi, herkes bu sitede özgürce soru sorabilir ve ona cevap verebilecek birçok farklı cevaplayıcı vardır. Topluluk Soru-Cevapları, yerel Baidu Zhizhi, Baidu Tieba veya Zhihu, topluluk Soru-Cevaplarının tüm biçimleridir. Topluluk Soru-Cevap, sıradan Soru-Cevap'tan farklı iki önemli özelliğe sahiptir.

Birincisi, genel soru ve cevabın bir soru ve bir cevap cümlesi olması ve topluluk soru ve cevabının soru cümlesinin iki farklı forma bölünebilmesidir. Birincisi, sorunun ana kısmıdır Bu ana kısım, temelde soruda yer alan ve birkaç kelimeyle ifade edilebilecek temel içerik hakkında bilgi verir. İkincisi, sorunun Gövde bölümüdür. Başlık bölümünde bahsedilen bilgileri yeniden tanımlayın ve bazı ilgili bilgileri ekleyin. Örneğin, Zhihu hakkında soru sorarken Cui Yongyuan'ın nasıl değerlendirileceği, sorunun başlığı budur. Bunun ana kısmı, Cui Yongyuan'ın daha önce bir CCTV sunucusu olduğunu ve daha sonra bazı anti-gen çalışmaları yaptığını ve şimdi başka bazı işler yaptığını söyleyebilir. Dolayısıyla, Soru-Cevap topluluğundaki soruların bu iki bölüme ayrılabileceğini açıkça görebiliriz.

İkinci özellik, topluluğun Soru-Cevap çevrimiçi metin biçiminde olduğundan, gürültüsü ve tekrar eden sorunları sıradan Soru-Cevap'tan daha ciddidir.

Cevap topluluk soru ve cevabında seçilir, neyi çözmeye çalışıyor? Topluluk Soru-Cevap bölümünde bir soruya birçok farklı cevap olabilir. Kullanıcılar için, tüm cevapları sıralamak için otomatik bir araç geliştirilebilirse ve iyi cevaplar kötü cevaplardan önce sıralanırsa, herkes tarafından göz atılabilir. Bu Soru-Cevap web siteleri faydalıdır.

Önerilen model, soru sıkıştırma ağını tanıtın. Mevcut iki özelliğe göre soru cümlesinin temsil ettiği bilgi, sorunun ana kısmına göre sıkıştırılır. Ağımız esas olarak üç bölüme ayrılmıştır: Birincisi, soru cümlesinin ana bölümünü soru cümlesinin başlık bilgisine göre iki kısma ayırabilen soru cümlesini sıkıştırmaktır. Birincisi soruya paralel olan kısım, ikincisi ise soruya dik olan kısımdır. Paralel kısım, sorunun ana başlığı hakkında daha alakalı bilgiler içerir ve dikey kısım, sorunun ana kısmındaki soru için bazı tamamlayıcı bilgiler olan, sorunun ana kısmının dışında bazı bilgiler içerir.

İkinci bölüm, sorunun temsilinde cevabın en alakalı kısımlarının çıkarıldığı soru ile cevap arasındaki hizalamadır.

Üçüncü kısım, bu Hizalama unsurlarını toplamak ve sonunda cevabı sıralayan bazı özellikler hakkında iki bilgi elde etmektir.

Bu iki veri setindeki pratik sonuçların karşılaştırmasını tanıtın, biri SemEval2015 ve 2017. Ağımız, manuel özelliklere ve aşağıdaki daha karmaşık modern sinir ağlarına dayanan bazı geleneksel yöntemlerin sonuçlarından daha iyidir.

Son olarak bir özet yapın. Çok hızlı eğitilebilmesi için saf bir Dikkat mekanizmasına dayalı olarak topluluk Soru-Cevap'taki soruları sıkıştıran bir ağ öneriyoruz. Kullandığı bilgiler, topluluk Soru-Cevap sorularında özne ve vücut arasındaki ayrımdır. Ayrım ilişkisini kullanarak, topluluk Soru-Cevap bölümündeki sorular sıkıştırılabilir. Yukarıdakiler, bugün tanıtmak istediğim şeydir. Teşekkür ederim!

5. Liu Cao, Otomasyon Enstitüsü, Çin Bilimler Akademisi

Doğal Cevap Üretimi için Müfredat Öğrenme

Çalışmamız, eğitim verilerinin mevcut eşitsiz kalitesi için tasarlanmış modellere odaklanmaktadır.

İlk olarak, makine öğreniminde bir eğitim stratejisi olan kurs öğrenmeyi tanıtın. Basitçe ifade etmek gerekirse, önce basit eğitim verilerini, ardından karmaşık eğitim verilerini öğrenmek anlamına gelir.

İkincisi, görev tanıtımıdır: Doğal Cevap Üretimi (NAG, doğal cevap oluşturma), Bilgi Tabanı Soruları ve Cevaplarını (KBQA) ve Sohbet Robotlarını (Chatbot) karşılaştırabilirsiniz. KBQA doğru yanıtlar verir ve Chatbot tutarlı ve akıcı yanıtlar alır. NAG, KBQA ve Chatbot'un ortak görevi olarak kabul edilebilecek doğru, tutarlı ve akıcı yanıtlar alır.

Mevcut yöntem, çoğunlukla Baidu Know gibi topluluk soru ve yanıt verileri gibi İnternet üzerinde yapay olarak oluşturulmuş verileri kullanır. Gerçek bir topluluk Soru-Cevap ortamında, genellikle nispeten düşük kalitede bazı yanıtlar vardır. Filtreleme yoluyla, yanıtta doğru varlığı içeren veriler seçilir. Orijinal veriler, eğitim verilerinin yaklaşık% 10'unu filtreleyebilir. Varlık doğru olmasına rağmen, genel kalite hala nispeten düşüktür.

Mevcut eğitim verileri altında iki zorluk vardır: Birincisi, yüksek kaliteli eğitim verilerini seçmenin özellikle zor olmasıdır. İkinci olarak, yüksek kaliteli eğitim verileri seçilse bile, eğitim verilerinin boyutu önemli ölçüde azalacaktır.

Mevcut verilerden doğrudan doğru, tutarlı ve akıcı bir yanıt üretmek zordur, bu yüzden onu parçalara ayıracağız. Öncelikle, kısa yanıtlar içeren düşük kaliteli eğitim verilerinden temel bir model öğrenin. Örneğin, önce bilgi tabanıyla etkileşime geçmeyi öğrenin ve ardından yüksek kaliteli, uzun ve karmaşık eğitim verilerinden daha iyi bir model öğrenin. Model, umarım bu model doğru, tutarlı ve akıcı cevaplar verebilir.

Yukarıdaki fikrin iki sorunu vardır: Birincisi, eğitim verilerinin kalitesiyle ilişkilendirilmesi gereken soru ve cevap çiftinin (çiftinin) karmaşıklığını belirlemektir. Diğeri, öğrenme sürecini, basit eğitim verilerinin ne zaman öğrenileceğini ve karmaşık eğitim verilerinden ne zaman öğrenileceğini belirlemektir.

Bu nedenle, modeli şu şekilde tasarlıyoruz: önce ortak örnekleri (soru-cevap çiftleri) seçin ve hedef örneklerin yüksek kaliteli ve karmaşık öğrenme verileri olduğu bir cevap seçici aracılığıyla örnekleri hedefleyin. Biri kelime sıklığına dayalı ve ikincisi dilbilgisine dayalı olmak üzere iki stratejik seçenek tasarladık. Eğitim verilerinde normal örnek ve hedef örneğe sahip olduktan sonra, aşağıdaki örneğin planlamasıdır (yani, kurs öğrenimi). Örnek planlamaya göre, onu doğal yanıt üretme modeline girin ve son olarak üretilen yanıtı alın.

Kurs öğrenimimiz, ortak örneklere göre azaltılmakta ve hedef örneklere göre artmaktadır.

Deneysel sonuç, modelimizin kelime seçimi veya dil bilgisi seçimini kullanıp kullanmadığına bakılmaksızın önceki modelden daha iyi olmasıdır. Cevaplanması için birden fazla üçlü gerektiren sorular için, modelimizin performans gelişimi daha belirgindir. Ek olarak, doğruluk, akıcılık ve tutarlılığın üç göstergesini manuel olarak değerlendirdik, buna bağlı olarak, modelimiz önceki yöntemden daha iyidir.

6. Wei Xiaochi Pekin Teknoloji Enstitüsü

Kalite Önemlidir: cQA Çift Kalitesini Transdüktif Çoklu Görünümlü Öğrenme Yoluyla Değerlendirme

Araştırma çalışmamızın arka planı topluluk soru ve cevaplarıdır. Topluluk soru ve cevap, Wbe2.0'ın geliştirilmesiyle doğan bir soru cevap yöntemidir.Bu soru cevap platformunda, kullanıcılar soru sorabilir ve diğer bazı kullanıcılar yukarıdaki sorulara cevap verebilir. Topluluk soru ve cevabının geliştirilmesiyle, bu soru cevap platformlarında giderek daha fazla soru cevap çifti vardır ve bu soru ve cevap çiftleri, diğer kullanıcıların bazı yeni sorularını cevaplamak için arama motorları tarafından daha da alınabilir. Yukarıdaki soruların ve cevapların bazıları genellikle manuel olarak yazıldığından, büyük kalite sorunları vardır.

Bir Kullanıcı Çalışması anketiyle, Soru-Cevap bölümünün% 45'inden fazlasının özellikle yüksek kalitede olmadığını gördük. Çok sayıda düşük kaliteli soru ve cevap, bir yandan arama motoru kullanıcılarının kullanıcı deneyimini etkileyecek, diğer yandan çok fazla bilgi işlem ve depolama kaynaklarını boşa harcayacak ve aynı zamanda topluluk soru cevap platformundaki kullanıcı bağlılığının azalmasına neden olacaktır. Bu nedenle, birçok araştırmacı, topluluk soru ve cevabının kalitesinin nasıl değerlendirileceğini incelemeye başladı. Bazı geleneksel yöntemler genellikle bazı özellikleri çıkarıp bunları regresyon veya sınıflandırma modellerine yerleştirerek uygulanır.

Bu yöntemlerin aşağıdaki iki sorunu vardır:

Biri, çoklu görünüm özelliklerinin entegrasyonudur. Bir sorunun ve cevabın kalitesi genellikle birçok yönden belirlenir. Her yön, Soru-Cevap kalitesinin tamamlayıcı doğasını belirler. Tek bir açıdan farklı sonuçlar alabilirsiniz. Örneğin, bu örnekte sadece cevaplara bakıyoruz ve bunun çok iyi bir soru cevap çifti olduğunu düşünebiliriz, ancak soruya bakarsanız, sorunun açıklamasının oldukça belirsiz olduğunu ve birçok gramer hatası olduğunu göreceksiniz.Genel olarak, soru ve cevap Kalite özellikle yüksek değil.

İkincisi, etiketlenmiş verilerin eksikliğidir. Mevcut birçok öğrenme yönteminin büyük miktarda etiketli veriye dayanması gerekir ve etiketli verilerin elde edilmesi çok karmaşıktır ve çok fazla insan gücü gerektirir. İnternette pek çok faydalı bilgi içeren büyük miktarda etiketlenmemiş veri vardır, ancak mevcut birçok yöntemde bunlar tam olarak kullanılmamaktadır.

Bu nedenle, çoklu görünüm özelliği füzyonu ve etiketlenmemiş verilerin kullanımı sorununu aynı anda çözmek için bir Transdüktif Çoklu Görünüm yöntemi kullanmayı öneriyoruz. Çok perspektifli öğrenme açısından, çeşitli bakış açılarının tutarlı bilgilerinin aynı anda dikkate alındığı bir kamusal alan öğrendik. Kamusal alanda, her bir görüş açısının kendine has özellikleri de korunabilir. Kamusal alanı öğrenmek için hem etiketli verileri hem de etiketlenmemiş verileri kullanırız ve kamusal alanda yanıt kalitesinin değerlendirmesini gerçekleştiririz.

Perspektif uzayını modellerken, her bir perspektif uzayını temsil etmek için bir Laplacian matrisi kullanılır. Soru-cevap çiftini ifade etmek için her soru-cevap çifti ile soru-cevap çifti arasındaki korelasyonu kullanın.

Kamusal alan çalışmasında, her bir perspektif alanı ve kamusal alan arasındaki anlaşmazlığı en aza indirerek öğreniyoruz. Kamusal alan temsilini öğrendikten sonra, kamusal alandaki cevapların kalitesini değerlendirmek için bir regresyon modeli kullanıyoruz. İki kayıp birlikte optimize edilir ve soru ve cevabın kalite değerlendirmesinin sonucu elde edilebilir.

Deneyimiz, sırasıyla iki set İngilizce ve Oyun kullanarak StackExchange üzerindeki verileri taramaktır. Soru ve cevap çiftinin kalite etiketi olarak soru ve cevap için kullanıcı oylarının Normalleştirilmiş ortalamasını kullanıyoruz Bu yöntem bazı popüler sorular için daha etkilidir, ancak daha az popüler sorular için daha az etkilidir. Bu nedenle, deneyde açıklamalı verileri oluşturmak için yalnızca popüler soruları kullanırız.

İki değerlendirme yöntemi kullanıyoruz: Otomatik Değerlendirme ve Manuel Değerlendirme. Genel Performans karşılaştırmasında, yöntemimiz hem manuel değerlendirmede hem de otomatik değerlendirmede daha iyi sonuçlar elde edebilir. Perspektif sayısı artırıldıktan sonra, her bir perspektifin özelliklerinin tüm model üzerindeki etkisi gözlemlendi. Her görüş açısı özelliği eklendiğinde modelin performansının arttığını gördük. Kamusal alanın benzerlik matrisini görselleştirdikten sonra, düşük kaliteli soru-cevap çiftlerini, kamusal alandaki yüksek kaliteli soru-cevap çiftlerinden etkili bir şekilde ayırt etmek mümkündür.

7. Zhao Zhou Zhejiang Üniversitesi

Uyarlanabilir Hiyerarşik Güçlendirilmiş Ağlar aracılığıyla Açık Uçlu Uzun Biçimli Video Soru Cevaplama

Video Soru-Cevap, 2017'de doğal dil ve video etkileşimine dayalı olarak önerdiğimiz bir görevdir. Açık alan videosu soru ve cevabı için cevap, soruya ve videoya göre oluşturulur. Video Soru-Cevap, diğer Soru-Cevap bölümlerinden farklıdır. Videonun soru ve cevabında videonun uzunluğu çok çok uzun, bir ile iki dakika arasında çok fazla kare var ve sıradan bir LSTM'nin bu kadar uzun bir videoyu işlemesi çok zor. İki çok küçük alanda kilitli durumdayız, biri Açık Uçlu, diğeri Uzun Formlu Soru Cevaplama.

Video genellikle çok uzundur ve sorun videonun yalnızca küçük bir bölümüdür ve video içeriğinin çoğunun sorunla ilgisi yoktur. Uzun bir videodan video Soru-Cevap çalışması nasıl yapılır. Çalışmamızın aşağıdaki katkıları vardır: İlk olarak, bir kodlama-kod çözme ağı öğrenme yöntemi öneriyoruz. İkinci olarak, bir videonun probleme dayalı temsilini öğrenmek için uyarlanabilir bir hiyerarşik kodlayıcı kullanın. Fragman seviyesinden öğreniyoruz Soruya ve bazı videolara göre video otomatik olarak parçalara bölünüyor.Bazı fragmanlar probleme karşılık geliyor, bu yüzden fragman seviyesinin temsilini öğrendik. Son olarak, cevabı oluşturmak için gelişmiş bir kod çözücü tasarladık. Ayrıca çok büyük bir veri seti de oluşturduk.

İlk olarak, bazı videoları çerçeve seviyesinde işleyeceğiz.Her videonun, okuduğunu anlama görevlerine çok benzeyen N karesi var. Daha sonra A1'den AN'a cevabı üretin, bu değişken katmanın cevabıdır, 1'den N'ye kadar kelime mümkündür. Videonun anlamsal ifadesi.Her çerçeve için, ifade etmek için anlambilim kullanıyoruz, ifade etmek için A1'den AN'a kullanıyoruz.

Burada iki ağ öğreneceğiz: Birincisi, F'nin temsil ettiği kodlama ağının iki girişi vardır, biri V, yani Video ve diğeri Soru olan Q'dur. Öğrenmemiz gereken ikinci şey de kod çözme ağıdır.N karenin adaptör kod çözücüye girdiğini varsayıyoruz. LSTM'nin bu kadar uzun bir videoyu işlemek çok zor olduğu için, soruna dayalı aşamalı bir LSTM öneriyoruz, nasıl çalışıyor? LSTM'ye girilen bir sorun var Mevcut durumun bir geçişe uğradığını düşünürsek, başlangıç durumunu güncellemek için başka bir LSTM kullanırız.

Bu okuduğunu anlama ile aynı şey değildir. Okuduğunu anlama cümle ve cümledir ve video karelerini bölümlere ayırmak çok zordur, otomatik olarak bölümlere ayırıyoruz. Bir eşikten yüksekse ve iki semantiği aynı değilse, eğitim için bir LSTM'yi yeniden başlatacağız.

Sahne video çalışmasını yürütmek için hala dikkat mekanizmasını kullanıyoruz. Videodaki sonraki karenin bu çerçevenin anlambilimiyle ilgili olup olmadığına karar veriyoruz. Sorulacak bazı sorulara ve bazı güncel videoların durumuna göre iki videonun anlambiliminin bir anlambilim mi yoksa farklı anlambilim mi olduğunu belirleyin. Anlambilim farklıysa, başka bir LSTM kullanırız.

Ayrıca takviye kod çözme ağ öğrenimini tanıtın. Parça düzeyinde bir temsil oluşturmak için çerçeve düzeyinde uyarlanabilir eğitim kullanıyoruz ve son olarak yanıtlar oluşturmak için gelişmiş bir yanıt oluşturma yöntemi kullanıyoruz.

Manuel olarak etiketlenmiş bir veri seti oluşturduk. Bazı gelişmiş yöntemleri test etmek ve karşılaştırmak için WUPS = 0.0 ve WUPS = 0.9 kullanın.

8. Zhao Zhou Zhejiang Üniversitesi

Çoklu Akış Hiyerarşik Dikkat Bağlam Ağı Aracılığıyla Çok Dönüşlü Video Sorgulaması Yanıtlama

Video ile sohbeti inceliyor, videoda sürekli sorular soruyor ve sürekli yanıtlar alıyoruz. Videonun bir bağlam olduğunu düşünüyoruz ve videoda sorular sormaya devam ediyoruz, bu yüzden bu bir sohbet. Bu nedenle, çok yönlü video sorusunu ve cevabını çözmek için çok akışlı bir dikkat mekanizması bağlam ağı öneriyoruz.

Çok sayıda videomuz var ve manuel ek açıklama yoluyla çok sayıda konuşma alabiliyoruz. Görüşümüzde yalnızca bazı videolar ve sorular değil, aynı zamanda bağlam ve bazı önceki konuşmalar da var. Şu andaki sorun, sorunun tam bilgiye sahip olmamasıdır. Cevaplamak için diyaloğun bağlamına başvurmamız gerekir. Bu nedenle, video ve soruya ek olarak, bu soru için diyalog bağlamı da dikkate alınmalıdır.Bu aynı zamanda bu sorunun çok zorlu bir kısmıdır.

Bazı çok akışlı hiyerarşik dikkat mekanizması bağlam ağları yaptık, yalnızca video akışını dikkate almakla kalmadık, aynı zamanda konuşma bağlam akışını da göz önünde bulundurduk, iki akışı birleştirdik ve daha optimize iyileştirmeler yaptık.

Video iki seviyede ifade edilir, çerçeve seviyesinde gösterim ve segment seviyesinde gösterim. Konuşma bağlamı iki bölümden oluşur; ilk bölüm soru ve ikinci bölüm önceki cevaptır. Üç parça bilgi verildiğinde, ilki video bilgisi, ikincisi konuşma bağlamı bilgisi ve üçüncüsü soru bilgisidir.

Çoklu akış durumu değerlendirildikten sonra, her seferinde diyalog bağlamındaki sorular ve cevaplar bağlamsal bir temsil oluşturmak için birleştirilir. Ardından tüm diyalog bağlamlarına dikkat mekanizması ekleyin. Alakalı olanlar nasıl çıkarılır ve ilgisizler nasıl çıkarılır, odak mekanizmasını ödünç aldık ve bazıları ilgisiz olanlar birleştirilmeden sonunda ilgili olanları birleştirdi.

Bundan sonra, üretici modele dayalı olarak, ilgili bağlam bilgisini çıkarır ve videodaki önemli bilgileri çıkarır ve son olarak birleştiririz. Tüm süreç iki adıma bölünmüştür, ilk adım sorunu anlamaktır. İkinci adımda, videoya odaklanalım.Video için iki özelliği ele alalım: Birincisi durum özelliği ve ikincisi hareket özelliğidir. Bazı sorular durum hakkında sorar ve bazı sorular hareket hakkında sorar, böylece her iki taraftaki özellikler çıkarılır ve sonunda bir yanıt oluşturulur.

Yeni bir veri seti oluşturduk. Her biri yaklaşık 1000 soru içeren iki video veri seti vardır. İlk veri kümesi için, 30.000'den fazla video soru ve cevap çiftine açıklama ekledik ve ikinci veri kümesi, 60.000'den fazla video soru ve cevap çiftine açıklama ekledik. Modelimiz, öğrenme için temel manuel ek açıklamaları kullanır.

Yazıda deneysel sonuçlarla ilgili detaylı veriler bulunabilir.

Çinli kadın buz hokeyi takımı dostluk maçında Polonya'yı yendi. Koç: bu iyi bir başlangıç

Makine Öğrenimi ve Uygulama Oturumu AIS Ders Öncesi Oturumu Tam Kuru Mal Paylaşımı