Google açık bir soru ve cevap veri seti, 300.000 doğal soru + yapay olarak açıklamalı cevaplar yayınladı

Xin Zhiyuan Rehberi Bugün Google, doğal olarak oluşan 300.000 soruyu ve yapay olarak açıklamalı cevapları, 16.000 örneği içeren Doğal Sorular veri setini (Doğal Sorular) yayınladı ve bu veri setine dayalı bir soru-cevap sistemi sorgulaması başlattı. Doğal dil anlayışı alanında SQuAD olması bekleniyor!

Açık Alan Soru Cevaplama (QA), doğal dil anlayışında (NLU) bir kıyaslama görevidir. Amacı, insanların bilgiyi nasıl bulduğunu ve tüm belgeyi okuyup anlayarak sorulara nasıl cevap bulduğunu simüle etmektir.

Örneğin, verilen bir Doğal dilde ifade edilen sorunlar "Gökyüzü neden mavi?" ("Gökyüzü neden mavi?"), QA sistemi, Web sayfasını okuyun (Ör. "Gökyüzü Yayılımı" Wikipedia sayfası) Ve doğru cevabı ver Cevap biraz karmaşık ve uzun olsa bile.

Ancak, şu anda QA modellerini eğitmek ve değerlendirmek için kullanılabilecek büyük, kamuya açık bir model bulunmamaktadır. Doğal olarak ortaya çıkan sorunlar (yani, bilgi arayan kişilerin ortaya çıkardığı sorunlar) Ve cevap veri seti.

Bunun nedeni, QA görevleri için yüksek kaliteli bir veri kümesi oluşturmanın büyük miktarda Sorunun gerçek kaynağı Ve çok fazla insan gücüne ihtiyacım var Bu sorulara doğru cevapları bulun .

QA alanındaki araştırma ilerlemesini desteklemek için Google bugün yayınladı Doğal Sorular (NQ) , Bu, açık alanlı soru cevaplama sistemlerini eğitmek ve değerlendirmek için yeni, büyük ölçekli bir külliyattır ve sorulara insan cevaplarını uçtan-uca bulma sürecini tekrarlayan ilk külliyattır.

Natural Questions veri seti

NQ ölçeği çok büyüktür. 300.000 doğal olarak ortaya çıkan soru ve Wikipedia sayfalarından manuel olarak açıklamalı cevaplar , QA sistemini eğitmek için kullanılır.

Ek olarak, NQ külliyatında ayrıca 16.000 örnek Her örnek 5 farklı yorumcu cevap veriyor (Aynı problem için), bu öğrenilen QA sisteminin performansını değerlendirmek için çok kullanışlıdır.

Natural Questions veri kümesindeki örnekler

NQ'daki soruları yanıtlamak, önemsiz sorulardan daha derin bir anlayış gerektirdiğinden (bu, bilgisayarların çözmesi zaten kolay olan), Google ayrıca bilgisayarın doğal dili anlamasını iyileştirmeye yardımcı olmak için bu veri kümesine dayalı bir meydan okuma başlattı Anlamak.

NQ Mücadelesi Sıralaması

NQ veri seti 307K eğitim örnekleri, 8K geliştirme örnekleri ve 8K test örnekleri içerir.

Şu anda NQ Challenge liderlik tablosunda yalnızca Google'ınki var BERT Model ve DecAtt-DocReader Modelin derecesi. Makalede Google, uzun yanıt seçme görevinde en iyi insan performansının% 87 F1 olduğunu ve kısa yanıt seçme görevinde en iyi insan performansının% 76 olduğunu kanıtladı.

Liang Zhenying'in bir sonraki genel yönetici seçimini terk etmesi, Hong Kong hisselerindeki düşüşü daraltıyor ve genel müdürlerin konsept hisse senetleri yükseliyor
önceki
sadece! Du Fuguo, "Moving China" 2018 Yılın Kişisi seçildi
Sonraki
Tencent, Alibaba'yı yendi mi? Starbucks, WeChat ödemesini kabul etmekten ödün veriyor
Huawei, dünyanın ilk 5G baz istasyonu çipini çıkardı ve katlanır ekranlı bir 5G cep telefonunu piyasaya sürdü
Yeni nesil Wrangler, hayran yapmakla meşgul ve Jeep 4X4 akıllı teknoloji sistemi, araba kaygısını çözmekten sorumlu.
Zhou Ming ve Li Mu tarafından yazılan Shen Xiangyang tarafından önerilen: Akıllı Soru-Cevap ve makine çevirisi için mutlaka okunması gereken bir kitap
Yang Yi, Durant'ın Batı'daki en güçlüsü olduğunu iç çekiyor, Su Qun, Roketlerin yenildiğini ve herkesin Roketleri övdüğünü söyledi.
Henüz bilmiyorsunuz, Hubei tarım ürünlerinin en iyi 20 bölgesel halka açık markasından biri olarak seçildi ~
"Yeni şehir, yeni orta sınıf" ı etkilemek için Auchan COS1 ° in güveni nedir?
Bu kadar uzun süre bekledikten sonra nihayet seni bekledim! Holiday Inn Tianyu Lake Hubei Büyük Açılışı 23 Kasım'da
Haima kral bombasını almadı, ancak ikinci nesil S5 ve Familia F5 ile muhtemelen oyunu kazanacak
Dünya Kupası hiçbir zaman beş zirveyi kaçırmadı, Pele bir efsane yazmak için üç şampiyonluk kazandı, 3R kombinasyonu şampiyonayı süpürdü
Hanchuan ve Fujian arasındaki çözülmez bağ, Hui'an kadın performansı ilk kez Makou Tianyu Gölü'ne giriyor
Kalabalık Pekin Otomobil Fuarı'nda satış açığı yüksek olan bu beş model benim sevdiğim şeyler
To Top