Microsoft'un bir yan kuruluşu olan Maluuba, resim görüntüleyen bir soru-cevap veri seti başlatıyor ve yapay zekanın grafikleri anlamasını istiyor

Annie derleyin ve organize edin

Qubit Üretildi | Genel Hesap QbitAI

Bilimsel grafikler eğilimler, oranlar ve oranlar gibi değerli bilgileri kısaca özetleyerek kavramları sezgisel olarak anlamamıza olanak tanır. Makinenin bu yapılandırılmış görsel bilgiyi anlaması, çok sayıda belgeden bilgi almamıza yardımcı olabilir.

Hayır, Microsoft'un bir yan kuruluşu olan Maluuba, araştırmalarında yeni bir ilerleme kaydetti.

Son zamanlarda, Maluuba muhakeme için görsel bir veri seti olan FigureQA'yı piyasaya sürdü ve ArXiv'de "FigureQA: Anotated Figure Dataset for Visual Reasoning" araştırmasıyla ilgili makaleyi yayınladı. Qubit, derlemek, düzenlemek ve sizinle paylaşmak için temel noktalarını seçer.

Veri kümesine giriş

İlişkisel muhakeme üzerine yapılan en son araştırmalardan esinlenen araştırmacılar, makine anlayışı ve muhakeme problemlerini incelemek için kullanılan 10'dan fazla çizelgeye dayalı 1 milyondan fazla soru ve cevap çifti içeren FigureQA veri setini başlattı.

FigureQA veri setinde beş ortak grafik modeli vardır.Bu grafikler, çizgi grafikler, nokta grafikler, dikey çubuk grafikler, yatay çubuk grafikler ve pasta grafikler dahil olmak üzere sürekli ve kategorik bilgileri görüntüleyebilir. Soru-cevap çiftleri, grafikteki öğeler arasında bire bir ve bire çok ilişkileri içerecektir, örneğin: X bir medyan mı? X ve Y kesişiyor mu? Doğru cevabı almak, çoklu grafiklerdeki unsurlar hakkında akıl yürütmeyi gerektirir.

Veri kümesine dahil edilen 5 grafik türü

Veri setinde değer boyutu, maksimum değer, minimum değer, medyan değer, eğri altındaki alan, pürüzsüzlük ve görüntü kesişimi gibi bilgileri içeren 15 tür soru vardır.

FigureQA'da yer alan 15 soru türü

Soru cevap setindeki sorular yukarıdaki sorulara dayanmaktadır ve cevaplar "evet" veya "hayır" olarak birleştirilmiştir.

Veri seti soru cevap şeklinde sunulmuştur. S: Medium Seafoam ve Light Gold kesişiyor mu? A: Evet. S: Medium Seafoam için minimum bir değer var mı? A: Hayır

Microsoft ekibi tanıtım yazısında şunları belirtti: FigureQA, görsel muhakemeyle ilgili CLEVR veri setine benzer bir sentetik veri setidir. Veriler gerçek ortamdaki kadar zengin olmasa da, görevin karmaşıklığını daha büyük ölçüde kontrol edebilir ve yardımcı denetimi destekleyebilir. Sinyal. Buna ek olarak, FigureQA üzerinde eğitilen modelin gerçek verilerini analiz ederek, külliyat zayıflıklarla başa çıkmak için genişletilebilir. "

Üretim süreci

FigureQA veri seti aşamalar halinde oluşturulur ve üretilir.

İlk olarak, araştırmacılar, örneklenen verilerin daha doğal görünmesi için sayısal verileri dikkatlice ayarlanmış bir dizi kısıtlamaya ve sezgisel tasarımlara göre örnekler. Daha sonra, araştırmacılar, nicel verileri elde etmek için grafikteki verileri çizmek için açık kaynak görselleştirme kitaplığı Bokeh'i kullandılar.

Ek olarak, araştırmacılar veri noktaları, koordinat eksenleri, koordinat ekseni etiketleri, işaretler ve göstergeler dahil olmak üzere tüm grafiklerin Bokeh arka ucunun sınır bilgisi çıktısını değiştirdiler. Ayrıca, her bir grafik için tamamlayıcı bilgi olarak temel sayısal verileri ve bir dizi sınır verisi sağladılar.

Son olarak, araştırmacılar her soruya verilen yanıtlarda "evet" ve "hayır" oranlarını dengeledi, bu da modelin sonuçları çıkarmak ve görsel içeriği göz ardı etmek için yanıt sıklığındaki sapmaları kullanmamasını sağladı.

Test sonuçları

Makalede araştırmacılar, FigureQA'daki test setinin doğruluğunun insan seviyesinde olmadığını belirtti. Daha sonra araştırmacılar, FigureQA üzerinde eğitilen modelin performansını gerçek bilimsel veriler üzerinde test etmeyi ve veri setini insanlar tarafından yazılan doğal dil problemlerine genişletmeyi planlıyor. FigureQA'nın veri setinin "resmi" versiyonu halka açıktır ve gelecekteki araştırmalar için bir referans noktasıdır.

15 tür soruyu yanıtlamada veri kümesinin ve insanların doğruluğunun karşılaştırılması

Araştırmacılar ayrıca, kullanıcıların kendi verilerini oluşturmaları için üretim parametrelerini ayarlamalarına olanak tanıyan, yapılandırması kolay olan nesil komut dosyaları sağlar.

İndir

FigureQA veri seti indirilebilir. Bu veri setini Maluuba resmi web sitesinden indirebilirsiniz:

https://datasets.maluuba.com/FigureQA/dl

FigureQA'nın tanıtımı hakkında, bunu ArXiv'de kontrol edebiliriz:

https://arxiv.org/abs/1710.07300

İyi eğlenceler dilerim ~

- Bitiş -

Samimi işe alım

Qubit, editörleri / muhabirleri işe alıyor ve merkezi Pekin, Zhongguancun'da bulunuyor. Yetenekli ve hevesli öğrencilerin bize katılmasını dört gözle bekliyoruz! Ayrıntılar için, lütfen QbitAI diyalog arayüzünde "işe alım" kelimesiyle yanıt verin.

Qubit QbitAI

' ' Yapay zeka teknolojisi ve ürünlerindeki yeni eğilimleri takip edin

Sekiz yıldır futbol hayaline sadık kalmak için yarım bacak kullanan futbolcu
önceki
Tava, PlayerUnknown's Battlegrounds'un en büyük eseri! Düşmanı doğrudan duvardan öldürebilir misin? !
Sonraki
Lippi'den bile daha "garantili değil"! Ömür boyu rezillik karşılığında hiç 38 derece + kapalı oyun oynarken ateşi oldu mu?
43.2 dışarıda, Bay W araç kullanırken üşütmüş. Klimanın böyle kullanıldığı ortaya çıktı.
Picpuyol, Barselona'nın tarihteki en "yıkılmış" su savunucusu ile bir ekip oluşturdu ve geri dönemedi.
Tavuk yemekten sıkıldıysanız ne yapmalısınız! Yabancılar o kadar sıkıldı ki, PlayerUnknown's Battlegrounds'da Çin Seddi'ni inşa ettiler!
Korean Tieshuai sadece fiziksel uygunluğa mı odaklanıyor? Cui Kangxi'nin temel becerileri + taktikleri bir arada! Generaller çıldırıyor
"Modern endüstrinin babası" değişimi teşvik etmek veya insanlık tarihini yeniden etkilemek için aşırı kilolu otonom sürüş
150.000 değerinde "Olağanüstü deli", ancak 35 yaşında Avrupa'nın en iyi orta saha oyuncusu haline geldi hala aktif
Da Lei Jin Jingdao konforu işe yaramaz! Yan Junling, Ağabey'e kızmaya cesaret edemedi, bu yüzden sadece Shi Ke'yi öfkesini dışa vurmak için kullanabilirdi.
Akaryakıt araçlarının üretimini ve satışını durdurmak boş söz değil, BAIC harekete geçmeye başlıyor
Yerli oyunların en büyük aldatmacası! Devasa bir açık dünyaya sahip olduğunu iddia ediyor, ancak fragman bile kopyalandı
Cannavaro: Oyuncular takdir edilmeye değer ve tabii ki baş antrenör de övgüye değer Hayranlar: Çok yorgun
DS formül elektrikli arabasından Fransız arabalarının karşı saldırısını gördüm
To Top