Annie derleyin ve organize edin
Qubit Üretildi | Genel Hesap QbitAI
Bilimsel grafikler eğilimler, oranlar ve oranlar gibi değerli bilgileri kısaca özetleyerek kavramları sezgisel olarak anlamamıza olanak tanır. Makinenin bu yapılandırılmış görsel bilgiyi anlaması, çok sayıda belgeden bilgi almamıza yardımcı olabilir.
Hayır, Microsoft'un bir yan kuruluşu olan Maluuba, araştırmalarında yeni bir ilerleme kaydetti.
Son zamanlarda, Maluuba muhakeme için görsel bir veri seti olan FigureQA'yı piyasaya sürdü ve ArXiv'de "FigureQA: Anotated Figure Dataset for Visual Reasoning" araştırmasıyla ilgili makaleyi yayınladı. Qubit, derlemek, düzenlemek ve sizinle paylaşmak için temel noktalarını seçer.
İlişkisel muhakeme üzerine yapılan en son araştırmalardan esinlenen araştırmacılar, makine anlayışı ve muhakeme problemlerini incelemek için kullanılan 10'dan fazla çizelgeye dayalı 1 milyondan fazla soru ve cevap çifti içeren FigureQA veri setini başlattı.
FigureQA veri setinde beş ortak grafik modeli vardır.Bu grafikler, çizgi grafikler, nokta grafikler, dikey çubuk grafikler, yatay çubuk grafikler ve pasta grafikler dahil olmak üzere sürekli ve kategorik bilgileri görüntüleyebilir. Soru-cevap çiftleri, grafikteki öğeler arasında bire bir ve bire çok ilişkileri içerecektir, örneğin: X bir medyan mı? X ve Y kesişiyor mu? Doğru cevabı almak, çoklu grafiklerdeki unsurlar hakkında akıl yürütmeyi gerektirir.
Veri kümesine dahil edilen 5 grafik türü
Veri setinde değer boyutu, maksimum değer, minimum değer, medyan değer, eğri altındaki alan, pürüzsüzlük ve görüntü kesişimi gibi bilgileri içeren 15 tür soru vardır.
FigureQA'da yer alan 15 soru türü
Soru cevap setindeki sorular yukarıdaki sorulara dayanmaktadır ve cevaplar "evet" veya "hayır" olarak birleştirilmiştir.
Veri seti soru cevap şeklinde sunulmuştur. S: Medium Seafoam ve Light Gold kesişiyor mu? A: Evet. S: Medium Seafoam için minimum bir değer var mı? A: Hayır
Microsoft ekibi tanıtım yazısında şunları belirtti: FigureQA, görsel muhakemeyle ilgili CLEVR veri setine benzer bir sentetik veri setidir. Veriler gerçek ortamdaki kadar zengin olmasa da, görevin karmaşıklığını daha büyük ölçüde kontrol edebilir ve yardımcı denetimi destekleyebilir. Sinyal. Buna ek olarak, FigureQA üzerinde eğitilen modelin gerçek verilerini analiz ederek, külliyat zayıflıklarla başa çıkmak için genişletilebilir. "
FigureQA veri seti aşamalar halinde oluşturulur ve üretilir.
İlk olarak, araştırmacılar, örneklenen verilerin daha doğal görünmesi için sayısal verileri dikkatlice ayarlanmış bir dizi kısıtlamaya ve sezgisel tasarımlara göre örnekler. Daha sonra, araştırmacılar, nicel verileri elde etmek için grafikteki verileri çizmek için açık kaynak görselleştirme kitaplığı Bokeh'i kullandılar.
Ek olarak, araştırmacılar veri noktaları, koordinat eksenleri, koordinat ekseni etiketleri, işaretler ve göstergeler dahil olmak üzere tüm grafiklerin Bokeh arka ucunun sınır bilgisi çıktısını değiştirdiler. Ayrıca, her bir grafik için tamamlayıcı bilgi olarak temel sayısal verileri ve bir dizi sınır verisi sağladılar.
Son olarak, araştırmacılar her soruya verilen yanıtlarda "evet" ve "hayır" oranlarını dengeledi, bu da modelin sonuçları çıkarmak ve görsel içeriği göz ardı etmek için yanıt sıklığındaki sapmaları kullanmamasını sağladı.
Makalede araştırmacılar, FigureQA'daki test setinin doğruluğunun insan seviyesinde olmadığını belirtti. Daha sonra araştırmacılar, FigureQA üzerinde eğitilen modelin performansını gerçek bilimsel veriler üzerinde test etmeyi ve veri setini insanlar tarafından yazılan doğal dil problemlerine genişletmeyi planlıyor. FigureQA'nın veri setinin "resmi" versiyonu halka açıktır ve gelecekteki araştırmalar için bir referans noktasıdır.
15 tür soruyu yanıtlamada veri kümesinin ve insanların doğruluğunun karşılaştırılması
Araştırmacılar ayrıca, kullanıcıların kendi verilerini oluşturmaları için üretim parametrelerini ayarlamalarına olanak tanıyan, yapılandırması kolay olan nesil komut dosyaları sağlar.
FigureQA veri seti indirilebilir. Bu veri setini Maluuba resmi web sitesinden indirebilirsiniz:
https://datasets.maluuba.com/FigureQA/dl
FigureQA'nın tanıtımı hakkında, bunu ArXiv'de kontrol edebiliriz:
https://arxiv.org/abs/1710.07300
İyi eğlenceler dilerim ~
- Bitiş -
Samimi işe alım
Qubit, editörleri / muhabirleri işe alıyor ve merkezi Pekin, Zhongguancun'da bulunuyor. Yetenekli ve hevesli öğrencilerin bize katılmasını dört gözle bekliyoruz! Ayrıntılar için, lütfen QbitAI diyalog arayüzünde "işe alım" kelimesiyle yanıt verin.
Qubit QbitAI
' ' Yapay zeka teknolojisi ve ürünlerindeki yeni eğilimleri takip edin