Kod yazmayın, makine öğrenimine katılmak için grafik arayüz kullanın: MIT "Dünyanın En Hızlı Otomatik ML" sini yayınladı

İçbükey tapınaktan kestane

Qubit Raporu | Genel Hesap QbitAI

"Demir Adam" dan

Bilim kurgu arsasında, Python'da kod yazan büyük bir adam görmedim.

Önümde mavi havlayan holografik bir resim var Parmağınızla birkaç kez sürükleyin ve ardından sonucu hesaplamak için birkaç kez tıklayın.

"Geceleri yıldızları izliyorum, çalışma saatlerinizi hesaplıyorum ve P istasyonunu izliyorum" (Yanlış)

Gerçeğe dönüş, hologram olmamasına rağmen Kod yazmadan, sürükleyip bırakmadan makine öğrenimi yapabilirsiniz , Bu güzel şeyler başarıldı:

MIT ve Brown Üniversitesi ortaklaşa olarak adlandırılan etkileşimli bir veri bilimi sistemi geliştirdi Kuzey Yıldızı .

Ekip bunun " Dünyanın en hızlı etkileşimli AutoML aracı "Hıza ek olarak, DARPA D3M AutoML yarışmasında tüm rakipleri geride bırakan model puanları üretir.

Bir kullanıcı olarak, yalnızca veri kümesini yüklemeniz ve ardından tahmin etmek istediğiniz hedefi bir tahminciye sürüklemeniz gerekir. Birkaç (on) saniye Sistem, en uygun makine öğrenimi modelini bulmanıza yardımcı olacaktır.

Adının verilmemesini isteyen bir yorumcu şunları söyledi:

TNT kullanmaktan daha kolaydır.

Veri bilimcisi olmasanız bile, çeşitli sektörlerdeki gerçek dünya sorunlarını analiz etmek için elinizdeki verilerden tam olarak yararlanabilirsiniz.

Dahası, bu sistem aynı cihazı veya birden fazla cihazı kullanarak çok kişili işbirliğini destekler. Bilgisayarlar, tabletler, etkileşimli yazı tahtaları ... her türlü cihaz desteklenir.

Artık Northstar'ın endüstri ve akademide kullanıcıları var. Adobe Onlardan biri.

Ne yapılabilir?

Bir tıp araştırmacısından bir kestane alayım.

MIT Boston'da, sonra hepsini koy Boston'daki YBÜ Hastaları için Sağlık Bilgileri Hepsini Northstar'a besle.

Yükleme sonrasında cinsiyet, yaş, BMI, sindirim hastalığı, kalp yetmezliği gibi çeşitli parametreler girilecektir " Öznitellikler (Öznitelikler) "Bu sütun.

Kayar kısım çeşitli özelliklerdir

Makine öğreniminden önce

İlk önce farklı nitelikler arasındaki ilişkiyi gözlemleyebilirsiniz.

Örneğin, genellikle erkeklerin kadınlardan daha olası olduğuna inanılmaktadır. kalp yetmezliği (Kalp Yetmezliği), sadece bu kuralın uygulanabilirliğini doğrulamak için.

"Kalp yetmezliği" ve "cinsiyet" olmak üzere iki özniteliği dışarı çıkararak ve sonra bunları birbirine bağlayarak, kadın sayısının biraz daha düşük olduğu bulundu. Ancak iki özelliği birbirine yaklaştırırsanız, orantılı olarak kadınların erkeklerden daha yüksek bir insidans oranına sahip olduğunu göreceksiniz:

Oranı hesaplamak için yakın bir konuma sürükleyin

Ek olarak, birden fazla hastalık türünün bir arada bulunma olasılığını kolayca gözlemleyebilirsiniz.

Örneğin bulaşıcı hastalıklar, kan hastalıkları ve metabolik hastalıklar.

Üçünü bağlamanın yanı sıra, Northstar'ın adında daha özlü bir aracı da var. sık kullanılan öğe kümesi :

Üç tür hastalığın olası tüm kombinasyonlarını ve olasılıklarını hesaplayabilir:

en kolay Eşzamanlı Metabolik hastalık ve kan hastalığıdır ve tek başına metabolik hastalık olasılığı tüm olasılıkların en yükseğidir.

Şu anda, 50 yaşın üzerindeki hastaları taramak için "yaş" özelliği kullanıldığında, metabolik hastalıkların yüzdesi% 73'e yükseldi.

Not: Verilerde yaşı sıfır ile doldurulmuş birçok hasta bulunmaktadır ve bunlar da tek bir tıklama ile silinebilir, geriye sadece geçerli kısım bırakılabilir.

Veriler burada.

Makine öğrenimi sona erdi

Bir hastada kalp yetmezliği olup olmadığını tahmin etmek istiyorsanız, algoritma sütunundan birini çekin Tahminci (Öngörücü).

Sonra tahmin edilecek "kalp yetmezliğini" tahmin edicinin "Hedefine" sürükleyin.

Bu şekilde tahmin edicinin sağ tarafında bir dizi model üretilecek ve her modelin tahmin doğruluğu görüntülenecektir.

Model oluşturulduktan sonra, en iyi performansa sahip modeli seçebilir ve daha yakından bakmak için açabilirsiniz:

Bu doğruluk % 92,25 Toplamda 8 adım var.

Bu model artık bir Python betiği olarak dışa aktarılabilir ve gelecekte manuel olarak optimize edilebilir veya doğrudan kullanıma sokulabilir.

Ek olarak, her bir farklı parametrenin ağırlığını da görebilirsiniz:

Bunlar arasında, kalp yetmezliğini tahmin etmede en yararlı olanı " heart_ischemic "Özellikler.

anlamı Kardiyak iskemi Sıklıkla kalp yetmezliği eşlik eder.

Yani bir sonraki adım, bu özelliği tahmin edenin hedefine atmaktır.

Bu durumda, yeniden oluşturulan model, Tahmin etmek için bu belirtiye güvenmeyin Yukarı.

Ayrıca, seçtiğiniz modelin tahmin sonuçlarını Ground Truth ile karşılaştırabilirsiniz.

Doğrudan yukarıdaki resim gibi sürükleyin ve Sahte vajina ile Yanlış pozitif Durum.

Bu iki parçayı seçip "yaş" ile bir araya getirerek, yapay zekanın tahmininin hangi yaşta hatalara daha yatkın olduğunu anlayacaksınız.

Bu modelin hata oranı zamanla neredeyse doğrusal olarak artar.

Bu noktada bir kestane bitmiştir.

Ancak soru şu: AutoML tarafından bulunan model geçerli olmalı mı?

Hayır, tahmin sonuçları büyüleyici görünüyorsa, bunun nedeni öznitelik sütunundaki veri kümesinin yararlı bir tahmin aracı olmaması olabilir.

Ancak sorun değil, sistem bir veri kümesi arama aracıyla birlikte gelir datamart Anahtar kelimeleri girin, ilgili veri setlerini bulabilirsiniz.

Örneğin, "Yoksulluk" girerseniz, Amerika Birleşik Devletleri'ndeki her ilçenin nüfus verilerini görebilirsiniz.

Bu verilerle sistemin bulduğu yoksulluk belirleyicilerinin performansı da iyileştirilecek.

Bunu nasıl yaptın?

Northstar'ın cesareti üç perspektife yansıtılır; biri hız, diğeri üretken modelin kalitesi ve üçüncüsü etkileşim yeteneği.

Ekip, bunun sistem tarafından yapıldığını söyledi Dört bölüm Ortaklaşa karar verildi (Üçüncü Bölüm Yüksek Enerji).

ilk kısım Vizdom olarak adlandırılan bu, üzerinde özgürce oynanabilen, sınırları olmayan bir çizim tahtası gibi, insanın sezgisel olarak en çok hissedilen kısmı, ön uçtur.

Rahat olmanın nedeni, arkasında güçlü bir veri motoru olmasıdır:

ikinci kısım Adı IDEA, bu motor. Tam adı "Interactive Data Exploration Accelerator" dır ve şu şekilde anlaşılabilir: Örnek yönetici .

Belleği üç bölüme ayırır, biri Sonuç Önbelleği, diğeri Örnek Deposu ve üçüncüsü Dizinler.

Kullanıcı çalışmaya başladığında, IDEA çeşitli veri kaynağı Verileri alın, spekülatif işlemler gerçekleştirin ve ardından kullanıcıların daha sonra verebilecekleri komutları desteklemek için sonuçları önbelleğe alın.

IDEA aynı zamanda tüm gelen verileri "örnek depolama" konumuna önbelleğe alacaktır. Boşluk yoksa, IDEA önbelleği güncellemeye başlayacaktır: Gölet örneklemesi (Rezervuar Örnekleme), bir veri seti oluşturmak için Tanıtıcı örnek (Temsili Örnek), veri akışı önyargılı olsa bile, daha sonra işlenecektir:

Veri akışı önyargısının (Önyargı) etkisinden kaçınmak için IDEA, birçok veritabanının sahip olduğu örnekleme operatörlerini ve bu verilerin rasgele ofsetlerini (Rastgele Sapmalar) kullanır.

IDEA ayrıca havuz örneğini, bir dağıtımın sonunu aşırı temsil etmek veya özel bir indeks oluşturmak için kullanılan birkaç tabakalı alt örneğe bölebilir.

Tüm kararları, kullanıcının geçmiş ve mevcut işlemlerine dayanmaktadır. Sürekli optimize edin :

Örneğin, kullanıcı yeni bir özniteliği tuvale sürüklediğinde, sistem, kullanıcıdan olası isteklere önceden hazırlanmak için bu yeni özniteliğe daha fazla kaynak ayıracaktır.

Ek olarak, hesaplama ilerledikçe, IDEA bu sonuçların eksiksizliği ve hata analizi dahil olmak üzere sürekli olarak ön uca daha doğru sonuçlar iletecektir.

Böylelikle kullanıcı keyfi olarak oynasa bile, veri boyutu veya türü ne olursa olsun sistem hızlı bir şekilde beklemede kalabilir.

Üçüncü bölüm, en önemli olan Alpine Meadow olarak adlandırılır. .

IDEA verileri hazırladıktan sonra en uygun algoritmayı ve en uygun hiperparametreleri seçmekle sorumludur.

2013 yılında ekip geliştirdi MLbase : Makine öğrenimi görevinin ne olduğunu açıklamak için basit bir bildirim yolu (Bildirime Dayalı Yöntem) kullanın (ancak belirli talimatlar vermeyin); ayrıca yeni bir optimize edici sağlayın, bir öğrenme algoritması seçin ve mevcut göreve dinamik olarak uyum sağlayabilirsiniz .

Sadece MLbase, insanlarla etkileşim için doğmamış ve parametrelerin ayarlanması genellikle birkaç saat sürüyor.

Bu nedenle ekip bu temelde hareket ederek hızlı ve etkili bir Alpine Meadow elde etti:

İlk önce kanıtlandı, koy Kural tabanlı optimizasyon (Kural Tabanlı Optimizasyon) yöntemi, çok kollu slot makinesi, Bayes optimizasyonu ve meta-öğrenme ile birleştirilmiş, bir sistemde akıllıca birleştirilerek en iyi makine öğrenimi modelini etkili bir şekilde bulabilir.

Ve uyarlanabilir bir seçim algoritması tasarladı Eğitim seti ile doğrulama setinin hatasını karşılaştırarak, bazı güvenilmez boru hatları erkenden budanabilir. Bu, eğitim örneklerinin örnekleri büyüdükçe büyüdükçe daha yüksek verimlilik elde etmeye yardımcı olur.

Sonuç olarak, Alpine Meadow çok çeşitli görevleri destekler ve diğer AutoML sistemlerinden çok daha çok yönlüdür:

Ve daha önce görülmemiş veri setlerinin% 80'inde temel olarak uzman sistemi geride bırakıyor:

Aşağı bak hız .

Yeşil, Alpine Meadow'un ilk çözümü bulması için gereken zamandır. Aynı sayıda başarılı veri kümesi olması durumunda, diğer algoritmalardan çok daha az zaman alır:

Çözümün veri kümesindeki göreceli sıralaması, diğer algoritmalardan önemli ölçüde daha iyidir (ne kadar düşükse o kadar iyidir):

Ardından, DARPA yarışmasından elde edilen puanlar (normalleştirilmiş):

Şimdiye kadar, DARPA D3M AutoML yarışmasında tüm rakiplerini geride bıraktı.

Yine de Alpine Meadow'un tek başına bir sorunu yoktur. Ancak bu dört bölümlü sistemde son bir bölüm var:

dördüncü bölüm Kullanıcının her etkileşimini izleyebilen ve genel hatalar ve sorunlar için uyarılar veren QUDE'dir.

Bu modüller birlikte, eksiksiz Northstar'dır.

Merhemdeki sinek, bireysel kullanıcılar için giriş yok gibi görünüyor.

"Tüm MIT'deki En Akıllı Adam"

MIT ve Brown Üniversitesi'nin oluşturduğu ekip, NorthStar'da dört yıl geçirdi.

Lider, MIT'nin prestijli CSAIL laboratuvarından Doçent Tim Kraska'dır.

Proje, özü Çayır Alp Tez, SIGMOD 19'da kabul edildi.

İlk kağıt denir Shang Zeyuan , Yine CSAIL'den, Kraska'da doktora öğrencisi.

Gençliğin kampüs ana sayfası, alan adı dikkat çekicidir:

Aşağıda bir dizi gurur verici talimat da var:

MIT'deki en zeki kişinin kim olduğunu öğrenmek istiyorsanız, lütfen https://www.shangzeyuan.com/ adresine gidin.

Alpine Meadow tez portalı:

NorthStar tez portalı:

- Bitiş -

Qubit · QbitAI

' ' Yapay zeka teknolojisi ve ürünlerindeki yeni eğilimleri takip edin

En son bilgileri almak için sağ üst köşedeki "+ Takip Et" i tıklayın

Beğendiyseniz, lütfen paylaşın veya beğenin ~ Bixin

Wu Lei, ulusal bayrağın imzalanamayacağını söyleyerek ulusal bayrağı imzalamayı reddetti. Netizenler: Bu tür bir bilince sahip olmak iyidir
önceki
Çevrimiçi araç çağırma için "güvenlik kartını" oynayın ve T3 seyahati insanlar, arabalar ve yollarla garanti edilir
Sonraki
JBL / UA TRUE WIRELESS FLASH ROCK gerçek kablosuz kulaklık-Dashi Johnson özel baskısı yayınlandı
Ev geliştirme ve inşaat malzemeleri alanında "dışarıdan" sektördeki ilk üçe kadar "Alibaba" Shangpin Eve Teslim
Yüksek verimli Huawei'yi önlemek için Apple, Intel'in cep telefonu ana bant işini 1 milyar dolara satın aldı! 5G yedek lastik yapın
Qianli Qijiang Xing Soruşturma Grubu, antik kasabayı "yalnız değil" yapmak için yeni sarsıntı ve statik kombinasyona girer
ChinaJoy 2019 Intel tema pavyonunu anlamanız için 7 dakika
Huawei Mate 30 serisi koruyucu kabuk maruziyetinin görünümü: Liu Haiping + arka dairesel kamera modülü
HUAWEI 200W Ph.D.'nin yıllık maaşı tarandıktan sonra, hızlı bir şekilde üst düzey mühendislerden oluşan bir sırayı çıkardım
Huawei HiSiliconın tam ateş gücü: Bilgisayarlar için CPU'lar ve GPU'lar dahil olmak üzere daha fazla yonga geliştiriliyor
Dene! WeChat gizlice tekrar güncellenir! Bu özellik çok eğlenceli hahaha
Qixi Festivali hediye rehberi özel olarak sunuluyor, Jingdong artık "devrilmenize" izin vermeyecek
Ali Pingtou ilk teslimat! "Dünyanın zor fişleri olmasın"
Ali CTO Zhang Jianfeng: Bulut dönüm noktası geldi, Hepsi bulutta; Jia Yangqing'in tam unvanı açıklandı
To Top