Yazar: AARSHAY JAIN
Çeviri: Wang Ting
Redaksiyon: Ding Nanya
Bu makale var 4700 kelime, 10+ dakika için önerilen okuma .
Bu makale, yeni başlayanların yüksek kaliteli makine öğrenimi modelleri oluşturmasına yardımcı olacak GUI odaklı veri bilimi araçlarını tanıtır.
Giriş
Programlama, veri biliminin ayrılmaz bir parçasıdır. Aslında, programlama mantığını, döngülerini ve işlevlerini anlayan kişilerin başarılı veri bilimcileri olma olasılığı daha yüksektir. Peki ya okulda programlamayı hiç öğrenmemiş insanlar?
Veri bilimcisi olamazlar mı?
Son yıllarda veri biliminin güçlü gelişimi ile birçok kişi bu alana girmekle ilgilenmektedir. Ancak programlama bir kayıptır. Aslında, ilk işimden önce, programlamayanlar liginin de üyesiydim. Bu nedenle, hiç öğrenmediğiniz bir şeyin sizi herhangi bir adımda rahatsız etmesinin ne kadar korkunç olduğunu anlıyorum.
İyi haber şu ki, programlama becerileriniz ne olursa olsun, bir veri bilimcisi olmanın bir yolu var! Programlamadan kaçınmak ve kullanıcı dostu bir GUI (grafik kullanıcı arayüzü) sağlamak için bazı araçlar vardır, bu nedenle algoritmalar hakkında çok az şey bilen herkes bunları yüksek kaliteli makine öğrenimi modelleri oluşturmak için kullanabilir.
Birçok şirket (özellikle yeni başlayanlar) son zamanlarda GUI güdümlü veri bilimi araçlarını tanıttı. Bu makalede bazı önemli araçları tanıtmak ve olabildiğince çok video sağlamak için elimden geleni yapıyorum.
Not: Sağlanan tüm bilgiler açık kaynak bilgi kaynaklarından toplanmaktadır. Görüşler yerine sadece bazı gerçekleri gösteriyoruz. Asla herhangi bir ürünü / hizmeti tanıtmaya veya reklamını yapmaya çalışmayacağız.
Aşağıda, bu sefer tanıtılan araçların bir listesi verilmiştir:
1. RapidMiner
bağlantı:
https://rapidminer.com/
Tanıtım videosu:
https://www.youtube.com/embed/ma14K56fNAM?feature=oembedwidth=500height=750
RapidMiner (RM) ilk olarak 2006 yılında Rapid-I adlı açık kaynaklı bağımsız bir yazılım olarak piyasaya sürüldü. Yıllar içinde, adını RapidMiner'den aldılar ve yaklaşık 35 milyon dolarlık finansman aldılar. Aracın eski sürümü (v6'nın altında) açık kaynaklıdır, ancak en son sürümün 14 günlük deneme süresi vardır ve bundan sonra bir lisans gerektirir.
RM, veri hazırlamadan modellemeye ve son olarak doğrulama ve devreye almaya kadar tahmine dayalı modellemenin tüm yaşam döngüsünü kapsar. GUI, Matlab Simulink'e çok benzeyen bir blok diyagram yöntemine dayanmaktadır. Tak ve çalıştır cihazları olarak kullanılmak üzere önceden tanımlanmış bloklar vardır. Bunları doğru şekilde bağlamanız yeterlidir ve tek bir kod satırı olmadan çeşitli algoritmaları çalıştırabilirsiniz. En önemlisi, özel R ve Python komut dosyalarının sisteme entegrasyonuna izin verirler.
Mevcut ürünler şunları içerir:
RM şu anda otomotiv, bankacılık, sigorta, yaşam bilimleri, imalat, petrol ve gaz, perakende, telekomünikasyon ve kamu hizmetleri gibi çeşitli sektörlerde kullanılmaktadır.
2. DataRobot
bağlantı:
https://www.datarobot.com/
Tanıtım videosu:
https://youtu.be/wZCNKDX1q4o
DataRobot (DR), Jeremy Achin, Thoman DeGodoy ve Owen Zhang da dahil olmak üzere dünyanın en iyi Kagglers tarafından oluşturulan son derece otomatik bir makine öğrenimi platformudur. Platform, veri bilimcilerine olan ihtiyacı ortadan kaldırdığını iddia ediyor. Bu, web sitelerindeki bir cümleden açıkça anlaşılabilir: "Veri bilimi, matematik ve istatistik nitelikleri, programlama becerileri ve iş bilgisi gerektirir. DataRobot ile, yalnızca iş bilgisi ve verilerini sağlamanız gerekir ve son teknoloji otomasyonumuz gerisini halleder."
DR aşağıdaki avantajlara sahip olduğunu iddia ediyor:
3. BigML
bağlantı:
https://bigml.com/
Tanıtım videosu:
https://youtu.be/JVM8qIn3xPQ
BigML, kullanıcıların aşağıdaki 6 adımda uzmanlaşmasına olanak tanıyan iyi bir grafik kullanıcı arayüzü sağlar:
Bu süreçler açıkça farklı bir sırada yinelenecektir. BigML platformu iyi sonuç görselleştirme sağlar ve sınıflandırma, regresyon, kümeleme, anormallik algılama ve ilişkilendirme keşif problemlerini çözmek için algoritmalara sahiptir. Aylık, üç aylık ve yıllık aboneliklerle paketlenmiş çeşitli yazılım paketleri sunarlar. Ücretsiz bir katman bile sunarlar, ancak yükleme veri kümesi boyutu 16MB ile sınırlıdır.
Arayüzlerinin nasıl çalıştığını YouTube kanallarından öğrenebilirsiniz.
4. Google Cloud AutoML
bağlantı:
https://cloud.google.com/automl/
Tanıtım videosu:
https://youtu.be/GbLQE2C181U
Cloud AutoML, Google'ın makine öğrenimi bileşeninin bir parçasıdır ve sınırlı makine öğrenimi uzmanlığına sahip kişilerin yüksek kaliteli modeller oluşturmasına olanak tanır. Cloud AutoML ürün portföyünün bir parçası olan ilk ürün, Cloud AutoMLVision'tır. Bu hizmet, görüntü tanıma modellerini eğitmeyi kolaylaştırır. Görüntüleri yüklemenize, modelleri eğitmenize ve ardından bu modelleri doğrudan Google Cloud'da dağıtmanıza olanak tanıyan bir sürükle ve bırak arayüzüne sahiptir.
Cloud AutoML Vision, Google'ın aktarım öğrenimi ve sinir mimarisi arama teknolojilerine dayanmaktadır. Bu araç birçok kuruluş tarafından kullanılmıştır. AutoML'nin iki harika gerçek hayat örneğinde nasıl performans gösterdiğini ve diğer araçlardan nasıl daha iyi sonuçlar verdiğini görmek için bu makaleye göz atın.
5. Paxata
bağlantı:
https://www.paxata.com/
Tanıtım videosu:
https://youtu.be/bxxsCLmXmms
Paxata, makine öğrenimi veya istatistiksel modelleme yerine veri temizleme ve ön işlemeye odaklanan birkaç kuruluştan biridir. Bu, kullanımı kolay bir MS Excel uygulamasıdır. Ayrıca verileri kolayca bir araya getirmek, karışık gürültü veya eksik verileri bulup düzeltmek ve ekipler arasında veri öğelerini paylaşmak ve yeniden kullanmak için görsel rehberlik sağlar. Bu makalede bahsedilen diğer araçlar gibi, Paxata da kodlama veya komut dosyası oluşturmayı ortadan kaldırarak verilerin işlenmesiyle ilgili teknik engellerin üstesinden gelir.
Paxata platformu aşağıdaki süreci takip eder:
Praxata, finansal hizmetler, tüketim malları ve ağ oluşturma alanlarında yer almıştır. İşiniz çok fazla veri temizliği gerektiriyorsa, iyi bir araç olabilir.
6. Trifacta
bağlantı:
https://www.trifacta.com/
Tanıtım videosu:
https://youtu.be/L-jWAsJNmAU
Trifacta, veri ön işlemeye odaklanan başka bir başlangıçtır. 3 ürünü vardır:
Trifacta, veri temizliği gerçekleştirmek için çok sezgisel bir GUI sağlar. Verileri girdi olarak alır ve sütunlar halinde çeşitli istatistiksel verilerin bir özetini sunar. Ek olarak, her sütun için, otomatik olarak tek bir tıklama ile seçilebilecek bazı dönüşümler önerecektir. Veriler üzerinde çeşitli dönüştürmeler yapmak için önceden tanımlanmış bazı işlevleri kullanabilirsiniz ve bu işlevler arayüzde kolayca çağrılabilir.
Trifacta platformu aşağıdaki veri hazırlama adımlarını kullanır:
Trifacta temel olarak finans, yaşam bilimleri ve telekomünikasyon endüstrilerinde kullanılmaktadır.
7. MLBase
bağlantı:
Tanıtım videosu:
https://youtu.be/W-WPclNo8v0
MLBase, Berkeley Kaliforniya Üniversitesi AMP (Algoritmik Robotik) Laboratuvarı tarafından geliştirilen açık kaynaklı bir projedir. Bunun arkasındaki temel fikir, makine öğrenimini büyük ölçekli sorunlara uygulamak için basit bir çözüm sağlamaktır.
3 ürünü vardır:
8. Otomatik WEKA
bağlantı:
Tanıtım videosu:
https://youtu.be/LcHw2ph6bss?list=PLm4W7_iX_v4NqPUjceOGd-OKNVO4c_cPD
Auto-WEKA, Yeni Zelanda'daki Waikato Üniversitesi'nin makine öğrenimi ekibi tarafından geliştirilen Java ile yazılmış bir veri madenciliği yazılımıdır. Bu, veri bilimine yeni başlayanlar için çok yararlı olan GUI tabanlı bir araçtır. En büyük avantajı, açık kaynak olması ve geliştiricilerin başlamanıza yardımcı olacak eğitimler ve belgeler sağlamasıdır. AV makalesinde bunun hakkında daha fazla bilgi edinebilirsiniz. Şu anda ağırlıklı olarak eğitim ve akademik amaçlarla kullanılmaktadır.
9. Sürücüsüz AI
bağlantı:
https://www.h2o.ai/driverless-ai/
Tanıtım videosu:
https://youtu.be/KkvWX3FD7yI
Sürücüsüz AI, otomatik makine öğrenimini destekleyen h2o.ai kuruluşları için büyülü bir platformdur. Docker görüntüsünün Ocak deneme sürümü bu bağlantıda kullanılabilir. Modelin performansını izlemek istediğiniz ölçümleri eğitmek, test etmek ve belirtmek üzere bir dosya seçmek için yalnızca basit bir açılır liste kullanmanız gerekir. Oturun ve sezgisel platformun veri kümenizde mükemmel sonuçlar almasını izleyin ve bunu deneyimli bir veri bilimcinin önerebileceği iyi bir çözümle karşılaştırın.
Sürücüsüz Yapay Zekanın iş fonksiyonları şunlardır:
10. Microsoft Azure ML Studio
bağlantı:
https://studio.azureml.net/
Tanıtım videosu:
https://youtu.be/tW1JV6bHXFA
Bu alanda bu kadar büyük oyuncu varken, Microsoft nasıl geride kalabilir? Azure ML Studio, basit ancak güçlü bir tarayıcı tabanlı makine öğrenimi platformudur. Görsel bir sürükle ve bırak ortamına sahiptir ve programlamaya gerek yoktur. Acemiler için, araçta hızlı bir şekilde ustalaşmalarına yardımcı olabilecek kapsamlı eğitimler ve örnek deneyler yayınladılar.
Beş basit adım kullanır:
11. MLJar
bağlantı:
https://mljar.com/
Tanıtım videosu:
https://youtu.be/ijmw94h4qCk
MLJar, makine öğrenimi modellerini hızla oluşturmak ve dağıtmak için tarayıcı tabanlı bir platformdur. Sezgisel bir arayüze sahiptir ve modelleri paralel olarak eğitmenize olanak tanır. Modellerin konuşlandırılmasını kolaylaştıran yerleşik bir hiperparametre arama işlevine sahiptir. MLJar, NVIDIA'nın CUDA, python, TensorFlow vb. İle entegrasyon sağlar.
İyi bir model oluşturmak için yalnızca üç adımı gerçekleştirmeniz gerekir:
Araç şu anda abonelik sürümünde kullanılıyor. Ücretsiz bir sürümü vardır ve 0.25GB veri seti sınırına sahiptir. Kesinlikle denemeye değer.
12. Amazon Lex
bağlantı:
https://aws.amazon.com/cn/lex/
Tanıtım videosu:
https://youtu.be/d3LYlNqfuzI
Amazon Lex, dakikalar içinde kendi sohbet botunuzu oluşturmanız için kullanımı kolay bir konsol sağlar. Lex'i uygulamalarda veya web sitelerinde konuşma arayüzleri oluşturmak için kullanabilirsiniz. Tek yapmanız gereken bazı ifadeler sağlamak ve gerisini Amazon Lex halleder! Bu modeli kullanarak eksiksiz bir doğal dil modeli oluşturur, müşteriler ses ve metin kullanarak uygulamalarla etkileşime girebilir.
Ayrıca, Amazon Web Services (AWS) platformuyla yerleşik entegrasyona sahiptir. Amazon Lex, tümüyle yönetilen bir hizmettir, bu nedenle kullanıcı etkileşiminiz artmaya devam eder ve robot deneyiminizi iyileştirmek için donanım yapılandırma ve altyapıyı yönetme konusunda endişelenmenize gerek kalmaz.
13. IBM Wastson Studio
bağlantı:
https://www.ibm.com/cloud/watson-studio
Tanıtım videosu:
https://youtu.be/1_W6Y3c2Aeg
Bu makale IBM Watson'ı nasıl özleyebilir? Dünyanın en tanınmış markalarından biridir. IBM Watson Studio, öğrenim makineleri ve derin öğrenme modellerini oluşturmak ve devreye almak için güzel bir platform sağlar. Verilerinizi etkileşimli olarak keşfedebilir, temizleyebilir ve dönüştürebilir, Jupyter dizüstü bilgisayarlar ve RStudio gibi tanıdık açık kaynaklı araçları kullanabilir, en popüler kitaplıklara erişebilir, derin sinir ağlarını eğitebilir ve daha pek çok şey yapabilirsiniz.
Bu alana yeni girenler için, giriş aşamasını basitleştirmek için bir dizi video sunarlar. Ücretsiz olarak denemeyi seçebilir ve bu harika aracı kendiniz görebilirsiniz. Yukarıdaki video, Watson Studio'da nasıl proje oluşturacağınız konusunda size yol gösterecektir.
14. Otomatik İstatistikçi
bağlantı:
https://www.automaticstatistician.com/index/
Otomatik İstatistikçi kendi başına bir ürün değil, veri keşif ve analiz araçları oluşturan bir araştırma kuruluşudur. Her türlü veriyi kullanabilir ve ayrıntılı raporlar oluşturmak için doğal dil işlemesini çekirdek olarak kullanabilir. Cambridge ve MIT'de çalışan araştırmacılar tarafından geliştirildi ve 750.000 $ karşılığında Google Focus Araştırma Ödülü'nü kazandı.
Halen aktif bir gelişme aşamasındadır, ancak yakın gelecekte yakından izlenmelidir. Nihai raporun bazı örneklerini burada görebilirsiniz.
Daha fazla araç
Bu isimleri ilk kez duyuyorsanız, yalnız değilsiniz! Giderek daha fazla veri toplandıkça, otomatik makine öğrenimi pazarı genişliyor. Önümüzdeki birkaç yıl içinde pazara girecekler mi? Zaman her şeyi kanıtlayacak. Ancak bu mükemmel araçlar, makine öğrenimini öğrenmeye başlamak isteyen veya mevcut kataloglarına eklemek için alternatifler arayan kuruluşlara yardımcı olabilir.
son sözler
Bu makalede, veri bilimi sorunlarının çözümünü otomatikleştirmeyi amaçlayan çeşitli girişimleri tartıştık. Bazıları ilk araştırma aşamasındadır, bazıları açık kaynaklıdır ve bazıları sektörde uygulanmıştır ve milyonlarca fonu vardır. Tüm bunlar, veri bilimcilerinin çalışmaları için potansiyel bir tehdit oluşturuyor ve bu çalışmanın yakın gelecekte önemli ölçüde büyümesi bekleniyor. Bu araçlar, programlama ve kodlamaya aşina olmayanlar için en iyisidir.
Bu alanda başka girişimler veya keşif yapmayı planlıyorsanız, lütfen aşağıya yorum yapmaktan ve bize ilham vermekten çekinmeyin!
Bu makaleyi ayrıca Analytics Vidhya'nın Android APP'sinde okuyabilir ve Google Play üzerinden edinebilirsiniz.
Orjinal başlık:
Programlamayı Bilmeyenler için 19 Veri Bilimi ve Makine Öğrenimi Araçları
Orijinal bağlantı:
https://www.analyticsvidhya.com/blog/2018/05/19-data-science-tools-for-people-dont-understand-coding/
Çevirmen Profili
Wang Ting Nanjing Bilim ve Teknoloji Üniversitesi'nde yüksek lisans öğrencisi, gözlerinin köşelerinde kaz ayaklarıyla gülümsemeyi seven şanslı bir kız. Katı, dogmatik veya sıkıcı olmayı sevmiyorum, yeni şeyler ile temasa geçmeyi, yeni aktivitelere katılmayı, yeni ortamlara entegre olmayı, yeni arkadaşlar edinmeyi, birbirimizden öğrenmeyi ve birbirimizden öğrenmeyi seviyorum.