Süper tamamlandı! Java tabanlı makine öğrenimi projeleri, ortamları, kitaplıkları ...

Orijinal Başlık: Java Machine Learning

Yazar: Jason Brownlee

Çeviri: Yang Jinhong

Redaksiyon: Ding Nanya

Bu makalenin uzunluğu 3000 kelime , Okumanız tavsiye edilir 8 dakika

Bu makale ana platformları ve açık kaynak Java makine öğrenimi kitaplıklarını tanıtır.

Makine öğrenimine başlamak isteyen veya öğrenen bir Java programcısı mısınız?

Program yazmak için makine öğrenimini kullanmak, öğrenmenin en iyi yoludur. Algoritmaları sıfırdan yazabilirsiniz, ancak mevcut açık kaynak kitaplıklarıyla daha büyük ilerleme kaydedebilirsiniz.

Bu makale ana platformları ve açık kaynak makine öğrenimi kitaplıklarını tanıtır. Bu makine öğrenimi kitaplıklarını kullanabilirsiniz.

çevre

Bu bölümde, makine öğrenimi için kullanılan Java ortamı veya çalışma alanı açıklanmaktadır. Makine öğrenimi görevlerini gerçekleştirmek için bir grafik kullanıcı arabirimi ve kendi uygulamalarınızı geliştirmek için bir Java API sağlarlar.

  • WEKA

Waikato Çevresel Bilgi Analizi (Weka) (https://www.cs.waikato.ac.nz/ml/weka/), Yeni Zelanda'daki Waikato Üniversitesi tarafından geliştirilen bir makine öğrenimi platformudur. Java grafik kullanıcı arabirimi, komut satırı arabirimi ve Java API arabirimi sağlayın. Muhtemelen en popüler Java makine öğrenimi kitaplığıdır ve makine öğrenimine başlamak veya pratik yapmak için iyi bir yerdir.

  • KNIME

Konstanz Information Mining (KNIME) (https://www.knime.com/), Almanya'daki Konstanz Üniversitesi tarafından geliştirilen bir analiz ve raporlama platformudur. Ar-Ge odağı ilaç araştırmasıdır, ancak genel iş zekasına doğru genişlemiştir. Grafik kullanıcı arabirimi (Eclipse tabanlı) ve Java API sağlar.

  • Hızlı madencilik

Rapid Miner (https://rapidminer.com/), Almanya'daki Dortmund Uygulamalı Bilimler Üniversitesi tarafından geliştirilmiştir. Kendi uygulamalarınızı geliştirmek için bir GUI ve bir Java API sağlar. Veri işleme, görselleştirme ve modelleme için makine öğrenimi algoritmaları da sağlanır.

  • ELKI

ELKI, Almanya Münih Ludwig Maximilian Üniversitesi tarafından Java dilinde kullanılan indeks yapısı (https://elki-project.github.io/) tarafından desteklenen KDD uygulamaları geliştirmek için bir ortamdır. Bir veri madenciliği çalışma platformu geliştirildi. Odak noktası, aykırı değer tespiti ve sınıflandırma (uzaklık işlevi yöntemlerine dayalı olarak) gibi ilişkisel veritabanlarındaki verileri işlemektir. Mini GUI, komut satırı arayüzü ve Java API sağlar.

Kütüphane

Aslında, bu makalede listelenen her proje bir Java API kitaplığıyla birlikte gelir. Ancak, bu bölümde listelenen projeler yalnızca Java API sağlar. Dar anlamda, makine öğrenimi kitaplıklarıdır.

  • Java-ML

Java Makine Öğrenimi Kitaplığı (Java-ML) ( Java'da uygulanan makine öğrenimi algoritmalarının bir koleksiyonunu sağlar. Her algoritma için standart bir arayüz sağlar, kullanıcı arayüzü (kullanıcı arayüzü) yoktur ve daha fazla okuma için ilgili bilimsel literatüre referans yoktur. Veri işleme, kümeleme, özellik seçimi ve sınıflandırma için yöntemler içerir. Bu makalenin yazıldığı tarih itibariyle en son sürümünün 2012'de olduğunu belirtmekte fayda var.

  • JSAT

Java İstatistiksel Analiz Aracı (JSAT) (https://github.com/EdwardRaff/JSAT/tree/master), orta ölçekli problemleri çözmek için saf Java dilinde uygulanan standart bir makine öğrenimi algoritması sağlar. JSAT'ın yazarı, bu kütüphaneyi kısmen kendi kendine öğrenmek, kısmen de işi tamamlamak için geliştirdiğini söyledi. Bununla birlikte, algoritmaların listesi etkileyicidir. Sınıflandırma, regresyon, toplama, kümeleme ve özellik seçme yöntemlerini içerir.

Java Büyük Veri Projesi

Bu bölüm, makine kümeleri gibi büyük verilere uygun Java projelerini listeler.

  • Mahout (Hadoop)

Apache Mahout (https://mahout.apache.org/), Apache Hadoop platformunu (dağıtılmış haritalama basitleştirme) uygulamak için makine öğrenimi algoritmaları sağlar. Proje, kümeleme ve sınıflandırma algoritmalarına odaklanır ve popüler bir uygulama odaklı uygulama, öneri sistemlerinin işbirlikçi taramasında kullanılmasıdır. Ayrıca, algoritmaları tek bir düğümde çalıştıran referans uygulamaları da içerir.

  • MLlib (Kıvılcım)

Apache Machine Learning Library (MLlib) ( Apache Spark platformu (HDFS, harita indirgeme değil) için makine öğrenimi algoritmalarının uygulanmasını sağlar. Java kitaplığı ve platformu Java, Scala ve Python bağlamalarını desteklese de. Bu kütüphane yenidir ve algoritmalar listesi kısadır, ancak hızla büyümektedir.

  • MOA

Massive Online Analysis (MOA) (https: //moa.cms. Waikato.ac.nz/), Yeni Zelanda'daki Waikato Üniversitesi'nde veri akışı madenciliği tarafından tasarlanan açık kaynaklı bir platformdur. Weka ile aynı (aynı yerde geliştirilmiştir), bir GUI, komut satırı arayüzü ve Java API sağlar. Kavram sapmasını çözmek için aykırı değer tespiti için sınıflandırma ve desteğe odaklanan uzun bir algoritma listesi sağlar. MOA, iş akışını yönetmek için gelişmiş bir veri madenciliği ve makine öğrenimi sistemi (ADAMS) (https://adams.cms.waikato.ac.nz/) kullanır ve geliştirme aynı yerdedir.

  • SAMOA

Ölçeklenebilir Gelişmiş Çevrimiçi Analiz (SAMOA) ( Yahoo tarafından geliştirilmiş bir dağıtılmış akışlı medya makine öğrenimi çerçevesidir. Apache Storm ve Apache S4 üzerinde çalışacak şekilde tasarlanmıştır. Sistem, sınıflandırma gibi görevleri tamamlamak için MOA projesi tarafından sağlanan algoritmaları kullanabilir.

Doğal dil işleme

Bu bölüm, Doğal Dil İşleme (NLP) adı verilen makine öğrenimi alt alanındaki sorunları çözmek için Java kitaplıklarına ve projelerine odaklanacaktır.

Doğal dil işleme benim alanım değil, bu yüzden sadece temel kitaplıklara işaret ediyorum.

  • OpenNLP: Apache OpenNLP (http: // opennlp. Apache.org/), tokenizasyon, segmentasyon ve varlık çıkarma gibi doğal dil işleme görevleri için yöntemler sağlayan, doğal dil metninin işlenmesine yönelik bir araç setidir.

  • LingPipe: LingPipe ( konu sınıflandırması, varlık çıkarma, kümeleme ve duyarlılık analizi için yöntemler içeren bir hesaplamalı dilbilim araç setidir.

  • KAPI: Metin Mühendisliğinin Genel Yapısı (GATE) ( metin işleme için açık kaynaklı bir kütüphanedir. Bir dizi farklı kullanım senaryosu sağlar.

  • MALLET: Makine Öğrenimi Dili Araç Seti (MALLET) ( istatistiksel doğal dil işleme, belge sınıflandırması, kümeleme, konu modelleme ve bilgi çıkarma için bir Java araç setidir.

Bilgisayar görüşü

Bu bölüm, Computer Vision (VC) adı verilen makine öğrenimi alt alan kitaplığını listeler.

Bilgisayar görüşü aşina olduğum bir alan değil, bu yüzden sadece temel kitaplıklara işaret ediyorum.

  • BoofCV: BoofCV ( bilgisayarla görme ve robotik uygulamaları için açık kaynaklı bir kitaplıktır. Görüntü işleme, özellikler, geometrik görüntü, kalibrasyon, tanıma ve görüntü veri girişi gibi işlevleri destekler.

Derin öğrenme

Derin öğrenme yöntemlerinin ve donanımının hızla gelişmesiyle sinir ağları yeniden popüler hale geldi. Bu bölüm, sinir ağlarını ve derin öğrenmeyi işlemek için temel Java kitaplıklarını listeler.

  • Kodlama: Encog ( SVM, klasik sinir ağları, genetik programlama, Bayesian ağları, HMM ve genetik algoritmalar gibi algoritmalar sağlayan bir makine öğrenimi kitaplığıdır.

  • Deeplearning4j: Deeplearning4j ( Java ile yazılmış ticari düzeyde bir derin öğrenme kitaplığı olarak kabul edilir. Hadoop ile uyumlu olarak tanımlanır ve kısıtlı Boltzmann makineleri, derin inanç ağları ve yığınlanmış gürültü azaltma otomatik kodlayıcıları dahil olmak üzere bazı algoritmalar sağlar.

sonuç olarak

Bu yazıda, Java'da makine öğrenimi için bir kütüphane veya platform seçtiğimizde, büyük proje adı seçeneğine maruz kaldık. Bunlar, öğrenciler arasında popüler öğelerdir, ancak hiçbir şekilde listelenen tek öğeler değildir. Örneğin: MLOSS.org'daki ( bu sayfaya bir göz atın (bu makale itibariyle), 71 java tabanlı açık kaynak makine öğrenimi projesini listeliyor. Bu çok önemli bir çalışma ve GitHub ve SourceForgeun yapacak daha çok işi olduğuna inanıyorum.

Öğrenciler için kilit nokta, projelerini ve ihtiyaçlarını ciddiye almaktır. Bir kitaplık veya platformdan neye ihtiyacınız olduğunu bulun, ardından size en uygun projeyi seçin ve öğrenin.

Orijinal bağlantı:

https://machinelearningmastery.com/java-machine-learning/

Editör: Huang Jiyan

Taian Probu Su sayacını kaplayan çamur endişe vericidir. Su şirketi: tespit edilebilir
önceki
Patladı! Li Xuepeng Han Süper Ligi'nde olduktan sonra, başka bir Çinli oyuncu Japon takımını yendi.
Sonraki
Guoan çekilişe pişman ama en büyük sürprizi yaşıyor! Top çarpıcı bir seyirciye bölündü, Urawa kaptanı isteksizce yumrukladı
2016'nın en kötü teknoloji listesi yayınlandı, kimin hile yaptığını görün
2017 Dünya İnternet Konferansında yapay zekanın yeni tanımı ve yeni yönü envanteri
Yaşlı çocuğun rüyasındaki Prenses Leia, Alderaan'la birlikte gitti
2017 Dünya İnternet Konferansında yapay zekanın yeni tanımı ve yeni yönü envanteri
Garip bir AFC çekilişi! Guoan rakibinin üzerine 20 kez şut attı, ancak yanlış hükümler ve hakaretlerle karşılaştı.
Bilim adamları, ışık dönüşüm oranını 6 kat artırabilen "yapay yapraklar" geliştiriyor
Özel | CİKM AnalytiCup 2017 Şampiyon Takım Kazanan Deneyim PaylaşımıPPT videosu ile
Uluslararası Şampiyonlar Kupası Guangzhou Station-Bacca skoru, Aubameyang ikiye katlandı, Milan Dott'a 1-3 kaybetti
2016'da derin öğrenme İnternetin yerini aldı
Özel | 2017'de AI alanındaki önemli olayların envanteri!
Isınma maçı Lukaku'nun ilk golü Mkhitaryan 10 kişiyi geçti Manchester United, Salt Lake City 2-1'i tersine çevirdi
To Top