En iyi makine öğrenimi algoritması uzmanı olmak için hangi algoritmaları bilmeniz gerekiyor?

Kaynak: Yunqi Topluluğu

Bu makale yaklaşık 3115 kelimedir, önerilen okuma 6 dakika.

Bu makale, makine öğrenimi alanında uzman olmanıza yardımcı olacak makine öğrenimi algoritmalarını ve sınıflandırmalarını tanıtır.

Makine öğrenimi algoritmalarına giriş

Şu anda karşılaştığınız tüm makine öğrenimi algoritmalarını sınıflandırmanın iki yolu vardır.

  • İlk algoritma gruplaması öğrenme stilidir.
  • İkinci algoritma gruplaması, biçim veya işlevdeki benzerliğe dayanır.

Genel olarak, bu iki yöntem tüm algoritmaları genelleştirebilir. Bununla birlikte, algoritmaları benzerliğe göre gruplandırmaya odaklanacağız.

Öğrenme stiline göre gruplandırılmış makine öğrenimi algoritmaları

Algoritmalar, sorunları farklı şekillerde modelleyebilir, ancak hangi sonucu istersek isteyelim, verilere ihtiyacımız var. Ek olarak, algoritmalar makine öğrenimi ve yapay zeka alanında popülerdir. Makine öğrenimi algoritmalarındaki üç farklı öğrenme yöntemine bir göz atalım:

Denetimli öğrenme

Temel olarak, denetimli makine öğreniminde, girdi verilerine eğitim verileri denir ve istenmeyen posta / istenmeyen posta olmayan veya hisse senedi fiyatları gibi bilinen bir etiket veya sonuca sahiptir. Burada model eğitim süreci ile hazırlanır. Ayrıca tahminlerin yapılması gerekiyor. Ve yanlış olduklarında bu tahminleri düzeltin. Model istenilen seviyeye gelene kadar eğitim süreci devam eder.

Örnek problem: sınıflandırma ve regresyon.

Örnek algoritmalar: lojistik regresyon ve geri yayılım sinir ağı.

Denetimsiz öğrenme

Denetimsiz makine öğreniminde, giriş verileri etiketlenmez ve bilinen hiçbir sonuç yoktur. Girdi verilerinde var olan yapıyı türeterek modeli hazırlamalıyız. Bu genel kuralları çıkarmak olabilir, ancak matematiksel süreçlerle fazlalığı azaltabiliriz.

Örnek problemler: kümeleme, boyutsallık azaltma ve ilişkilendirme kuralı öğrenme.

Örnek algoritmalar: Apriori algoritması ve k-Ortalamalar.

Yarı denetimli öğrenme

Girdi verileri, etiketli ve etiketlenmemiş örneklerin bir karışımıdır. Beklenen tahmin problemleri vardır, ancak model tahmin yapmak için verileri ve yapıyı düzenlemeyi öğrenmelidir.

Örnek problem: sınıflandırma ve regresyon.

Örnek algoritma: diğer esnek yöntemlerin uzantısı.

İşlevsel benzerliğe göre gruplandırılan algoritmalar

Makine öğrenimi algoritmaları genellikle işlevlerinin benzerliğine göre gruplandırılır. Örneğin, ağaç tabanlı yöntemler ve sinir ağı yöntemleri. Bununla birlikte, birden çok kategoriye kolayca adapte olabilen algoritmalar hala vardır. Bir sinir ağı yöntemi ve örnek tabanlı bir yöntem olan vektör nicemlemesini öğrenmek gibi.

Regresyon algoritması

Regresyon algoritmaları, değişkenler arasındaki ilişkiyi modellemeyi içerir ve bu model kullanılarak yapılan tahminlerde oluşturulan hata ölçüsünü iyileştirebiliriz.

Bu yöntemler, veri istatistiklerinin ana gücüdür ve ayrıca istatistiksel makine öğrenimi için de seçilmiştir. En popüler regresyon algoritmaları şunlardır:

Sıradan En Küçük Kareler Regresyonu (OLSR);

Doğrusal regresyon

Lojistik regresyon;

Adım adım dönüş

Çoklu uyarlamalı regresyon eğrisi (MARS);

Yerel olarak tahmin edilen dağılım grafiği yumuşatma (LOESS);

Örneğe dayalı algoritma

Bu tür bir algoritma, örnek eğitim verilerinin karar verme sorununu çözer. Bu yöntemler, yeni verilerin veritabanıyla karşılaştırılmasını gerektiren bir örnek veri veritabanı oluşturur. Karşılaştırma için, en iyi eşleşmeyi bulmak ve tahminlerde bulunmak için benzerlik ölçülerini kullanırız. Bu nedenle, örnek tabanlı yaklaşım, depolanan örneklerin temsiline vurgu yaparak kazanan her şeyi alır yaklaşımı ve bellek temelli öğrenme olarak da adlandırılır. Bu nedenle, örnekler arasında bir benzerlik ölçüsü kullanılır. En popüler örnek tabanlı algoritmalar şunlardır:

k-en yakın komşu (kNN);

Vektör nicemlemesini (LVQ) öğrenmek;

Kendi kendini organize eden özellik haritalama (SOM);

Yerel ağırlıklı öğrenme (LWL);

Düzenlilik algoritması

Burada düzenleme algoritmalarını listeledim çünkü popüler ve güçlüler. Ve genellikle diğer yöntemlere yapılan basit değişiklikler, en popüler düzenleme algoritması:

Ridge regresyonu

En az mutlak daraltma ve seçim operatörü (LASSO);

Esnek net getiri;

En Küçük Açı Regresyonu (LARS);

Karar ağacı algoritması

Karar ağacı yöntemi, veri özelliklerinin gerçek değerlerine dayanan bir karar modeli oluşturmak için kullanılır. Karar, belirli bir kayıt için tahmine dayalı bir karar verilene kadar ağaç yapısında çatallanır. Karar ağaçları genellikle hızlı ve doğrudur, bu aynı zamanda makine öğrenimi uygulayıcılarının da favori algoritmasıdır. En popüler karar ağacı algoritmaları şunlardır:

Sınıflandırma ve regresyon ağacı (CART);

Tekrarlı Dikotomiser 3 (ID3);

C4.5 ve C5.0 (güçlü yöntemlerin farklı sürümleri);

Ki-kare otomatik etkileşim tespiti (CHAID);

Karar güdük

M5;

Koşullu karar ağacı;

Bayes Algoritması

Bu yöntemler, sınıflandırma ve regresyon gibi Bayes teoremi problemleri için uygundur. En popüler Bayes algoritması:

Naif bayanlar;

Gauss Naif Bayes;

Çoklu Naif Bayes;

Ortalama Bağımlı Tahmin (AODE);

Bayesçi İnanç Ağı (BBN);

Bayes Ağı (BN);

Kümeleme Algoritması

Neredeyse tüm kümeleme algoritmaları, verilerin en iyi şekilde en büyük ortaklığa sahip gruplar halinde en iyi şekilde organize edilmesini gerektiren verilerde içsel yapının kullanılmasını içerir. En popüler kümeleme algoritmaları şunlardır:

K-ortalama;

K-ortalaması;

Beklenti maksimizasyonu (EM);

Hiyerarşik kümeleme

İlişkilendirme kuralı öğrenme algoritması

İlişkilendirme kuralı öğrenme yöntemi, verilerdeki değişkenler arasındaki ilişkiyi mükemmel şekilde açıklayabilen kuralları çıkarır. Bu kuralların büyük küpler halinde bulunabilmesi çok önemlidir. En popüler ilişki kuralı öğrenme algoritmaları şunlardır:

Apriori algoritması;

Eclat algoritması;

Yapay Sinir Ağı Algoritması

Bu algoritma modellerinin çoğu biyolojik sinir ağlarının yapısından esinlenmiştir. Bir tür model eşleştirmesi olabilirler ve regresyon ve sınıflandırma problemleri için kullanılabilirler. Yüzlerce algoritma ve varyantı olduğu için çok büyük bir alt alanı vardır. En popüler yapay sinir ağı algoritmaları şunlardır:

Algılayıcı

Geri yayılım

Hopfield sinir ağı;

Radyal Temel Fonksiyon Sinir Ağı (RBFN)

Derin öğrenme algoritması

Derin öğrenme algoritması, yapay sinir ağının bir güncellemesidir. Daha büyük ve daha karmaşık sinir ağları oluşturmakla daha çok ilgilenirler. En popüler derin öğrenme algoritmaları şunlardır:

Derin Boltzmann Makinesi (DBM);

Derin İnanç Ağı (DBN);

Evrişimli Sinir Ağı (CNN);

Yığınlanmış otomatik kodlayıcı;

Boyut azaltma algoritması

Kümeleme yöntemi gibi, boyut azaltma da verilerin doğal yapısını aramaktır. Genellikle boyutsal verileri görselleştirmek çok kullanışlıdır. Ek olarak, denetimli öğrenme yöntemlerinde kullanabiliriz.

Temel bileşen analizi (PCA);

Ana bileşen regresyonu (PCR);

Kısmi en küçük kare regresyon (PLSR);

Sammon Haritalama;

Çok boyutlu ölçekleme (MDS);

Projeksiyon takibi

Doğrusal Ayrım Analizi (LDA);

Gauss Karışımı Diskriminant Analizi (MDA);

İkinci Ayırıcı Analiz (QDA);

Fisher Ayrımcı Analizi (FDA);

Yaygın olarak kullanılan makine öğrenimi algoritmalarının listesi

Naive Bayes sınıflandırıcı makine öğrenimi algoritması

Genellikle web sayfalarını, belgeleri ve e-postaları sınıflandırmak zor ve imkansızdır. Saf Bayes sınıflandırıcı makine öğrenimi algoritmasının devreye girdiği yer burasıdır. Sınıflandırıcı aslında genel eleman değerlerini atayan bir işlevdir. Örneğin, spam filtreleme, Naive Bayes algoritmasının popüler bir uygulamasıdır. Bu nedenle, istenmeyen posta filtresi, tüm e-postalara "Spam" veya "Spam Değil" etiketini atayabilen bir sınıflandırıcıdır. Temel olarak, benzerliğe göre gruplandırılmış en popüler öğrenme yöntemlerinden biridir. Bu, popüler Bayesçi olasılık teoremi için geçerlidir.

K-anlamı: kümeleme makine öğrenimi algoritması

Genel olarak K-aracı, küme analizi için denetimsiz bir makine öğrenme algoritmasıdır. Ek olarak, K-Ortalamaları belirli bir veri seti üzerinde önceden belirlenmiş sayıda küme k aracılığıyla çalışan, deterministik olmayan ve yinelemeli bir yöntemdir. Bu nedenle, K-Means algoritmasının çıktısı, kümeler arasında ayrılmış giriş verileriyle k kümelerdir.

Vektör Makine Öğrenimi Algoritmasını Destekleyin

Temel olarak, sınıflandırma veya regresyon problemleri için denetlenen bir makine öğrenme algoritmasıdır. SVM, veri kümesinden öğrenir, böylece SVM herhangi bir yeni veriyi sınıflandırabilir. Ayrıca verileri arayarak farklı sınıflara ayırarak çalışır. Eğitim veri setini birkaç kategoriye ayırmak için kullanıyoruz. Dahası, bu tür birçok doğrusal hiper düzlem vardır ve SVM, marj maksimizasyonu adı verilen çeşitli sınıflar arasındaki mesafeyi maksimize etmeye çalışır.

SVM iki kategoriye ayrılmıştır:

  • Doğrusal SVM: Doğrusal SVM'de, eğitim verileri bir hiper düzlem ayırma sınıflandırıcısını geçmelidir.
  • Doğrusal olmayan SVM: Doğrusal olmayan SVM'de, eğitim verilerini ayırmak için hiper düzlemleri kullanmak imkansızdır.

Apriori makine öğrenimi algoritması

Bu, denetimsiz bir makine öğrenimi algoritmasıdır. Belirli bir veri kümesinden ilişkilendirme kuralları oluşturmaya alışkınız. İlişkilendirme kuralları, eğer A maddesi meydana gelirse, B maddesinin de belirli bir olasılıkla ortaya çıktığı ve oluşturulan ilişkilendirme kurallarının çoğunun IF_THEN biçiminde olduğu anlamına gelir. Örneğin, insanlar bir iPad alırsa, onu korumak için bir iPad kılıfı da alacaklar. Apriori'nin makine öğrenimi algoritmasının temel ilkesi: öğe kümeleri sık sık görünüyorsa, öğe kümelerinin tüm alt kümeleri de sık sık görünür.

Doğrusal regresyon makine öğrenimi algoritması

2 değişken arasındaki ilişkiyi gösterir ve bir değişkendeki değişikliklerin başka bir değişkeni nasıl etkilediğini gösterir.

Karar ağacı makine öğrenimi algoritması

Karar ağacı, kararın tüm olası sonuçlarını göstermek için dallara ayırma yöntemlerini kullanan grafiksel bir sunumdur. Karar ağacında, dahili düğümler özniteliklere ilişkin testleri temsil eder. Ağacın her bir dalı testin sonucunu temsil ettiğinden ve yaprak düğüm belirli bir sınıf etiketini, yani tüm öznitelikler hesaplandıktan sonra alınan bir kararı temsil eder. Ek olarak, sınıflandırmayı kök düğümden yaprak düğüme giden yola göre temsil etmeliyiz.

Rastgele orman makine öğrenimi algoritması

Tercih edilen makine öğrenimi algoritmasıdır. Rastgele veri alt kümeleriyle bir grup karar ağacı oluşturmak için torbalama yöntemini kullanıyoruz. Modeli, rastgele orman algoritmasından iyi bir tahmin performansı elde etmemiz gerektiğinden, veri setinin rastgele örnekleri üzerinde birçok kez eğitmeliyiz. Ek olarak, bu entegre öğrenme yönteminde, nihai tahmini yapmak için tüm karar ağaçlarının çıktılarını birleştirmeliyiz. Ek olarak, her bir karar ağacının sonuçlarını sorgulayarak nihai tahmini elde ederiz.

Lojistik regresyon makine öğrenme algoritması

Bu algoritmanın adı biraz kafa karıştırıcı olabilir.Lojistik regresyon algoritması, regresyon problemlerinden ziyade sınıflandırma görevleri için kullanılır. Ek olarak, buradaki "regresyon" adı, doğrusal modelin özellik uzayına sığdığı anlamına gelir. Algoritma, kategorik bağımlı değişkenin sonucunun tahmin edilmesini gerektiren doğrusal bir özellik kombinasyonuna lojistik bir işlev uygular.

sonuç olarak

Makine öğrenimi algoritmalarını inceledik ve makine öğrenme algoritmalarının sınıflandırılması hakkında bilgi sahibi olduk: regresyon algoritmaları, örnek tabanlı algoritmalar, düzenlilik algoritmaları, karar ağacı algoritmaları, Bayes algoritmaları, kümeleme algoritmaları, ilişkilendirme kuralı öğrenme algoritmaları, yapay sinir ağı algoritmaları , Derin öğrenme algoritması, boyut azaltma algoritması, entegre algoritma, denetimli öğrenme, denetimsiz öğrenme, yarı denetimli öğrenme, saf Bayes sınıflandırma algoritması, K-ortalamalı kümeleme algoritması, destek vektör makine algoritması, Apriori algoritması, doğrusal regresyon ve Lojistik dönüş. Bu algoritmalara aşinalık, makine öğrenimi alanında uzman olmanıza yardımcı olacaktır!

İngiltere'nin beşinci kademe ligi başka bir klasiktir ve milli futbol takımı da bu numaraya yenildi!
önceki
Bu Süper Lig takımı utanç verici bir rekorunu sürdürüyor! 7 maçta galibiyetsiz 5 maç kaybetti, toplam skor 5-15 kaybetti!
Sonraki
Özel Ren Fuji: Yapay Zekanın Geleceği (PPT indirmesiyle)
Resimde WuhanAir F1 Wuhan, dünyanın en eski havacılık etkinliği başladı
Süper Lig kalecisinde bir başka düşük seviye ciro! Koca ayak havayı tekmeledi, SIPG dış yardımları boş kapıya güldü
Ücretsiz biletler Ağ Güvenliği ve Veri Uyumluluğu Yönetişim Forumu (Shenzhen)
Chengdu'da Han ailesinin mezarları ortaya çıkarıldı.Arkeologların analizi: belki de yerel güçlü aile
Bilim kurgu filmlerinin süper tanrıça kostümünü gördünüz mü?
Büyük üzüntü! Liao futbol takımı, Çin'de yeni yükselen takım tarafından 3-0 süpürüldü. 19 yaşındaki dış yardım başka bir şaheser yaptı!
Güzel sonbahar! Dünya Doğu Gölü ekranı Wuhan "uluslararası arkadaş çevresi", her kare bir harikalar diyarı
UEFA Şampiyonlar Ligi-İki gol demir bel, Liverpool toplam puanı 6-3 elendi Huo Cun, İngiltere ana maçına 5 takım giriyor
Programcıları ağlatan 21 an
Herkes tarafından klasik olarak kabul edilen ancak nadiren görülen bir bilim kurgu filmi
GIF 260 dakika bekledi! Evergrande Shenfeng sonunda 2019 Süper Lig'in ilk golünü attı
To Top