Kaç tane yaygın makine öğrenimi algoritması biliyorsunuz?

1956 yılında doğan yapay zeka, akıllı algoritmalar, hesaplama hızı, depolama seviyesi ve diğer faktörlerin etkisiyle altmış yılı aşkın süredir geliştirme sürecinde birçok iniş çıkış yaşamıştır. Son yıllarda veri miktarının artması ve bilgi işlem gücünün artması, özellikle yeni makine öğrenme algoritmalarının ortaya çıkması sayesinde, yapay zeka büyük bir patlama dönemini başlattı.

Makine öğrenimi teriminden bahsederken, bazı insanlar önce bilim kurgu filmlerinde robotları düşünebilir. Aslında, makine öğrenimi, olasılık teorisi, istatistik ve algoritma karmaşıklık teorisi gibi birden çok konuyu içeren çok alanlı disiplinler arası bir konudur. Bilgisayar programlarının performans standartlarını optimize etmek için verileri veya geçmiş deneyimleri kullanarak, bilgisayarların insan öğrenme davranışlarını nasıl simüle ettiği veya uyguladığı konusunda uzmanlaşmak.

Farklı öğrenme görevlerine göre, makine öğrenimini üç türe ayırabiliriz: denetimli öğrenme, denetimsiz öğrenme ve pekiştirmeli öğrenme ve her tür bazı algoritmalara karşılık gelir.

Çeşitli algoritmalar ve ilgili görev türleri

Daha sonra, yaygın olarak kullanılan birkaç makine öğrenimi algoritmasını ve bunların uygulama senaryolarını kısaca tanıtacağım.Bu makale sayesinde, yaygın olarak kullanılan makine öğrenimi algoritmaları hakkında genel bir anlayışa sahip olabilirsiniz.

1. Denetimli öğrenme

(1) Destek Vektör Makinesi (SVM): Denetimli bir öğrenme yönteminde verilerin ikili sınıflandırmasını gerçekleştiren genelleştirilmiş bir doğrusal sınıflandırıcıdır ve karar sınırı, öğrenme örneği için maksimum marj hiper düzlemidir. Örneğin, kağıt üzerinde iki tür doğrusal olarak ayrılabilir nokta varsa, destek vektörü bu iki tür noktayı birbirinden ayırmak için düz bir çizgi bulacaktır ve bu noktalardan mümkün olduğunca uzaktır.

Avantajlar: düşük genelleme hatası oranı ve sonuçların kolay yorumlanması.

Dezavantajlar: Büyük ölçekli eğitim örneklerini uygulamak zordur, çoklu sınıflandırma problemlerini çözmek zordur ve parametre ayarlaması ve çekirdek işlevi seçimine duyarlıdır.

Uygulama senaryoları: metin sınıflandırması, portre tanıma, tıbbi teşhis vb.

(2) Karar Ağacı: Nesne nitelikleri ile nesne değerleri arasındaki bir eşleştirme ilişkisini temsil eden tahmine dayalı bir modeldir. Aşağıdaki şekil, bir karar ağacında nasıl model oluşturulacağına dair basit bir örnektir:

Avantajlar: anlaşılması ve açıklanması kolay, görsel analiz, çıkarılması kolay kurallar; alakasız özelliklerle başa çıkabilme.

Dezavantajlar: Eksik verilerle baş etmek zordur.

Uygulama senaryoları: Karar verme sürecinde daha fazla uygulama.

(3) Naif Bayesçi sınıflandırma: Belirli bir maddenin sınıflandırılması için, her bir kategorinin görünme koşulu altında ortaya çıkma olasılığı, hangisi en büyükse çözülür ve sınıflandırılacak kategori hangi kategoriye aittir. Bayes formülü şöyledir: p (A | B) = p (B | A) * p (A / p (B), burada P (A | B) arka olasılığı temsil eder ve P (B | A) olasılıktır Değer, P (A) kategorinin önceki olasılığıdır, P (B) tahmin edenin önceki olasılığını temsil eder.

Avantajlar: Daha az veri olduğunda hala etkilidir ve çok kategorili sorunları çözebilir.

Dezavantajlar: Giriş verilerinin hazırlanmasına duyarlıdır.

Uygulama senaryoları: metin sınıflandırması, yüz tanıma, dolandırıcılık algılama.

(4) K-En Yakın Komşu (KNN): Sınıflandırma için farklı özellik değerleri arasındaki mesafeyi ölçme yöntemini kullanan, örnek tabanlı bir öğrenmedir. Temel fikir şudur: Bir eğitim örnek seti verildiğinde, yeni verileri etiketsiz girin, yeni verilerin her bir özelliğini, örnek setindeki verilerin karşılık gelen özelliği ile karşılaştırın ve en yakın komşuyu bulun (genellikle 20'den büyük olmayan) Tamsayı) örneği Bu k örneklerin çoğu belirli bir sınıfa aittir ve daha sonra girdi örneğini bu sınıfa sınıflandırır.

Avantajlar: basit, anlaşılması kolay, uygulaması kolay, parametreleri tahmin etmeye gerek yok. Ek olarak, Naive Bayes gibi algoritmalarla karşılaştırıldığında, veri girişi varsayımı, yüksek doğruluk ve anormal veri değerlerine duyarsız yoktur.

Dezavantajlar: Eğitim verilerine bağımlılık nispeten büyüktür ve eğitim aşaması eksiktir ve birden fazla örnekle baş edemez.

Uygulama senaryoları: karakter tanıma, metin sınıflandırması, görüntü tanıma ve diğer alanlar.

2. Denetimsiz öğrenme

(1) Temel Bileşen Analizi (PCA): İstatistiksel bir yöntemdir. Ana fikir, n-boyutlu özellikleri k-boyutlarına eşlemektir Bu k-boyutu, orijinal n-boyutlu özelliğe dayalı olarak yeniden yapılandırılan k-boyutlu bir özellik olan, ana bileşen olarak da adlandırılan yepyeni bir ortogonal özelliktir.

Avantajlar: verilerin karmaşıklığını azaltın ve en önemli özellikleri belirleyin.

Dezavantajlar: Ana bileşenin her bir özellik boyutunun anlamı, orijinal örnek özellik kadar açıklayıcı olmayan belirli bir belirsizlik derecesine sahiptir; yararlı bilgileri kaybedebilir.

Uygulama senaryoları: ses, görüntü ve iletişimin analizi ve işlenmesi.

(2) Tekil Değer Ayrışımı (SVD): Daha karmaşık bir matris, daha küçük ve daha basit birkaç alt matrisin çarpımı ile temsil edilebilir.Bu küçük matrisler, matrisin önemli özelliklerini tanımlar.

Avantajlar: Verileri basitleştirin, gürültü noktalarını kaldırın ve algoritma sonuçlarını iyileştirin.

Dezavantajlar: Verilerin dönüştürülmesinin anlaşılması zor olabilir.

Uygulama senaryoları: öneri sistemi, görüntü sıkıştırma vb.

(3) K-Means kümeleme (K-Means): benzerlik indeksi olarak mesafeyi kullanan yinelemeli çözüm kümeleme analiz algoritmasıdır. İş akışı, ilk küme merkezleri olarak K nesnelerini rastgele belirlemek, ardından her nesne ile her çekirdek küme merkezi arasındaki mesafeyi hesaplamak ve her nesneyi kendisine en yakın küme merkezine atamaktır.

Avantajlar: Algoritma basit ve uygulaması kolaydır.

Dezavantajlar: Yerel minimuma yakınsayabilir ve büyük ölçekli veri kümelerinde yakınsama yavaştır.

Uygulama senaryoları: görüntü işleme, veri analizi ve pazar araştırması vb.

Üç, pekiştirmeli öğrenme

Q-öğrenme: Eylem değeri fonksiyonuna göre hangi eylemin seçilmesi gerektiğini değerlendiren, değer temelli bir pekiştirme öğrenme algoritmasıdır.Bu fonksiyon, belirli bir durumda olmanın ve o durumda belirli bir eylemi gerçekleştirmenin beklenen ödül değerini belirler.

Avantajlar: Daha geniş bir veri yelpazesi alabilir.

Dezavantajlar: çok yönlülük eksikliği.

Uygulama senaryosu: oyun geliştirme.

Yukarıdakiler makalenin tüm içeriğidir. Herkesin yaygın olarak kullanılan makine öğrenimi algoritmaları hakkında genel bir anlayışa sahip olması gerektiğine inanıyorum.

Günümüzde, makine öğrenimi algoritmalarının stratejik kararları raporlamak için kritik içgörüler ve bilgiler sağladıkları için insanlara getirdiği gerçek değeri giderek daha fazla görüyoruz. Elbette, makine öğrenimi giderek daha popüler hale geldikçe, gelecekte görevleri iyi bir şekilde yerine getirebilecek daha fazla algoritma olacaktır.

2019 amiral gemisi cep telefonu Hengping (tasarım makaleleri): sade ve güzel güzeldir
önceki
Bir haftalık AI olayları envanteri: Baidunun AI sistemi yükseltildi ve Amazon, AutoGluon'u başlattı
Sonraki
SK Hynix, CES'te NVMe katı hal sabit sürücülerini ve DDR5 belleğini sergiliyor
Yılın başında, bu sert ürünler CES2020'de dizüstü bilgisayarların geleceğine yön verecek
Wulingyuan: Köylülerin yeni bir eve taşınmasını kutlamak için köyde uzun bir ziyafet düzenlendi
Jiang Yong: Nvshu İlkbahar Çiftleri Yao Kasabasında Yeni Bir Yıl Özel Oluyor
Tüm ilçede sıvılaştırılmış gazın fiyatını tekelleştirin ve üç yılda on milyonlarca kâr edin ...
Changsha'da kişi başına 9454 yuan! Yıl sonu ödülü araştırma raporu burada Bu sektör en "sıkışmış" durumda. Seviyeniz nedir?
Virüs vücuda girdikten 48 saat sonra
Testere | Geriye dönük savaşçıyı anan Beibei sanatçısı bir fırça aldı ve kahramanın portresini yaptı
Hadi, sıcak kuru erişte
Shuanghuanglian, Moments'ta mevcut değil, ancak şüpheler devam ediyor ...
Çin'in iyi komşusu! Ücretsiz 150 n95 maske
evden çalışmak! Salgını önlemek ve kontrol etmek için "İnternet +" kullanmayı öneriyorlar
To Top