Öz Makine öğrenimini anlamak için üç resim: temel kavramlar, beş okul ve dokuz ortak algoritma

Makine öğrenimi ilerliyor ve zihnimizde sürekli olarak yapay zeka hedefine yaklaşıyor gibi görünüyoruz. Gerçek hayatımızda konuşma tanıma, görüntü algılama, makine çevirisi, stil aktarımı ve diğer teknolojiler uygulandı, ancak makine öğreniminin gelişimi hala devam ediyor ve hatta insan uygarlığının ve hatta insanın gelişim yönünü tamamen değiştirmenin mümkün olduğu düşünülüyor. . Ama şimdi meydana gelen değişimi anlıyor musunuz? Büyük Dört muhasebe firmasından biri olan PricewaterhouseCoopers (PwC), kısa süre önce makine öğreniminin temel kavramlarını, ilkelerini, geçmişini, gelecekteki trendlerini ve makine öğreniminin bazı ortak algoritmalarını tanıtan temelleri yorumlamak için bir dizi grafik yayınladı. Okuyucuların rahatlığı için, makinenin kalbi bu çizelgeleri derleyip böldü ve daha fazla okumanıza yardımcı olmayı umarak bu içerikleri üç bölüm halinde sundu.
1. Makine öğrenimine genel bakış

1. Makine öğrenimi nedir?

Makineler büyük miktarda veriyi analiz ederek öğrenirler. Örneğin, kedileri veya insan yüzlerini tanımak için programlamaya gerek yoktur, belirli hedefleri özetlemek ve tanımak için resimler kullanılarak eğitilebilirler.

2. Makine öğrenimi ve yapay zeka arasındaki ilişki

Makine öğrenimi, verilerdeki kalıpları bulmaya ve bu kalıpları tahmin yapmak için kullanmaya odaklanan bir araştırma ve algoritma kategorisidir. Makine öğrenimi, yapay zeka alanının bir parçasıdır ve bilgi keşfi ve veri madenciliği ile kesişme noktasına sahiptir.

3. Makine öğrenimi nasıl çalışır?

Veri seçin: verilerinizi üç gruba ayırın: eğitim verileri, doğrulama verileri ve test verileri;

Model verileri: ilgili özellikleri kullanan modeller oluşturmak için eğitim verilerini kullanın;

Doğrulama modeli: modelinize bağlanmak için doğrulama verilerinizi kullanın;

Test modeli: Doğrulanmış modelin performansını kontrol etmek için test verilerinizi kullanın;

Model kullanın: yeni verilerle ilgili tahminlerde bulunmak için tam olarak eğitilmiş bir model kullanın;

Ayarlama modeli: Algoritmanın performansını iyileştirmek için daha fazla veri, farklı özellik veya ayarlanmış parametreler kullanın.

4. Makine öğrenimi nerede?

Geleneksel programlama: yazılım mühendisleri sorunları çözmek için programlar yazar. İlk olarak, bazı veriler vardır bir sorunu çözmek için, yazılım mühendisi makineye ne yapması gerektiğini söyleyen bir işlem yazar bilgisayar yürütmek için bu işlemi izler ve ardından sonucu alır;

İstatistikler: Analistler değişkenler arasındaki ilişkiyi karşılaştırır;

Makine öğrenimi: Veri bilimcileri, bilgisayara ne yapacağını öğretmek için eğitim veri setlerini kullanır ve ardından sistem görevi yürütür. İlk olarak, büyük veri var makine sınıflandırma için eğitim veri setini kullanmayı öğrenecek, hedef sınıflandırmaya ulaşmak için belirli algoritmaları ayarlayacak bilgisayar verilerdeki ilişkileri, eğilimleri ve kalıpları tanımayı öğrenebilir;

Akıllı uygulama: Akıllı uygulamada yapay zeka kullanımının sonucu, hassas tarım uygulamasının bir uygulama örneğinin resminde gösterildiği gibi, uygulama dronlar tarafından toplanan verilere dayanmaktadır.

5. Makine öğreniminin pratik uygulamaları

Makine öğrenimi için birçok uygulama senaryosu vardır. İşte bazı örnekler. Nasıl kullanırsınız?

  • Hızlı 3B haritalama ve modelleme: Bir demiryolu köprüsü inşa etmek için PwC veri bilimcileri ve alan uzmanları, dronlar tarafından toplanan verilere makine öğrenimi uyguladılar. Bu kombinasyon, iş başarısı sırasında hassas izleme ve hızlı geri bildirim sağlar.
  • Riski azaltmak için gelişmiş analiz: Dahili işlemleri tespit etmek için PwC, daha kapsamlı bir kullanıcı profili geliştirmek ve karmaşık şüpheli davranışları daha derinlemesine anlamak için makine öğrenimi ve diğer analitik teknikleri birleştirir.
  • En iyi performans hedeflerini tahmin edin: PwC, Melbourne Kupası'ndaki farklı atların potansiyelini değerlendirmek için makine öğrenimini ve diğer analitik yöntemleri kullanır.
İkincisi, makine öğreniminin evrimi

On yıllardır, yapay zeka araştırmacılarının çeşitli "kabileleri" üstünlük için birbirleriyle yarışıyorlar. Bu kabilelerin birleşme zamanı geldi mi? Bunu yapmak zorunda da olabilirler, çünkü işbirliği ve algoritma entegrasyonu gerçek genel yapay zekaya (AGI) ulaşmanın tek yoludur. İşte makine öğrenimi yönteminin evrimi ve olası gelecek.

1. Beş okul

Sembolizm: Bilgiyi temsil etmek ve mantıksal akıl yürütme yapmak için semboller, kurallar ve mantığı kullanın Favori algoritma: kurallar ve karar ağaçları;

Bayesian: Olasılıksal akıl yürütme için gerçekleşme olasılığını bulun En sevilen algoritma: Naive Bayes veya Markov;

Bağlantısallık: kalıpları dinamik olarak tanımlamak ve özetlemek için olasılık matrisi ve ağırlıklı nöronları kullanın, favori algoritma: sinir ağı;

Evrimcilik: Değişiklikler yaratın ve ardından belirli bir amaç için en iyisini elde edin Favori algoritma: genetik algoritma;

Analogizer: İşlevi kısıtlamalara göre optimize edin (mümkün olduğu kadar, ancak aynı anda yoldan çıkmayın), favori algoritma: destek vektör makinesidir.

2. Evrimin aşamaları

1980'ler

  • Hakim okul: sembolizm
  • Mimari: sunucu veya ana bilgisayar
  • Öncü teori: bilgi mühendisliği
  • Temel karar mantığı: karar destek sistemi, sınırlı pratiklik

1990'lardan 2000'e

  • Baskın tür: Bayes
  • Mimari: Küçük sunucu kümesi
  • Baskın teori: olasılık teorisi
  • Sınıflandırma: Ölçeklenebilir karşılaştırma veya kontrast, birçok görev için yeterince iyi

2010'ların başından ortasına

  • Baskın tür: bağlantısallık
  • Mimari: Büyük sunucu çiftliği
  • Öncü teori: sinirbilim ve olasılık
  • Tanıma: daha doğru görüntü ve ses tanıma, çeviri, duyarlılık analizi vb.

3. Bu türlerin iş birliği yapması ve yöntemlerini bir araya getirmesi bekleniyor

2010'ların sonları

  • Baskın okul: bağlantı ve sembolizm
  • Mimari: Çok sayıda bulut
  • Öncü teoriler: bellek sinir ağı, büyük ölçekli entegrasyon, bilgiye dayalı muhakeme
  • Basit Soru-Cevap: dar, alana özgü bilgi paylaşımı

2020'ler +

  • Egemen okul: bağlantısallık + göstergebilim + Bayes +
  • Mimari: Bulut bilişim ve sis bilişim
  • Baskın teori: algılarken ağlar, akıl yürütürken ve çalışırken kurallar vardır
  • Basit algı, muhakeme ve eylem: sınırlı otomasyon veya insan-bilgisayar etkileşimi

2040'lar +

  • Baskın tür: algoritma füzyonu
  • Mimari: Her yerde sunucular
  • Baskın teori: en iyi kombinasyonun meta-öğrenimi
  • Algı ve yanıt: Birden çok öğrenme yöntemiyle kazanılan bilgi veya deneyime dayalı olarak harekete geçin veya yanıt verin
Üçüncüsü, makine öğreniminin algoritması

Hangi makine öğrenimi algoritmasını kullanmalısınız? Bu büyük ölçüde mevcut verilerin niteliğine ve miktarına ve her bir özel kullanım durumundaki eğitim hedeflerinize bağlıdır. Sonuç pahalı ek yüke ve kaynaklara değmediği sürece en karmaşık algoritmayı kullanmayın. İşte kullanım kolaylığına göre sıralanmış en yaygın algoritmalardan bazıları.

1. Karar Ağacı: Adım adım yanıt sürecinde, tipik bir karar ağacı analizi hiyerarşik değişkenleri veya karar düğümlerini kullanır.Örneğin, belirli bir kullanıcı güvenilir veya güvenilmez olarak sınıflandırılabilir.

  • Avantajlar: İnsanların, yerlerin ve şeylerin bir dizi farklı özelliğini, niteliğini ve özelliğini değerlendirmede iyidir
  • Senaryo örnekleri: kurala dayalı kredi değerlendirmesi, at yarışı sonuç tahmini

2. Destek Vektör Makinesi (Destek Vektör Makinesi): Destek Vektör Makinesi, alt düzleme bağlı olarak veri gruplarını sınıflandırabilir.

  • Avantajlar: Destek vektör makineleri, ilişkinin doğrusal olup olmadığına bakılmaksızın, değişken X ve diğer değişkenler arasında ikili sınıflandırma işlemlerini gerçekleştirmede iyidir
  • Senaryo örnekleri: haber sınıflandırması, el yazısı tanıma.

3. Regresyon: Regresyon, bağımlı değişken ile bir veya daha fazla bağımlı değişken arasındaki durum ilişkisinin ana hatlarını çizebilir. Bu örnekte, spam ve spam olmayan arasında bir ayrım yapılmıştır.

  • Avantajlar: İlişki çok açık olmasa bile, regresyon değişkenler arasındaki sürekli ilişkileri tanımlamak için kullanılabilir.
  • Senaryo örnekleri: yol trafik akışı analizi, posta filtreleme

4. Naive Bayes Sınıflandırması: Naive Bayes Sınıflandırması, olası koşulların dallanma olasılığını hesaplamak için kullanılır. Her bağımsız özellik "basittir" veya koşullu olarak bağımsızdır, bu nedenle diğer nesneleri etkilemezler. Örneğin, 5 sarı ve kırmızı top içeren bir kavanozda, arka arkaya iki sarı top alma olasılığı nedir? Şekilde üst daldan ileri geri iki sarı topu yakalama olasılığının 1/10 olduğu görülmektedir. Naive Bayes sınıflandırıcı, birden çok özelliğin birleşik koşullu olasılığını hesaplayabilir.

  • Avantajlar: Küçük bir veri kümesinde önemli özelliklere sahip ilgili nesneler için, saf Bayes yöntemi bunları hızlı bir şekilde sınıflandırabilir
  • Senaryo örnekleri: duyarlılık analizi, tüketici sınıflandırması

5. Gizli Markov modeli: Açık Markov süreci tamamen deterministiktir - belirli bir duruma genellikle başka bir durum eşlik eder. Trafik ışıkları bir örnektir. Buna karşılık, gizli Markov modeli, görünür verileri analiz ederek gizli durumların oluşumunu hesaplar. Daha sonra, gizli durum analizinin yardımıyla, gizli Markov modeli gelecekteki olası gözlem modellerini tahmin edebilir. Bu örnekte, yüksek veya düşük hava basıncı olasılığı (gizli bir durumdur) güneşli, yağmurlu ve bulutlu günlerin olasılığını tahmin etmek için kullanılabilir.

  • Avantajlar: tanıma ve tahmin işlemlerine uygun veri değişkenliğine izin verir
  • Sahne örnekleri: yüz ifadesi analizi, hava tahmini

6. Rastgele orman: Rastgele orman algoritması, rastgele seçilen veri alt kümeleriyle birden çok ağaç kullanarak karar ağaçlarının doğruluğunu artırır. Bu durumda meme kanseri nüksü ile ilgili çok sayıda gen, gen ekspresyonu düzeyinde incelenerek nüks riski hesaplandı.

  • Avantajlar: Rastgele orman yönteminin büyük ölçekli veri kümeleri ve çok sayıda ve bazen ilgisiz özelliklere sahip öğeler için yararlı olduğu kanıtlanmıştır.
  • Senaryo örneği: kullanıcı kayıp analizi, risk değerlendirmesi

7. Tekrarlayan sinir ağı: Herhangi bir sinir ağında, her nöron, birçok girdiyi tek bir çıktıya dönüştürmek için bir veya daha fazla gizli katman kullanır. Tekrarlayan Sinir Ağı (RNN), değerleri katman katman geçerek katman katman öğrenmeyi mümkün kılar. Başka bir deyişle, RNN, önceki çıktının sonraki girişi etkilemesine izin veren bir tür bellek biçimine sahiptir.

  • Avantajlar: Tekrarlayan sinir ağı, büyük miktarda düzenli bilgi olduğunda tahmin yeteneğine sahiptir
  • Senaryo örnekleri: görüntü sınıflandırması ve alt başlık ekleme, politik duyarlılık analizi

8. Uzun kısa süreli bellek (Uzun kısa süreli bellek, LSTM) ve geçitli yinelenen birim nerual ağ (kapılı yinelenen birim nerual ağ): RNN'nin erken biçimi kayba tabidir. Bu erken tekrarlayan sinir ağları, yalnızca küçük bir miktar erken bilginin saklanmasına izin verse de, son uzun ve kısa süreli bellek (LSTM) ve geçitli tekrarlayan birim (GRU) sinir ağları hem uzun vadeli hem de kısa süreli belleğe sahiptir. Başka bir deyişle, bu yeni RNN'ler belleği kontrol etme konusunda daha iyi bir yeteneğe sahiptir, daha önceki değerleri tutmaya veya birçok adım dizisini işlemek gerektiğinde bu değerleri sıfırlamaya izin verir, bu da "gradyan azalması" nı veya katman katman geçirilen değerleri önler. Son bozulma. LSTM ve GRU ağları, değerleri doğru zamanda geçirebilen veya sıfırlayabilen belleği kontrol etmek için "geçit" adı verilen bellek modüllerini veya yapılarını kullanmamıza izin verir.

  • Avantajlar: Uzun ve kısa süreli bellek ve geçitli tekrarlayan birim sinir ağları, diğer yinelenen sinir ağları ile aynı avantajlara sahiptir, ancak daha iyi bellek yeteneklerine sahip oldukları için daha yaygın olarak kullanılırlar.
  • Örnek senaryolar: doğal dil işleme, çeviri

9. Evrişimsel sinir ağı: Evrişim, çıktı katmanını etiketlemek için kullanılabilen, sonraki katmanlardan gelen ağırlıkların kaynaşmasını ifade eder.

  • Avantajlar: Evrişimli sinir ağları, çok büyük veri kümeleri, çok sayıda özellik ve karmaşık sınıflandırma görevleri olduğunda çok kullanışlıdır.
  • Senaryo örnekleri: görüntü tanıma, metinden konuşmaya, ilaç keşfi

Kaynak: Heart of the Machine

Sichuan'daki antik şehir, lütfen anladın mı?
önceki
Bu Qufu!
Sonraki
Durian olmayan partiler için dikkatli olun! Ancak bu yerlerde 80RMB'ye ve sınırsıza nadiren basılmamış durian yiyebilirsiniz.
Focus 2018 Dünya Hava Kuvvetleri Ekipman Geliştirmesine Genel Bakış
Toplanın, dördüncü düzey çavuş binbaşı!
Konum bilgileri, APP aşırı bilgi toplamanın "ciddi afet bölgesi" haline geldi, ofo ve Alipay olarak adlandırıldı!
Koşucu erkeklerin yeni sezonu bu büyüleyici ortaçağ kenti Avusturya'ya geldi ve karla kaplı dağlar uçağın hemen peşindeydi.
Büyük sözlü iletişim ilkesi (ilkokul beşinci sınıfın üzerindeki kişiler için geçerlidir)
Bu "Güney Çin Denizi çağrısı" değil, Filipinler bunu en çok Çin ile yapmakla ilgileniyor
Bahar derinleşiyor, romantik bir mor Shandong'u kasıp kavuruyor
Paylaşılan bisikletler ortadan kaldırılsın mı? Gelecekte soğuk trafik karası teknolojisi daha fazla sapkın olacak!
Jingdezhen'de köpek yetiştirmenin doğru yolu budur! Köpeği gezdirirken, ertesi gün akşam 7'den sabah 7'ye kadar tasmanız gerekir ...
Seyahat deneyiminizi geliştirmek için 15 küçük detay
"Yandaki köyün genç ve güzel bir gelinle evlendiğini duydum" mu? Bu cümlenin ardındaki gizem nedir?
To Top