Makine öğreniminde başarıya giden yol: Bu, GitHub'da oldukça övülen bir öğrenme yoludur (kaynaklarla birlikte)

Kaynak: Heart of the Machine

Bu makale hakkında 5000 kelime 10 dakika okumanız tavsiye edilir.

Bu makalenin yazarı, makine öğrenimi için eksiksiz bir öğrenme yolu sağlar. Makine öğreniminden DL'ye, Scikit-Learn'den TensorFlow'a, bu bir çalışma kılavuzudur.

Yeni bir konuya veya alana yaklaşmaya çalıştığınızda kaç kez kafanız karıştı, yönünüzü şaşırdınız ve takip etmenin hiçbir "yolu" yok. Onu derinlemesine anlayıp kullanma becerisi kazanmanızı nasıl sağlarsınız? Tabii ki, diğer insanların olgun yollarından ders almak ve sonra onu adım adım takip ederek birçok sapmadan kaçınmaktır.

Bu makalede yazar, İnternet'ten makine öğrenimi öğrenme deneyimini üç veya dört yıl içinde özetledi, çok sayıda açık kaynaklı proje, araç, öğretici ve video bağlantısı ve diğer kaynakları topladı ve bunları verimli bir öğrenme yolunda organize etti.

Proje adresi: https://github.com/clone95/Machine-Learning-Study-Path-March-2019

Bu kaynak kütüphanesi, aşağıdaki alanlar için üç organik ve eksiksiz öğrenme yolu sağlamayı amaçlamaktadır:

  • Makine öğrenme
  • İş Zekası (yakında)
  • Bulut bilişim (çok yakında)

Burada ilgili ilkeleri anlayabilecek ve bunları proje uygulamasında uygulayabileceksiniz. Bu öğrenme yollarını dikkatli bir şekilde izlerseniz, sıfırdan eksiksiz bir anlayış geliştirebilir ve her zaman mevcut olan becerileri edinebilirsiniz. Aslında, bu öğrenme yolları önceden bilgi gerektirmez, ancak temel programlama ve basit matematik çoğu kavramı anlamak ve uygulamak için gerekli koşullardır.

Burada listelenen her kaynak ücretsiz veya açık kaynaktır ve yazar, çok karmaşık olmaktan kaçınmak için bunu kısa ve öz bir şekilde ifade etmeye çalıştı. Ek olarak, yazar, makine öğrenimi ilkelerini öğrenmek için tutarlı bir kavram sağlamak amacıyla içeriği düzey ve karmaşıklığa göre düzenlemeye çalışır.

Yazar, ikinci kılavuzun (Business Intelligence) 2 ila 3 hafta içinde yayınlanacağını belirtti:

  • Makine öğrenimi kariyeri yayınlandı
  • İş Zekası Kariyer-Yakında
  • Bulut Bilişim Kariyer-Yakında

Aşağıda, farklı öğrenim yolları için bir yol haritası verilmiştir (makine öğrenimi için yol haritası yayınlandı).

Üç ana yol ve konu

Üç ana yolda, makine öğrenimi mühendisleri tamamlandı ve piyasaya sürüldü ve diğer iş verileri analizi ve bulut bilişim henüz tamamlanmadı. Bunların arasında, makine öğrenimi mühendislerinin temel araçlardan, geleneksel makine öğreniminden derin öğrenmeye kadar eksiksiz bir bilgi sistemi oluşturmaları ve ayrıca mühendislikte modellerin nasıl geliştirilip dağıtılacağını bilmeleri gerekir.

ML ve DL öğrenme sürecinde, yazar, odak noktasının her modelin kavramlarını seviyelere göre anlamak ve bu kavramları mükemmel bir açık kaynak çerçevesi aracılığıyla uygulamak olduğunu belirtti. Makalenin ilerleyen kısımlarında, makine öğrenimi mühendislerinin adım adım büyümeyi öğrenmesi gereken modelleri ve araçları özellikle tanıtacağız.

Son iki yol için, farklı içerik ve bilgi sistemlerine odaklanırlar ve ihtiyacı olan öğrencilerin birkaç hafta beklemesi gerekir. Ayrıca yazar, veri konuları ve sosyal beceri konuları dahil olmak üzere bazı ek genişletilmiş bilgiler de sağlar.

Veri konusu, çeşitli veri işlemlerini tanıtır ve bunlar aslında her veri çalışanı için temel araç setidir. Belirli bir perspektiften, verilerle uğraşmak bir sanattır. En iyi uygulamalar, verileri işlemek için doğru yolu anlamanıza yardımcı olacaktır, ancak aynı zamanda verilerin nasıl işleneceğine dair bir "sezgi" geliştirmeniz ve bu "sezginin" çoğunu geliştirmeniz gerekir. Bağlam ve deneyim tarafından yönlendirilir. Buna dayanarak, bu konular eğitim ve uygulamaya odaklanacaktır.

Makine öğrenimi mühendisi olarak başarıya giden yol

Bu bölüm, makine öğrenimi mühendislerinin yayınlanmış öğrenme yollarını tanıtır. Yazar birçok öğrenim kaynağını tanıtır. Yalnızca kısa örnekler gösteririz. Daha fazla ayrıntı için lütfen orijinal projeyi kontrol edin.

Burada listelenen her şey açık kaynaklıdır ve ücretsizdir ve çoğu dünyaca ünlü üniversitelerden ve açık kaynak derneklerinden gelir.

Bazı yeni şeyler öğrendiğimizde, özellikle geniş ve karmaşık olanları öğrendiğimizde, kafa karışıklığından kaçınmak gerekir. Bu nedenle, bu makale aşağıda ilgili bazı içerikleri tanıtacak ve aynı bağlam ve yazara ait olanları kullanmaya çalışacaktır. Uygun içerik yoksa yazar teoriler ve örnekler ile "______ en iyi uygulamalar" gibi kaynaklara işaret eden bazı içerikleri toplar.

Yazar, öğrenme yolunu dört bölüme ayırır:

1. Ön koşullar

  • Python
  • Jupyter Defter
  • Ustalaşmak için matematik
  • Makine öğrenimi yolu

2. Scikit-Learn kitaplığı ile makine öğrenimi

  • Neden Scikit-Learn'ü seçmelisiniz?
  • Uçtan uca makine öğrenimi projeleri
  • Doğrusal regresyon
  • sınıflandırma
  • Eğitim modeli
  • Vektör makineleri desteklemek
  • Karar ağacı
  • Entegre öğrenme ve rastgele orman
  • Denetimsiz öğrenme
  • Güncel özet ve gelecekteki görünüm

3. Sinir ağlarını öğrenmek için TensorFlow'u kullanın

  • Neden TensorFlow'u seçmelisiniz
  • TensorFlow'u başlatın ve çalıştırın
  • YSA-Yapay Sinir Ağı
  • CNN-Evrişimli Sinir Ağı
  • RNN-Tekrarlayan Sinir Ağı
  • Ağı eğitmek: en iyi uygulamalar
  • Otomatik kodlayıcı
  • Takviye öğrenme
  • Sonraki adım

4. Öğrenme Araçları

  • Makine öğrenimi projesi
  • Veri bilimi araçları
  • Blog / Youtube Kanalı / Web Sitesi

arkaplan bilgisi

Python, en kullanışlı ve popüler programlama dillerinden biridir, bu nedenle makine öğrenimi alanındaki kullanımı anlaşılabilir. Veri bilimi alanındaki çoğu çerçeve gibi, TensorFlow Python ile birleştirilirken, Scikit-Learn Python'da yazılır.

Kısacası, Jupyter Notebook, Python kodunu yazmak ve çalıştırmak için bir düzenleyicidir. Verilerle uğraşmak, çok sayıda deney gerektiği anlamına gelir ve deneyler, potansiyel bilgiyi elde etmek için bazı özel formlarda düzenlenir, bu nedenle Jupyter Not Defteri gereklidir.

Python ve Jupyer Notebook en temel modüller, bunlara zaten aşina olduğunuza inanıyorum. Python'a ek olarak makine öğrenimi yolunda ilerlemeniz gerekiyorsa, öncelikle sayısal hesaplama kitaplığı NumPy, görselleştirme kitaplığı Matplotlib ve veri ön işleme kitaplığı Pandas'ı nasıl kullanacağınızı bilmeniz gerekir; bunların hepsi makine öğrenimi projeleri için temel araçlar.

Birisi size makine öğreniminin arkasındaki matematiğin zor olduğunu mu söylüyor? Bu doğru. Ancak, onu her kullandığınızda makinenin sizin için halledeceğini bilin. Dolayısıyla odak noktası, ana kavramları kavramak ve sınırlamalarını ve uygulamalarını tanımaktır. Bu kavramlara aşina değilseniz, öğrenin, çünkü bu her şeyin prensibidir.

Bu üç kaynakla, gerçekten anlamanız gereken şeylerin çoğunu derinlemesine anlayabilirsiniz.

Doğrusal cebir üzerine mükemmel bir kurs: https://ocw.mit.edu/courses/mathematics/18-06-linear-algebra-spring-2010/, temel olasılık ve istatistik kavramlarıyla birlikte: https: //www.edx. org / course / Introduction-to-olasıability-0 Bilmeniz gereken matematiğin çoğu: https://explained.ai/matrix-calculus/index.html#sec4.5

Aşağıdaki kitapta anlatıldığı gibi, makine öğreniminin ne olduğunu ve ne zaman gerekli olduğunu açıklar.Bunlar en kısa ve öğretici genel bakışlardır.

Adres: https://www.oreilly.com/library/view/hands-on-machine-learning/9781491962282/ch01.html

Geleneksel programlama geliştirme süreci

Makine öğrenimi geliştirme süreci Makine öğrenimi ve Scikit-Learn

Scikit-Learn, en eksiksiz, olgun ve eksiksiz makine öğrenimi görev kitaplıklarından biridir. Scikit-Learn, kullanıma hazır kullanım sağlamak ve veri bilimi süreçleri için olanaklar sağlamak için güçlü ve gelişmiş modeller kullanır. İlk kez kullanırken, yazar aşağıdaki Kaggle vakasını incelemenizi tavsiye ediyor.Amaç, Titanik'teki yolcuların hayatta kalma olasılığının yüksek olup olmadığını tahmin etmeye çalışmak.

Titanic örneği: https://www.kaggle.com/startupsci/titanic-data-science-solutions

Çok sayıda ücretsiz veri kümesinin yanı sıra ilginç zorluklar ve makine öğrenimi modeli deneyleri sunan Kaggle'da başka örnekler ve materyaller de mevcuttur.

1. Doğrusal regresyon

Makine öğreniminin en basit şekli, bir veri kümesinin sonuçlarını tahmin etmekle ilgilenen herkes için de başlangıç noktasıdır.

Örnek 1: https://scikit-learn.org/stable/auto_examples/linear_model/plot_ols.html#sphx-glr-auto-Example 2: https://bigdata-madesimple.com/how-to-run-linear- regression-in-python-scikit-learn / Örnek 3: https://www.geeksforgeeks.org/linear-regression-python-implementation/

2. Sınıflandırma

Sonuçları farklı olasılıklardan tahmin etmek istediğinizde, sınıflandırma en önemli makine öğrenimi görevlerinden biridir.

İki sınıflandırma: https://machinelearningmastery.com/make-predictions-scikit-learn/logistic regression: https://towardsdatascience.com/building-a-logistic-regression-in-python-301d27367c24 sınıflandırıcı ölçümleri: https: //medium.com/thalus-ai/performance-metrics-for-classification-problems-in-machine-learning-part-i-b085d432082b

3. Destek Vektör Makinesi (SVM)

Destek vektör makinesi çok klasik bir makine öğrenimi modelidir.Amaç, örnekleri segmentlere ayırmak için bir hiper düzlem bulmaktır.Bölütlemenin prensibi, kategori aralığını maksimize etmektir ve sonunda çözülmesi için dışbükey karesel bir programlama problemine dönüştürülür.

Teori açıklaması: https://www.bilibili.com/video/av28186618 Gerçek savaş kılavuzu: https://www.bilibili.com/video/av38543231 Gerçek savaş kılavuzu: -üç-algoritma-python-with-scikit-learn /

4. Karar Ağacı

Karar ağacı tahmin sonuçlarının arkasındaki en basit ama en etkili yöntemlerden biri, pek çok şekilde (rastgele orman gibi) kullanılırlar.

Teori açıklaması: https://www.bilibili.com/video/av26086646 Pratik kılavuz: https://www.bilibili.com/video/av35523476 Pratik kılavuz: -üç-algoritma-python-with-scikit-learn /

5. Entegre öğrenme ve rastgele orman

Toplu öğrenme, bir grup seçmen elde etmek için bazı makine öğrenimi modellerinin tüm farklı özelliklerini ve avantajlarını ve dezavantajlarını kullanmaktır. Bu seçmenler size her tahminde en olası sonucu verecektir. Bu oylar farklı sınıflandırıcılar tarafından verilir (SVM , ID3 algoritması, lojistik regresyon).

6. Denetimsiz öğrenme

National Taiwan University Li Hongyi Video: https://www.bilibili.com/video/av10590361/?p=24Exsupervised Learning gerçekten iyi: https://towardsdatascience.com/unsupervised-learning-with-python-173c51dc7f03 Denetlenmeyen Öğrenme, Evet Denetimli öğrenme ile pekiştirmeli öğrenme arasındaki fark: https://blogs.nvidia.com/blog/2018/08/02/supervised-unsupervised-learning/ Derin öğrenme ve TensorFlow

2015'te açık kaynak olduğundan, derin öğrenme çerçeveleri dünyası TensorFlow'a aittir. GitHub'ın koleksiyonları veya çatalları veya endüstri kullanımı olsun, bunlar en iyiler arasında benzersizdir. Bu bölümün yazarı, TensorFlow ile ilgili birçok öğretici ve uygulamayı tanıtır ve okuyucuların resmi TensorFlow eğitimini doğrudan okumaları önerilir. Derin öğrenme için okuyucular Stanford'un CS231n kursunu veya öğrenme için "Derin Öğrenme" yi takip edebilir.

Çerçevenin avantajlarından ve dezavantajlarından bahsetmişken, bu TensorFlow ile başlamak için minimalist bir öğreticidir. Crash! Bilim ve Teknoloji TensorFlow Hong Kong Üniversitesi hızla # 871b30f5b06cbe9e319df1c24e34e3386bedirected kovaladı paylaşımı eğitim yazılımına TensorFlow kod kümesi Sen TensorFlow2107362e23e07d091c2cb4bfaedirect_director07d091c8cb4bfaedirect21 hakkında bilmeniz gereken hangi TensorFlow öğretici resmi Çin versiyonu deneyebilirsiniz TensorFlow # 871af50cb06d7c1a1c7e16bbae9 ile şeyler metin sınıflandırma / s? __ biz = MzA3MzI4MjgzMw == mid = 2650742373idx = 2sn = ad176a47b0e61e1c83444079d365354achksm = 871ada1bb06d530de70930d573a5c09b470dbd5fac85d1b161ca5c09b470dbd5fac85d1b65

Yazar, TensorFlow'u anladıktan sonra, mühendislik yapmak için derin öğrenmeyi tekrar tekrar öğrenebileceğimizi söyledi:

  • Stanford CS231n, Wu Enda'nın DL özel kursu veya Li Hongyi'nin ML kursu aracılığıyla en temel kavramları anlayın.Matematik türetmeyi tam olarak anlamanıza gerek yok, sadece ne olduğunu ve nedenini bilin.
  • Teori, öğreticiler ve uygulama durumları (RNN teorisi, RNN öğreticisi ve RNN uygulama örnekleri gibi) dahil olmak üzere her seferinde bir konuya dalın.
  • İkinci adımda birden fazla konu arasında dolaştıktan sonra, ana türetmeleri ve ayrıntıları kavramak için ilk adımın kaynaklarına tekrar bakın.

Yazar daha sonra tamamen bağlı ağlar, tekrarlayan ağlar, evrişimli ağlar ve otomatik kodlayıcılar gibi modüllerden birçok öğrenme kaynağı tanıttı. Ayrıntılar için lütfen orijinal GitHub projesini kontrol edin.

Öğrenme araçları

Bu bölümde yazar, makine öğrenimi projeleri, araçlar, Youtube kanalları, bloglar, web siteleri vb. Dahil olmak üzere çok sayıda öğrenme kaynağı düzenler ve ilgilenen okuyucular bunları kendi başlarına görüntüleyebilir.

Editör: Wang Jing redaksiyon: Tan Jiayao - Bitiş -

Tsinghua-Qingdao Veri Bilimi Enstitüsü'nün resmi WeChat kamu platformunu takip edin " THU Veri Pastası "Ve kız kardeş numarası" Veri Pastası THU "Daha fazla ders avantajı ve kaliteli içerik elde edin.

İlk "Jiang Shen" sanat sergisi açılıyor, ulusal el yapımı tanrılar Chengdu'da toplanıyor
önceki
Size veri bilimi öğrenimiyle ilgili 12 önemli ipucu gönderin (bağlantılar)
Sonraki
Okumalısınız! TOP10 Generative Adversarial Network GAN Paper (bağlantılı)
Bu Alman kamu görevlilerinin maaşı, bakalım kaç tane tahmin edebiliyor musun?
He Xiaobin, Tsinghua Üniversitesi: Gelecekteki yetenek eğitimi büyük veri, yapay zeka ve beşeri bilimler ve sosyal bilimlerin bir kombinasyonudur
Milan Xinqidian Chinese Art School, EF Education First ile derinlemesine işbirliği planı imzaladı
Android'in babası "tam ekran" cep telefonu Essential resmi olarak tanıtıldı: Gövde titanyum ve seramikten yapılmıştır ve fiyatı 699 $ 'dır.
kolay değil! 630 gün bekledikten sonra bu Süper Lig takımı nihayet arka arkaya üç galibiyet kazandı!
Çin görevleri BERT'i geride bırakıyor: Baidu resmi olarak NLP ön eğitim modeli ERNIE'yi yayınladı
Zhang Feng'in ekibi, hızlı virüs tespiti için CRISPR gen düzenleme uygulama sistemini yayınladı
Mianyang Pingwupu'da şiddetli kar yağışı yollarda kar yağmasına neden oldu, trafik polisi buzu temizlemek için 500 kedi tuz serpti
İlk 5G uzaktan cerrahi başarılı oldu, 5G uygulamasının yönünü anlamak için bir makale
nefret dolu! 7 ay üst üste iki kız kardeşin mezarlarının önündeki çiçekler çalındı.
Python kurulumundan temel dilbilgisine, aceminin anlayabileceği bir tarayıcı öğreticisi! (Kod ile)
To Top