GitHub'ın ultra eksiksiz makine öğrenimi mühendisi büyüme yol haritası, açık kaynak ve iki günde 3700+ Yıldız kazanın!

Yazar | Amber

Üretildi | AI Teknolojisi Ana Kampı (ID: rgznai100)

Geçtiğimiz günlerde GitHub'da açık kaynak sonrası 3700+ Yıldız kazanan bir proje sektörün ilgisini çekti. Raporlara göre proje, örnek olarak TensorFlow ve Scikit-learn'ün makine öğrenimi çerçevesinin temel kitaplığını aldı ve bir makine öğrenimi mühendisi olmanın büyüme yolunu ayrıntılı olarak açıkladı.

Projenin yazarı da İtalya'dan Giacomo Ciarlini adında bir bilişim mühendisi, çok yakışıklı mı?

GitHub Portalı:

https://github.com/clone95/Machine-Learning-Study-Path-March-2019/tree/master/Career%20Paths/Machine%20Learning%20Engineer%20Career%20Path

Yazar öncelikle "Scikit-Learn ve TensorFlow Makine Öğrenimi Pratik Kılavuzu" kitabını şiddetle tavsiye ediyor. Ek olarak, dünyanın en iyi üniversitelerinin ve açık kaynak kuruluşlarının öğrenme kaynaklarını yükledi ve en iyi kaynakları seçmek için önerilerin yanı sıra teoriler ve örnekler topladı.

İçerik esas olarak dört bölüme ayrılmıştır:

1. Ön koşullar

  • Python
  • Jupyter Defter
  • Ustalaşmak için temel matematik bilgisi
  • Makine öğreniminin bütün resmi

2. Makine öğrenimi için Scikit-Learn nasıl kullanılır?

  • Scikit-Learn neden?
  • Uçtan uca makine öğrenimi projeleri
  • Doğrusal regresyon
  • sınıflandırma
  • Eğitim modeli
  • Vektör makineleri desteklemek
  • Karar ağacı
  • Toplu öğrenme ve rastgele orman
  • Denetimsiz öğrenme
  • Sonuç ve beklentiler

3. TensorFlow tarafından eğitilen sinir ağı

  • Neden TensorFlow'u seçmelisiniz?
  • TensorFlow kullanın
  • YSA-Yapay Sinir Ağı
  • CNN-Evrişimli Sinir Ağı
  • RNN-Tekrarlayan Sinir Ağı
  • Ağı eğitmek: en iyi uygulamalar
  • Otomatik kodlama
  • Takviye öğrenme

Dört, araçlar

  • Makine öğrenimi projesi
  • Veri bilimi araçları
  • Blog / YouTube kanalı / web sitesi

Her etiketin altında yazarın ayrıntılı bir açıklaması var ve gerçek operasyonlar için kaynaklar veriyor ki bu gerçekten bir vicdan işi! Bu projede hangi kaynakların görülmeye değer olduğunu ayrıntılı olarak tanıtalım (ve bazı eğitim bağlantıları ekleyelim).

ön koşullar

  • Python

Temel bilgi:

https://pythonprogramming.net/introduction-learn-python-3-tutorials/

Yazar ayrıca, Python'a aşina olmanın yanı sıra, matematiksel işlemler için önemli bir modül olan ve Tensor veri türünü daha sonra Python ortamına aktarmanıza yardımcı olabilecek Numpy hakkında bilgi edinebileceğinizi öne sürüyor.

Python3 kurulum adresi:

https://realpython.com/installing-python/

PyCharm Community Edition (Python geliştirme için eksiksiz bir IDE, deneyler için yeni bir Python sanal ortamı kurma)

Kurulum adresi:

https://www.jetbrains.com/pycharm/download/#section=windows

  • Jupyter Defter

Kullanıcıların canlı kod, denklemler, görselleştirme ve anlatı metni dahil olmak üzere belgeler oluşturmasına ve paylaşmasına yardımcı olan açık kaynaklı bir web uygulamasıdır. Örneğin, veri temizleme, sayısal simülasyon, istatistiksel modelleme, veri görselleştirme, makine öğrenimi vb.

  • Ustalaşmak için temel matematik bilgisi

Yazarın görüşüne göre matematik, makine öğreniminin arkasındaki önemli bir temeldir. Ancak ana kavramlara hakim olmak ve bu matematiksel yöntemlerin uygulama alanlarını ve sınırlamalarını tanımak önemlidir.

Üç ders bağlantısı verdi:

Lineer Cebir:

https://ocw.mit.edu/courses/mathematics/18-06-linear-algebra-spring-2010/

Olasılık temeli ve istatistikler:

https://www.edx.org/course/introduction-to-probability-0

Diğer matematiksel kaynaklar:

https://explained.ai/matrix-calculus/index.html#sec4.5

  • Makine öğreniminin bütün resmi

Son olarak, popüler bir bilim kitabı aracılığıyla makine öğreniminin bütün resmini anlayın:

https://www.oreilly.com/library/view/hands-on-machine-learning/9781491962282/ch01.html

Makine öğrenimi için Scikit-Learn nasıl kullanılır?

  • Scikit-Learn'ü Yükleyin
python pip kurulumu -U scikit-öğren

Kurulum sırasında bazı sorunlarla karşılaşırsanız, en son pip sürümüne güncellemiş olabilirsiniz, bu nedenle aynı klasörde çalıştırın:

python -m pip kurulumu - yükseltme pip
  • Scikit-Learn neden?

Scikit-Learn, makine öğrenimi görevleri için en eksiksiz, olgun ve iyi belgelenmiş kitaplıklardan biridir. Kutudan çıkar çıkmaz çalışır ve güçlü ve gelişmiş bir modele sahiptir.

  • Uçtan uca makine öğrenimi projeleri

Makine öğrenimi ve genel veri bilimi projeleri için tercih edilen platform olan Kaggle, çok sayıda ücretsiz veri kümesinin yanı sıra ilginç zorluklar ve makine öğrenimi modeli deneyleri sunar.

  • Doğrusal regresyon

Doğrusal regresyon, makine öğreniminin en basit şekli ve model eğitimi için başlangıç noktasıdır.

Wu Enda'nın teori kursuna başvurabilirsiniz:

https://www.youtube.com/watch?v=W46UTQ_JDPklist=PLoR5VjrKytrCv-Vxnhp5UyS1UjZsXP0Kjindex=2

  • sınıflandırma

Sonuçları farklı olasılıklardan tahmin etmek istiyorsanız, sınıflandırma en önemli makine öğrenimi görevlerinden biridir. En basit durum, ikili sınıflandırma problemidir.

  • Eğitim modeli

Yazar, makine öğrenimi görevlerinde modelleri eğitmek için Google Crash eğiticisinde bulunabilecek bazı teknikleri listeler:

Dereceli alçalma:

https://developers.google.com/machine-learning/crash-course/reducing-loss/gradient-descent

Öğrenme oranı:

https://developers.google.com/machine-learning/crash-course/reducing-loss/learning-rate

SGD:

https://developers.google.com/machine-learning/crash-course/reducing-loss/stochastic-gradient-descent

Düzenlilik:

https://www.youtube.com/watch?v=Q81RR3yKn30

  • Vektör makineleri desteklemek

ML modelleri oluşturmak için başka bir klasik algoritmadır.

Teorik açıklamalara ek olarak, daha pratik stratejiler var:

https://www.youtube.com/watch?v=g8D5YL6cOSE

  • Karar ağacı
  • Entegre öğrenme ve rastgele orman

Ensemble Learning'in fikri, en olası tahmin sonuçlarını elde etmek için çeşitli makine öğrenimi modellerinin tüm farklı özelliklerini, avantajlarını ve dezavantajlarını kullanmaktır.

Temel entegre öğrenme bilgisi:

https://www.youtube.com/watch?v=9VmKYwX_U7s

En klasik rastgele orman uygulaması:

https://www.youtube.com/watch?v=3kYujfDgmNk

  • Denetimsiz öğrenme

Gözetimsiz öğrenmenin giriş ve açıklamasının yanı sıra denetimli öğrenme ile pekiştirmeli öğrenme arasındaki farkları kapsar.

İlgili iki önemli teknoloji ile ilgili olarak: İlişkilendirme Kuralları ve kümeleme, yazar sırasıyla örnekler ve öğreticiler sağlar.

TensorFlow tarafından eğitilen sinir ağı

Bu bölümde yazar, öğrencilerin bu içeriği hızlı bir şekilde anlamalarına yardımcı olmak için Stanford Üniversitesi derin öğrenme kurslarını ve diğer çevrimiçi eğitimleri önermektedir. Bunlar, ANN, CNN ve RNN gibi farklı makine öğrenimi modellerini içerir. Aslında yazar, blogları, resmi web sitesi forumlarını ve öğrenme yollarını okumak da dahil olmak üzere sinir ağlarının teorisini ve uygulamasını anlamak için uzun zaman harcadı.

"Üç adımlı" bir öneride bulundu:

  • Stanford Üniversitesi öğreticisi aracılığıyla sinir ağlarının ana kavramlarını öğrenin Bazı matematiksel açıklamalar hakkında çok fazla endişelenmeyin, neye ve neden olduğuna dikkat edin;
  • Teori + öğretici + örnekleri kullanın (RNN teorisi + RNN öğretici + RNN örneği gibi), bir seferde yalnızca bir konuyu derinlemesine tartışın;
  • Bir konuyu tartıştıktan sonra, Stanford Üniversitesi kursuna geri dönün. Bu yöntem, tüm formülleri tam olarak anlamanıza ve derste bahsedilen "matematik" ile ilgili bilgileri analoji yoluyla bağlamanıza yardımcı olacaktır.
  • Yazar, yukarıdaki yöntemin gerektiği kadar tekrar edilebileceğini ve daha sonra zihninizde iyi bir genel model oluşturulabileceğini belirtti.

    Stanford Üniversitesi kursu PPT adresi:

    • Neden TensorFlow'u seçmelisiniz?

    Şu anda TensorFlow, işletmelerde makine öğrenimi algoritmalarını uygulamak için fiili standart olmuştur.

    TensorFlow kütüphanesini kurmadan önce, Python kurulum klasöründe bir terminal açmanız ve şu komutu çalıştırmanız yeterlidir:

    python pip install tensorflow
    • YSA-Yapay Sinir Ağı
    • CNN-Evrişimli Sinir Ağı
    • RNN-Tekrarlayan Sinir Ağı
    • Ağı eğitmek: en iyi uygulamalar
    • Otomatik kodlama
    • Takviye öğrenme

    Yukarıdaki detaylar detaylı olarak anlatılmayacaktır.

    Diğer kaynaklar

    Yukarıdakilere ek olarak, yazar ayrıca çok sayıda makale, web uygulaması, en iyi uygulama, proje ve depo topladı.

    • Makine öğrenimi projesi

    • araç

    • Youtube kanalı

    • Blog

    Ve kontrol edilmeye değer diğer siteler:

    Yazar nihayet, denetimsiz öğrenme, makine öğrenimi zihniyet çerçevesi (bir veri bilimcisi gibi nasıl düşünülür), veri işleme ve hazırlama için Pandalar'ı kullanma, özellik seçimi, özellik mühendisliği gibi farklı konuların önümüzdeki dönemde genişletileceğini belirtti. , Genişletilmiş parametre optimizasyonu bölümü, Keras kitaplığı, TensorFlow 2.0, modellerin AWS, Azure vb. Üzerinde nasıl dağıtılacağı.

    Zhejiang Tüccarlarını Tanıyın | Harika! Hangzhou'da 16 tek boynuzlu at var, toplam değerleme ülkede ikinci sırada
    önceki
    Daxing Uluslararası Havaalanı işe alımı, en yüksek yıllık maaş 240.000!
    Sonraki
    Bir kızı nasıl zayıf gösterebilirim? Er ya da geç kullanabilirsiniz!
    1.38 milyon! Bir park yeri, üçüncü sınıf bir şehirde bir ev satın alabilir mi? Netizen: inanılmaz
    Lenovo, dünyanın ilk 5G cep telefonu Moto Z3'ü gösteriyor: modül yükseltmesi, dizüstü bilgisayar da kullanılabilir
    Odak noktası | İkinci yarıya nasıl liderlik edilir? Zhejiang Tüccarları Boao'da geleceğe dokunuyor
    Sadece elektrikli araba satmak değil! Mavericks, Lifestyle serisi çevre birimlerini piyasaya sürdü
    Jeep, yeni bir 1.3T motoru piyasaya sürüyor veya yeni kılavuzda donatılacak
    Telefonun kilidini açmanın pek çok yolu var, hangisi alışkanlıklarınıza daha uygun?
    Apple Bahar Konferansı: Gerisini oynamak için asla başkalarıyla oynamayın!
    Shenzhen Hediyeler ve Ev Eşyaları Fuarı açılmak üzere, sergiyi ziyaret ederken kaybolmamanıza yardımcı olacak beş önemli nokta
    GitHub korsan Windows kullanıcılarının oturum açmasına izin vermiyor mu?
    BYD e-serisi 2019'da resmi olarak piyasaya sürüldü, 5 yeni otomobil / e11 Nisan'da ön satışa başlayacak
    Xiaomi Mijia akıllı kapı kilidi yayınlandı: 999 yuan paket kurulumunun kitle fonlaması fiyatı
    To Top