Yazar | Amber
Üretildi | AI Teknolojisi Ana Kampı (ID: rgznai100)
Geçtiğimiz günlerde GitHub'da açık kaynak sonrası 3700+ Yıldız kazanan bir proje sektörün ilgisini çekti. Raporlara göre proje, örnek olarak TensorFlow ve Scikit-learn'ün makine öğrenimi çerçevesinin temel kitaplığını aldı ve bir makine öğrenimi mühendisi olmanın büyüme yolunu ayrıntılı olarak açıkladı.
Projenin yazarı da İtalya'dan Giacomo Ciarlini adında bir bilişim mühendisi, çok yakışıklı mı?
GitHub Portalı:
https://github.com/clone95/Machine-Learning-Study-Path-March-2019/tree/master/Career%20Paths/Machine%20Learning%20Engineer%20Career%20Path
Yazar öncelikle "Scikit-Learn ve TensorFlow Makine Öğrenimi Pratik Kılavuzu" kitabını şiddetle tavsiye ediyor. Ek olarak, dünyanın en iyi üniversitelerinin ve açık kaynak kuruluşlarının öğrenme kaynaklarını yükledi ve en iyi kaynakları seçmek için önerilerin yanı sıra teoriler ve örnekler topladı.
İçerik esas olarak dört bölüme ayrılmıştır:
1. Ön koşullar
2. Makine öğrenimi için Scikit-Learn nasıl kullanılır?
3. TensorFlow tarafından eğitilen sinir ağı
Dört, araçlar
Her etiketin altında yazarın ayrıntılı bir açıklaması var ve gerçek operasyonlar için kaynaklar veriyor ki bu gerçekten bir vicdan işi! Bu projede hangi kaynakların görülmeye değer olduğunu ayrıntılı olarak tanıtalım (ve bazı eğitim bağlantıları ekleyelim).
ön koşullar
Temel bilgi:
https://pythonprogramming.net/introduction-learn-python-3-tutorials/
Yazar ayrıca, Python'a aşina olmanın yanı sıra, matematiksel işlemler için önemli bir modül olan ve Tensor veri türünü daha sonra Python ortamına aktarmanıza yardımcı olabilecek Numpy hakkında bilgi edinebileceğinizi öne sürüyor.
Python3 kurulum adresi:
https://realpython.com/installing-python/
PyCharm Community Edition (Python geliştirme için eksiksiz bir IDE, deneyler için yeni bir Python sanal ortamı kurma)
Kurulum adresi:
https://www.jetbrains.com/pycharm/download/#section=windows
Kullanıcıların canlı kod, denklemler, görselleştirme ve anlatı metni dahil olmak üzere belgeler oluşturmasına ve paylaşmasına yardımcı olan açık kaynaklı bir web uygulamasıdır. Örneğin, veri temizleme, sayısal simülasyon, istatistiksel modelleme, veri görselleştirme, makine öğrenimi vb.
Yazarın görüşüne göre matematik, makine öğreniminin arkasındaki önemli bir temeldir. Ancak ana kavramlara hakim olmak ve bu matematiksel yöntemlerin uygulama alanlarını ve sınırlamalarını tanımak önemlidir.
Üç ders bağlantısı verdi:
Lineer Cebir:
https://ocw.mit.edu/courses/mathematics/18-06-linear-algebra-spring-2010/
Olasılık temeli ve istatistikler:
https://www.edx.org/course/introduction-to-probability-0
Diğer matematiksel kaynaklar:
https://explained.ai/matrix-calculus/index.html#sec4.5
Son olarak, popüler bir bilim kitabı aracılığıyla makine öğreniminin bütün resmini anlayın:
https://www.oreilly.com/library/view/hands-on-machine-learning/9781491962282/ch01.html
Makine öğrenimi için Scikit-Learn nasıl kullanılır?
Kurulum sırasında bazı sorunlarla karşılaşırsanız, en son pip sürümüne güncellemiş olabilirsiniz, bu nedenle aynı klasörde çalıştırın:
python -m pip kurulumu - yükseltme pipScikit-Learn, makine öğrenimi görevleri için en eksiksiz, olgun ve iyi belgelenmiş kitaplıklardan biridir. Kutudan çıkar çıkmaz çalışır ve güçlü ve gelişmiş bir modele sahiptir.
Makine öğrenimi ve genel veri bilimi projeleri için tercih edilen platform olan Kaggle, çok sayıda ücretsiz veri kümesinin yanı sıra ilginç zorluklar ve makine öğrenimi modeli deneyleri sunar.
Doğrusal regresyon, makine öğreniminin en basit şekli ve model eğitimi için başlangıç noktasıdır.
Wu Enda'nın teori kursuna başvurabilirsiniz:
https://www.youtube.com/watch?v=W46UTQ_JDPklist=PLoR5VjrKytrCv-Vxnhp5UyS1UjZsXP0Kjindex=2
Sonuçları farklı olasılıklardan tahmin etmek istiyorsanız, sınıflandırma en önemli makine öğrenimi görevlerinden biridir. En basit durum, ikili sınıflandırma problemidir.
Yazar, makine öğrenimi görevlerinde modelleri eğitmek için Google Crash eğiticisinde bulunabilecek bazı teknikleri listeler:
Dereceli alçalma:
https://developers.google.com/machine-learning/crash-course/reducing-loss/gradient-descent
Öğrenme oranı:
https://developers.google.com/machine-learning/crash-course/reducing-loss/learning-rate
SGD:
https://developers.google.com/machine-learning/crash-course/reducing-loss/stochastic-gradient-descent
Düzenlilik:
https://www.youtube.com/watch?v=Q81RR3yKn30
ML modelleri oluşturmak için başka bir klasik algoritmadır.
Teorik açıklamalara ek olarak, daha pratik stratejiler var:
https://www.youtube.com/watch?v=g8D5YL6cOSE
Ensemble Learning'in fikri, en olası tahmin sonuçlarını elde etmek için çeşitli makine öğrenimi modellerinin tüm farklı özelliklerini, avantajlarını ve dezavantajlarını kullanmaktır.
Temel entegre öğrenme bilgisi:
https://www.youtube.com/watch?v=9VmKYwX_U7s
En klasik rastgele orman uygulaması:
https://www.youtube.com/watch?v=3kYujfDgmNk
Gözetimsiz öğrenmenin giriş ve açıklamasının yanı sıra denetimli öğrenme ile pekiştirmeli öğrenme arasındaki farkları kapsar.
İlgili iki önemli teknoloji ile ilgili olarak: İlişkilendirme Kuralları ve kümeleme, yazar sırasıyla örnekler ve öğreticiler sağlar.
TensorFlow tarafından eğitilen sinir ağı
Bu bölümde yazar, öğrencilerin bu içeriği hızlı bir şekilde anlamalarına yardımcı olmak için Stanford Üniversitesi derin öğrenme kurslarını ve diğer çevrimiçi eğitimleri önermektedir. Bunlar, ANN, CNN ve RNN gibi farklı makine öğrenimi modellerini içerir. Aslında yazar, blogları, resmi web sitesi forumlarını ve öğrenme yollarını okumak da dahil olmak üzere sinir ağlarının teorisini ve uygulamasını anlamak için uzun zaman harcadı.
"Üç adımlı" bir öneride bulundu:
Yazar, yukarıdaki yöntemin gerektiği kadar tekrar edilebileceğini ve daha sonra zihninizde iyi bir genel model oluşturulabileceğini belirtti.
Stanford Üniversitesi kursu PPT adresi:
Şu anda TensorFlow, işletmelerde makine öğrenimi algoritmalarını uygulamak için fiili standart olmuştur.
TensorFlow kütüphanesini kurmadan önce, Python kurulum klasöründe bir terminal açmanız ve şu komutu çalıştırmanız yeterlidir:
python pip install tensorflowYukarıdaki detaylar detaylı olarak anlatılmayacaktır.
Diğer kaynaklar
Yukarıdakilere ek olarak, yazar ayrıca çok sayıda makale, web uygulaması, en iyi uygulama, proje ve depo topladı.
Ve kontrol edilmeye değer diğer siteler:
Yazar nihayet, denetimsiz öğrenme, makine öğrenimi zihniyet çerçevesi (bir veri bilimcisi gibi nasıl düşünülür), veri işleme ve hazırlama için Pandalar'ı kullanma, özellik seçimi, özellik mühendisliği gibi farklı konuların önümüzdeki dönemde genişletileceğini belirtti. , Genişletilmiş parametre optimizasyonu bölümü, Keras kitaplığı, TensorFlow 2.0, modellerin AWS, Azure vb. Üzerinde nasıl dağıtılacağı.