Kaynak: Heart of the Machine
Bu makale hakkında 5000 kelime 10 dakika okumanız tavsiye edilir.
Bu makalenin yazarı, makine öğrenimi için eksiksiz bir öğrenme yolu sağlar. Makine öğreniminden DL'ye, Scikit-Learn'den TensorFlow'a, bu bir çalışma kılavuzudur.
Yeni bir konuya veya alana yaklaşmaya çalıştığınızda kaç kez kafanız karıştı, yönünüzü şaşırdınız ve takip etmenin hiçbir "yolu" yok. Onu derinlemesine anlayıp kullanma becerisi kazanmanızı nasıl sağlarsınız? Tabii ki, diğer insanların olgun yollarından ders almak ve sonra onu adım adım takip ederek birçok sapmadan kaçınmaktır.
Bu makalede yazar, İnternet'ten makine öğrenimi öğrenme deneyimini üç veya dört yıl içinde özetledi, çok sayıda açık kaynaklı proje, araç, öğretici ve video bağlantısı ve diğer kaynakları topladı ve bunları verimli bir öğrenme yolunda organize etti.
Proje adresi: https://github.com/clone95/Machine-Learning-Study-Path-March-2019Bu kaynak kütüphanesi, aşağıdaki alanlar için üç organik ve eksiksiz öğrenme yolu sağlamayı amaçlamaktadır:
Burada ilgili ilkeleri anlayabilecek ve bunları proje uygulamasında uygulayabileceksiniz. Bu öğrenme yollarını dikkatli bir şekilde izlerseniz, sıfırdan eksiksiz bir anlayış geliştirebilir ve her zaman mevcut olan becerileri edinebilirsiniz. Aslında, bu öğrenme yolları önceden bilgi gerektirmez, ancak temel programlama ve basit matematik çoğu kavramı anlamak ve uygulamak için gerekli koşullardır.
Burada listelenen her kaynak ücretsiz veya açık kaynaktır ve yazar, çok karmaşık olmaktan kaçınmak için bunu kısa ve öz bir şekilde ifade etmeye çalıştı. Ek olarak, yazar, makine öğrenimi ilkelerini öğrenmek için tutarlı bir kavram sağlamak amacıyla içeriği düzey ve karmaşıklığa göre düzenlemeye çalışır.
Yazar, ikinci kılavuzun (Business Intelligence) 2 ila 3 hafta içinde yayınlanacağını belirtti:
Aşağıda, farklı öğrenim yolları için bir yol haritası verilmiştir (makine öğrenimi için yol haritası yayınlandı).
Üç ana yol ve konuÜç ana yolda, makine öğrenimi mühendisleri tamamlandı ve piyasaya sürüldü ve diğer iş verileri analizi ve bulut bilişim henüz tamamlanmadı. Bunların arasında, makine öğrenimi mühendislerinin temel araçlardan, geleneksel makine öğreniminden derin öğrenmeye kadar eksiksiz bir bilgi sistemi oluşturmaları ve ayrıca mühendislikte modellerin nasıl geliştirilip dağıtılacağını bilmeleri gerekir.
ML ve DL öğrenme sürecinde, yazar, odak noktasının her modelin kavramlarını seviyelere göre anlamak ve bu kavramları mükemmel bir açık kaynak çerçevesi aracılığıyla uygulamak olduğunu belirtti. Makalenin ilerleyen kısımlarında, makine öğrenimi mühendislerinin adım adım büyümeyi öğrenmesi gereken modelleri ve araçları özellikle tanıtacağız.
Son iki yol için, farklı içerik ve bilgi sistemlerine odaklanırlar ve ihtiyacı olan öğrencilerin birkaç hafta beklemesi gerekir. Ayrıca yazar, veri konuları ve sosyal beceri konuları dahil olmak üzere bazı ek genişletilmiş bilgiler de sağlar.
Veri konusu, çeşitli veri işlemlerini tanıtır ve bunlar aslında her veri çalışanı için temel araç setidir. Belirli bir perspektiften, verilerle uğraşmak bir sanattır. En iyi uygulamalar, verileri işlemek için doğru yolu anlamanıza yardımcı olacaktır, ancak aynı zamanda verilerin nasıl işleneceğine dair bir "sezgi" geliştirmeniz ve bu "sezginin" çoğunu geliştirmeniz gerekir. Bağlam ve deneyim tarafından yönlendirilir. Buna dayanarak, bu konular eğitim ve uygulamaya odaklanacaktır.
Makine öğrenimi mühendisi olarak başarıya giden yolBu bölüm, makine öğrenimi mühendislerinin yayınlanmış öğrenme yollarını tanıtır. Yazar birçok öğrenim kaynağını tanıtır. Yalnızca kısa örnekler gösteririz. Daha fazla ayrıntı için lütfen orijinal projeyi kontrol edin.
Burada listelenen her şey açık kaynaklıdır ve ücretsizdir ve çoğu dünyaca ünlü üniversitelerden ve açık kaynak derneklerinden gelir.
Bazı yeni şeyler öğrendiğimizde, özellikle geniş ve karmaşık olanları öğrendiğimizde, kafa karışıklığından kaçınmak gerekir. Bu nedenle, bu makale aşağıda ilgili bazı içerikleri tanıtacak ve aynı bağlam ve yazara ait olanları kullanmaya çalışacaktır. Uygun içerik yoksa yazar teoriler ve örnekler ile "______ en iyi uygulamalar" gibi kaynaklara işaret eden bazı içerikleri toplar.
Yazar, öğrenme yolunu dört bölüme ayırır:
1. Ön koşullar
2. Scikit-Learn kitaplığı ile makine öğrenimi
3. Sinir ağlarını öğrenmek için TensorFlow'u kullanın
4. Öğrenme Araçları
arkaplan bilgisi
Python, en kullanışlı ve popüler programlama dillerinden biridir, bu nedenle makine öğrenimi alanındaki kullanımı anlaşılabilir. Veri bilimi alanındaki çoğu çerçeve gibi, TensorFlow Python ile birleştirilirken, Scikit-Learn Python'da yazılır.
Kısacası, Jupyter Notebook, Python kodunu yazmak ve çalıştırmak için bir düzenleyicidir. Verilerle uğraşmak, çok sayıda deney gerektiği anlamına gelir ve deneyler, potansiyel bilgiyi elde etmek için bazı özel formlarda düzenlenir, bu nedenle Jupyter Not Defteri gereklidir.
Python ve Jupyer Notebook en temel modüller, bunlara zaten aşina olduğunuza inanıyorum. Python'a ek olarak makine öğrenimi yolunda ilerlemeniz gerekiyorsa, öncelikle sayısal hesaplama kitaplığı NumPy, görselleştirme kitaplığı Matplotlib ve veri ön işleme kitaplığı Pandas'ı nasıl kullanacağınızı bilmeniz gerekir; bunların hepsi makine öğrenimi projeleri için temel araçlar.
Birisi size makine öğreniminin arkasındaki matematiğin zor olduğunu mu söylüyor? Bu doğru. Ancak, onu her kullandığınızda makinenin sizin için halledeceğini bilin. Dolayısıyla odak noktası, ana kavramları kavramak ve sınırlamalarını ve uygulamalarını tanımaktır. Bu kavramlara aşina değilseniz, öğrenin, çünkü bu her şeyin prensibidir.
Bu üç kaynakla, gerçekten anlamanız gereken şeylerin çoğunu derinlemesine anlayabilirsiniz.
Doğrusal cebir üzerine mükemmel bir kurs: https://ocw.mit.edu/courses/mathematics/18-06-linear-algebra-spring-2010/, temel olasılık ve istatistik kavramlarıyla birlikte: https: //www.edx. org / course / Introduction-to-olasıability-0 Bilmeniz gereken matematiğin çoğu: https://explained.ai/matrix-calculus/index.html#sec4.5Aşağıdaki kitapta anlatıldığı gibi, makine öğreniminin ne olduğunu ve ne zaman gerekli olduğunu açıklar.Bunlar en kısa ve öğretici genel bakışlardır.
Adres: https://www.oreilly.com/library/view/hands-on-machine-learning/9781491962282/ch01.html Geleneksel programlama geliştirme süreci Makine öğrenimi geliştirme süreci Makine öğrenimi ve Scikit-LearnScikit-Learn, en eksiksiz, olgun ve eksiksiz makine öğrenimi görev kitaplıklarından biridir. Scikit-Learn, kullanıma hazır kullanım sağlamak ve veri bilimi süreçleri için olanaklar sağlamak için güçlü ve gelişmiş modeller kullanır. İlk kez kullanırken, yazar aşağıdaki Kaggle vakasını incelemenizi tavsiye ediyor.Amaç, Titanik'teki yolcuların hayatta kalma olasılığının yüksek olup olmadığını tahmin etmeye çalışmak.
Titanic örneği: https://www.kaggle.com/startupsci/titanic-data-science-solutionsÇok sayıda ücretsiz veri kümesinin yanı sıra ilginç zorluklar ve makine öğrenimi modeli deneyleri sunan Kaggle'da başka örnekler ve materyaller de mevcuttur.
1. Doğrusal regresyon
Makine öğreniminin en basit şekli, bir veri kümesinin sonuçlarını tahmin etmekle ilgilenen herkes için de başlangıç noktasıdır.
Örnek 1: https://scikit-learn.org/stable/auto_examples/linear_model/plot_ols.html#sphx-glr-auto-Example 2: https://bigdata-madesimple.com/how-to-run-linear- regression-in-python-scikit-learn / Örnek 3: https://www.geeksforgeeks.org/linear-regression-python-implementation/2. Sınıflandırma
Sonuçları farklı olasılıklardan tahmin etmek istediğinizde, sınıflandırma en önemli makine öğrenimi görevlerinden biridir.
İki sınıflandırma: https://machinelearningmastery.com/make-predictions-scikit-learn/logistic regression: https://towardsdatascience.com/building-a-logistic-regression-in-python-301d27367c24 sınıflandırıcı ölçümleri: https: //medium.com/thalus-ai/performance-metrics-for-classification-problems-in-machine-learning-part-i-b085d432082b3. Destek Vektör Makinesi (SVM)
Destek vektör makinesi çok klasik bir makine öğrenimi modelidir.Amaç, örnekleri segmentlere ayırmak için bir hiper düzlem bulmaktır.Bölütlemenin prensibi, kategori aralığını maksimize etmektir ve sonunda çözülmesi için dışbükey karesel bir programlama problemine dönüştürülür.
Teori açıklaması: https://www.bilibili.com/video/av28186618 Gerçek savaş kılavuzu: https://www.bilibili.com/video/av38543231 Gerçek savaş kılavuzu: -üç-algoritma-python-with-scikit-learn /4. Karar Ağacı
Karar ağacı tahmin sonuçlarının arkasındaki en basit ama en etkili yöntemlerden biri, pek çok şekilde (rastgele orman gibi) kullanılırlar.
Teori açıklaması: https://www.bilibili.com/video/av26086646 Pratik kılavuz: https://www.bilibili.com/video/av35523476 Pratik kılavuz: -üç-algoritma-python-with-scikit-learn /5. Entegre öğrenme ve rastgele orman
Toplu öğrenme, bir grup seçmen elde etmek için bazı makine öğrenimi modellerinin tüm farklı özelliklerini ve avantajlarını ve dezavantajlarını kullanmaktır. Bu seçmenler size her tahminde en olası sonucu verecektir. Bu oylar farklı sınıflandırıcılar tarafından verilir (SVM , ID3 algoritması, lojistik regresyon).
6. Denetimsiz öğrenme
National Taiwan University Li Hongyi Video: https://www.bilibili.com/video/av10590361/?p=24Exsupervised Learning gerçekten iyi: https://towardsdatascience.com/unsupervised-learning-with-python-173c51dc7f03 Denetlenmeyen Öğrenme, Evet Denetimli öğrenme ile pekiştirmeli öğrenme arasındaki fark: https://blogs.nvidia.com/blog/2018/08/02/supervised-unsupervised-learning/ Derin öğrenme ve TensorFlow2015'te açık kaynak olduğundan, derin öğrenme çerçeveleri dünyası TensorFlow'a aittir. GitHub'ın koleksiyonları veya çatalları veya endüstri kullanımı olsun, bunlar en iyiler arasında benzersizdir. Bu bölümün yazarı, TensorFlow ile ilgili birçok öğretici ve uygulamayı tanıtır ve okuyucuların resmi TensorFlow eğitimini doğrudan okumaları önerilir. Derin öğrenme için okuyucular Stanford'un CS231n kursunu veya öğrenme için "Derin Öğrenme" yi takip edebilir.
Çerçevenin avantajlarından ve dezavantajlarından bahsetmişken, bu TensorFlow ile başlamak için minimalist bir öğreticidir. Crash! Bilim ve Teknoloji TensorFlow Hong Kong Üniversitesi hızla # 871b30f5b06cbe9e319df1c24e34e3386bedirected kovaladı paylaşımı eğitim yazılımına TensorFlow kod kümesi Sen TensorFlow2107362e23e07d091c2cb4bfaedirect_director07d091c8cb4bfaedirect21 hakkında bilmeniz gereken hangi TensorFlow öğretici resmi Çin versiyonu deneyebilirsiniz TensorFlow # 871af50cb06d7c1a1c7e16bbae9 ile şeyler metin sınıflandırma / s? __ biz = MzA3MzI4MjgzMw == mid = 2650742373idx = 2sn = ad176a47b0e61e1c83444079d365354achksm = 871ada1bb06d530de70930d573a5c09b470dbd5fac85d1b161ca5c09b470dbd5fac85d1b65Yazar, TensorFlow'u anladıktan sonra, mühendislik yapmak için derin öğrenmeyi tekrar tekrar öğrenebileceğimizi söyledi:
Yazar daha sonra tamamen bağlı ağlar, tekrarlayan ağlar, evrişimli ağlar ve otomatik kodlayıcılar gibi modüllerden birçok öğrenme kaynağı tanıttı. Ayrıntılar için lütfen orijinal GitHub projesini kontrol edin.
Öğrenme araçları
Bu bölümde yazar, makine öğrenimi projeleri, araçlar, Youtube kanalları, bloglar, web siteleri vb. Dahil olmak üzere çok sayıda öğrenme kaynağı düzenler ve ilgilenen okuyucular bunları kendi başlarına görüntüleyebilir.
Editör: Wang Jing redaksiyon: Tan Jiayao - Bitiş -Tsinghua-Qingdao Veri Bilimi Enstitüsü'nün resmi WeChat kamu platformunu takip edin " THU Veri Pastası "Ve kız kardeş numarası" Veri Pastası THU "Daha fazla ders avantajı ve kaliteli içerik elde edin.