Yazar | Rahul Agarwal
Çevirmen | Crescent Moon, Baş Editör | Wu Xingling
Aşağıdaki çeviridir:
Üniversitede ana dalım makine mühendisiydi, bu yüzden mezun olduktan sonra çelik sektörüne girdim.
Yüksek fırınlarda ve haddehanelerde her gün ağır çelik çizmeler ve plastik başlıklar takıyorum. Belirli güvenlik önlemlerimiz olmasına rağmen, bir kaza olduğunda kimsenin beni kurtaramayacağını biliyorum. Belki koşu ayakkabıları yardımcı olabilir ama kasklar, hatta çelik bile 1370 santigrat derecede suya dönüşecek.
Bu yüzden korku içindeydim, bu işin bana uygun olmadığını anladım ve bir hedef belirledim: 2011'de analiz ve veri bilimi alanına girmek. O zamandan beri, büyük ölçekli çevrimiçi açık kurslar yeni bilgiler öğrenmek için ilk tercihim haline geldi.Elbette, daha sonra bu tür birçok kursa karışık sonuçlarla katıldım.
2020'de veri bilimi alanındaki bu kadar hızlı değişikliklerle, veri bilimini öğrenecek kaynaklardan yoksun değiliz. Ancak yeni başlayanlar çoğu zaman bir soruyla karşılaşırlar: nereden başlamalılar ve ne öğrenmeliler? İnternette birçok kaynak var ve bunlar karışık.
Barry Schwartz bir keresinde "Seçim Paradoksu" kitabında (SEÇİM PARADOKSU: NEDEN DAHA AZ) tüketici seçimini ortadan kaldırmanın müşterilerin endişesini büyük ölçüde azaltabileceğine işaret etmişti. Aynısı veri bilimi dersleri için de geçerlidir.
Bu nedenle, bu metnin amacı kafası karışmış olan tüm yeni başlayanlara tavsiyelerde bulunmak ve veri bilimi yolculuğunuzun yönünü belirtmektir.
Python programlama
Öncelikle bir programlama dili öğrenmeniz gerekiyor. Michigan Üniversitesi'nden alınan aşağıdaki dersler, Python'u nasıl kullanacağınızı ve kendi uygulamalarınızı nasıl oluşturacağınızı açıklar.
Python 3 Programlama Uzmanlığı:
https://www.coursera.org/specializations/python-3-programming?action=enrollranEAID=lVarvwc5BD0ranMID=40328ranSiteID=lVarvwc5BD0-lPz4qOVNorxVbCwvw9KrQAsiteID=lVarvlwc5BD0-0-programming?action=enrollranEAID=lVarvwc5BD0ranMID
Bu kursta, programlamanın temellerini (değişkenler, koşullu ifadeler, döngü ifadeleri vb.) Ve ayrıca anahtar kelime parametreleri, liste anlamaları, lambda ifadeleri ve sınıf mirası gibi bazı orta düzey bilgileri öğrenebilirsiniz.
Veri bilimi
Sonra, önce makine öğrenimini anlamamız gerekiyor.
Michigan Üniversitesi'nden alınan aşağıdaki kurslar, modern makine öğreniminin giriş bilgilerini açıklamaktadır. Tüm bilgiye sahip olmasanız bile bu araçları modeller oluşturmak için kullanabilirsiniz.
Python Uzmanlığı ile Uygulamalı Veri Bilimi: https://www.coursera.org/specializations/data-science-python?ranMID=40328ranEAID=lVarvwc5BD0ranSiteID=lVarvwc5BD0-5xCr9hsFao15_9pstk.4OAsiteID=lVarvwc5Bhource0-5xCrut9
Bu profesyonel kursun nesne odaklı, temel bir Python veya programlama geçmişine sahip olmak ve popüler python araç kitleri (pandalar, matplotlib, scikit-learn, nltk ve networkx gibi) aracılığıyla istatistik, makine öğrenimi, bilgi görselleştirme, metin analizi ve sosyal ağ oluşturmayı ummaktır. Verilere ilişkin içgörü kazanmak için analiz teknikleri.
Makine öğrenimi teorisi ve temeli
Yukarıdaki kursları tamamladıktan sonra, başarılı bir şekilde başlayabileceksiniz.
Tebrikler! Veri bilimiyle ilgili temel bir anlayışa sahipsiniz ve bunu nasıl uygulayacağınızı da biliyorsunuz.
Ancak, bu modellerin arkasındaki matematiği tam olarak anlamadınız.
Clf.fit'in arkasındaki ayrıntıları anlamanız gerekir. Modelin arkasındaki matematiği anlamıyorsanız, matematik bilimcisi değilsiniz demektir.
Aşağıda, Stanford Üniversitesi tarafından sağlanan ve makine öğrenimi algoritmalarının arkasındaki birçok matematiksel bilgiyi içeren bir makine öğrenimi dersi verilmiştir.
Makine öğrenme:
https://www.coursera.org/learn/machine-learning?ranMID=40328ranEAID=lVarvwc5BD0ranSiteID=lVarvwc5BD0-btd7XBdF681VKxRe2H_OygsiteID=lVarvwc5BD0-source_td7XBdFems_source_td7XBmource ---------------- ranMID = 40328ranEAID = je6NUbpObpQranSiteID = je6NUbpObpQ-dEliPy0W03upl5lVg_ACYwsiteID = je6NUbpObpQ-dEliPy0W03upl5lVg_ACYwutm_contut6
Bence bu almanız gereken bir ders, çünkü bu kurs alana girmem için bana ilham verdi ve Andrew Ng harika bir öğretim görevlisi. Üstelik bu aynı zamanda çalıştığım ilk derstir.
Bu kurs, makine öğreniminin hemen hemen tüm içeriğini içerir: regresyon, sınıflandırma, anormallik algılama, öneri sistemi, sinir ağı ve birçok mükemmel öneri.
İstatistiksel çıkarımı öğrenme
Çıkarım istatistiğine ilişkin bu ders Duke Üniversitesi'nden Çetinkaya-Rundel tarafından verilmektedir. Bu, en kolay giriş kursudur.
Çıkarımsal istatistik: https://www.coursera.org/learn/inferential-statistics-intro?ranMID=40328ranEAID=lVarvwc5BD0ranSiteID=lVarvwc5BD0-ydEVG6k5kidzLtNqbbVQvQsiteID=lVarvwc5BD0-ydEVG6
Çetinkaya-Rundel inanılmaz bir öğretim görevlisidir ve gerekli bir ders olan istatistiksel çıkarımın temellerini çok iyi açıklamaktadır.
Bu kursta, sayısal ve kategorik veriler için hipotez testi, güven aralıkları ve istatistiksel çıkarım yöntemleri hakkında bilgi edineceksiniz.
Temel SQL bilgilerini öğrenin
Bir model oluşturmak ve farklı varsayımlar önermek çok tatmin edici olsa da, verilerin işlenmesi hafife alınmamalıdır.
ETL ve veri hazırlama görevlerinde SQL her yerdedir, bu nedenle herkesin temel SQL bilgisini anlaması gerekir.
Ek olarak SQL, Apache Spark gibi büyük veri araçları için standart haline geldi. California Üniversitesi, Davis'teki aşağıdaki kurslar size SQL uzmanlığını ve dağıtılmış bilgi işlem için SQL'i nasıl kullanacağınızı öğretecektir.
Veri Bilimi Uzmanlığı için SQL Temellerini Öğrenin:
https://www.coursera.org/specializations/learn-sql-basics-data-science?
Ders Tanımı: Veri bilimi uygulamalarında artan zorluklarla 4 SQL projesi aracılığıyla SQL'in temellerini, veri sıralama, SQL analizi, AB testi ve dağıtılmış hesaplama için Apache Spark'ın kullanımını öğrenin.
Gelişmiş makine öğrenimi
Yukarıda öğrendiğimiz bilgiler çok basittir (farklı fikirlere sahip olabilirsiniz), öğrenme materyalleri kolayca elde edilebilir ve kullanılan matematiksel bilgi de çok sınırlıdır. Ancak bu bilgi, bir sonraki adım için iyi bir temel oluşturabilir. Aşağıdaki, en iyi Kaggle makine öğrenimi uygulayıcıları ve CERN bilim adamları tarafından öğretilen gelişmiş bir makine öğrenimi kursudur. Çok zor birçok kavramı açıklar ve makinelerin geçmiş çalışma yöntemlerini ve makine öğrenimi dünyasındaki en son gelişmeleri anlamanıza yardımcı olabilir.
Gelişmiş Makine Öğrenimi Uzmanlığı:
https://www.coursera.org/specializations/aml?ranMID=40328ranEAID=lVarvwc5BD0ranSiteID=lVarvwc5BD0-hwTRi7XT6lsOWS0g2lGNcAsiteID=lVarvwc5BD0-hwTRiwmed_XT6TR
Ders Tanımı: Bu ders derin öğrenme, pekiştirmeli öğrenme, doğal dil anlama, bilgisayarla görme ve Bayes yöntemlerini tanıtmaktadır. En iyi Kaggle makine öğrenimi uygulayıcıları ve CERN bilim adamları, kursta gerçek dünyadaki sorunları çözmedeki deneyimlerini paylaşacak ve teori ve pratikteki boşlukları doldurmanıza yardımcı olacak.
Derin öğrenme
Aşağıdaki derin öğrenme profesyonel kursu çok yüksek altın içeriğine sahiptir.
Derin Öğrenme Uzmanlığı:
https://www.coursera.org/specializations/deep-learning?ranMID=40328ranEAID=lVarvwc5BD0ranSiteID=lVarvwc5BD0-m3SBadPJeg1Z1rWVng39OQsiteID=lVarvwc5BD0-medium3SBadm39
Öğretim Görevlisi Andrew Ng, çok zor kavramları anlaşılması çok kolay bir şekilde açıkladı.
Kurs açıklaması: Derin öğrenmenin temellerini anlayın, sinir ağlarının nasıl kurulacağını anlayın ve makine öğrenimi projelerini başarıya nasıl taşıyacağınızı öğrenin. Evrişimli ağlar, tekrarlayan sinir ağları (RNN), uzun kısa süreli bellek ağları (LSTM), Adam, Bırakma, toplu normalleştirme, Xavier / He başlatma ve daha fazlasını öğreneceksiniz. Buna ek olarak, sağlık hizmetleri, otonom sürüş, işaret dili okuma, müzik üretimi ve doğal dil işleme konularında derinlemesine vaka çalışmaları yapacaksınız.
Pytorch
Genelde öğrenme araçlarını asla savunmam ama burada Pytorch'u tavsiye ederim. Nedeni, inanılmaz ve çok önemli olmasıdır.Pytorch'u anlamak istiyorsanız, yeni araştırma makalelerinin çoğundaki kodu okumanız gerekir. Derin öğrenme alanındaki araştırmacılar için Pytorch varsayılan programlama dili haline geldi ve bize çok fayda sağlayacak.
IBM tarafından sağlanan kurslar PyTorch ile Derin Sinir Ağları :
https://www.coursera.org/learn/deep-neural-networks-with-pytorch?ranMID=40328ranEAID=lVarvwc5BD0ranSiteID=lVarvwc5BD0-qSeTzSahS03W9YVHnWT_QAsiteID=lVarvwc5Vah_medlink=lVarvwc5Vah_medlink=lVarvwc5Vah_med_partw9YVHnWT_QAsiteID=lVarvwc5Vah_medysource=WTzSutv
Kurs tanıtımı: Bu kurs ilk olarak Pytorch'un tensör ve otomatik farklılaştırma yazılım paketini tanıtacaktır. Her bölüm, doğrusal regresyon, lojistik regresyon / softmax regresyon gibi temel bilgilerle başlayan farklı modelleri kapsayacaktır. İkincisi, ileri beslemeli derin sinir ağı, farklı etkinleştirme işlevleri, standardizasyon ve Bırakma katmanının rolüdür. Sonra evrişimli sinir ağlarını tanıtacağız ve öğrenmeyi aktaracağız. Son olarak, birkaç başka derin öğrenme yöntemi tanıtılacaktır.
AWS makine öğrenimine başlarken
Harika bir makine öğrenimi sistemi oluştururken dikkate alınması gereken birçok faktör vardır. Ancak veri bilimcileri olarak, genellikle projenin yalnızca belirli bölümleri için endişeleniyoruz.
Ancak, modeli oluşturulduktan sonra nasıl konuşlandıracağımızı düşündük mü?
Çok sayıda makine öğrenimi projesi gördüm, ancak çoğu başarısız olmaya mahkum çünkü başından beri bu projelerin üretim planı yok. İyi bir platforma sahip olmak ve makine öğrenimi uygulamalarının nasıl dağıtılacağını anlamak gerçek dünyada çok önemlidir. Aşağıdaki AWS kursu, makine öğrenimi uygulamalarını uygulamak için AWS'nin nasıl kullanılacağını açıklamaktadır.
AWS Machine Learning'e Başlarken:
https://www.coursera.org/learn/aws-machine-learning?
Bu kursta öğreneceksiniz:
1. Modelleri oluşturmak, eğitmek ve dağıtmak için yerleşik algoritmalar ve Jupyter Notebook bulut sunucularıyla Amazon SageMaker nasıl kullanılır?
2. Akıllı uygulamalar oluşturmak için Amazon'un AI hizmetlerini (Amazon Comprehend, Amazon Rekognition, Amazon Translate vb.) Kullanma.
Veri yapısı ve algoritma
Algoritmalar ve veri yapıları, veri biliminin ayrılmaz bir parçasıdır. Çoğu veri bilimcisi algoritmaları ve veri yapılarını öğrenmemiş olsa da, hepsi çok önemlidir.
Birçok şirket, veri bilimcileriyle görüşmeler sırasında veri yapıları ve algoritmalar hakkında sorular soruyor.
Veri Yapıları ve Algoritma Uzmanlığı:
https://www.coursera.org/specializations/data-structures-algorithms?ranMID=40328ranEAID=lVarvwc5BD0ranSiteID=lVarvwc5BD0-GFspWabzEy8Lf9dKWHbYygsiteID=lVarvwc5BD0-GFYf9dKWHbYygsiteID=lVarvwc5BD0-GFYf9dKWHbYygsiteID=lVarvwc5BD0-GFYf9dKWHbYygsiteID=lVarvwc5BD0-GFYfvwc5BD0_mediumsourcelink=lVarvn
Bu kursta, çeşitli hesaplama problemlerini çözmek için algoritmalar öğrenecek ve en sevdiğiniz programlama dilinde yaklaşık 100 algoritma programlama problemini uygulayacaksınız. Bu kursta verilen algoritmik sorular, bir sonraki röportajda karşılaşabileceğiniz programlama sorularına çok yakındır.
Orijinal bağlantı: https://towardsdatascience.com/top-10-resources-to-become-a-data-scientist-in-2020-99a315194701
Yazar: Rahul Agarwal, veri bilimcileri @WalmartLabs.
Bu makale bir CSDN çevirisidir, lütfen yeniden basımın kaynağını belirtin.