Size veri bilimcisi olmayı öğretmek için on adım

Yazar | Rahul Agarwal

Çevirmen | Crescent Moon, Baş Editör | Wu Xingling

Aşağıdaki çeviridir:

Üniversitede ana dalım makine mühendisiydi, bu yüzden mezun olduktan sonra çelik sektörüne girdim.

Yüksek fırınlarda ve haddehanelerde her gün ağır çelik çizmeler ve plastik başlıklar takıyorum. Belirli güvenlik önlemlerimiz olmasına rağmen, bir kaza olduğunda kimsenin beni kurtaramayacağını biliyorum. Belki koşu ayakkabıları yardımcı olabilir ama kasklar, hatta çelik bile 1370 santigrat derecede suya dönüşecek.

Bu yüzden korku içindeydim, bu işin bana uygun olmadığını anladım ve bir hedef belirledim: 2011'de analiz ve veri bilimi alanına girmek. O zamandan beri, büyük ölçekli çevrimiçi açık kurslar yeni bilgiler öğrenmek için ilk tercihim haline geldi.Elbette, daha sonra bu tür birçok kursa karışık sonuçlarla katıldım.

2020'de veri bilimi alanındaki bu kadar hızlı değişikliklerle, veri bilimini öğrenecek kaynaklardan yoksun değiliz. Ancak yeni başlayanlar çoğu zaman bir soruyla karşılaşırlar: nereden başlamalılar ve ne öğrenmeliler? İnternette birçok kaynak var ve bunlar karışık.

Barry Schwartz bir keresinde "Seçim Paradoksu" kitabında (SEÇİM PARADOKSU: NEDEN DAHA AZ) tüketici seçimini ortadan kaldırmanın müşterilerin endişesini büyük ölçüde azaltabileceğine işaret etmişti. Aynısı veri bilimi dersleri için de geçerlidir.

Bu nedenle, bu metnin amacı kafası karışmış olan tüm yeni başlayanlara tavsiyelerde bulunmak ve veri bilimi yolculuğunuzun yönünü belirtmektir.

Python programlama

Öncelikle bir programlama dili öğrenmeniz gerekiyor. Michigan Üniversitesi'nden alınan aşağıdaki dersler, Python'u nasıl kullanacağınızı ve kendi uygulamalarınızı nasıl oluşturacağınızı açıklar.

Python 3 Programlama Uzmanlığı:

https://www.coursera.org/specializations/python-3-programming?action=enrollranEAID=lVarvwc5BD0ranMID=40328ranSiteID=lVarvwc5BD0-lPz4qOVNorxVbCwvw9KrQAsiteID=lVarvlwc5BD0-0-programming?action=enrollranEAID=lVarvwc5BD0ranMID

Bu kursta, programlamanın temellerini (değişkenler, koşullu ifadeler, döngü ifadeleri vb.) Ve ayrıca anahtar kelime parametreleri, liste anlamaları, lambda ifadeleri ve sınıf mirası gibi bazı orta düzey bilgileri öğrenebilirsiniz.

Veri bilimi

Sonra, önce makine öğrenimini anlamamız gerekiyor.

Michigan Üniversitesi'nden alınan aşağıdaki kurslar, modern makine öğreniminin giriş bilgilerini açıklamaktadır. Tüm bilgiye sahip olmasanız bile bu araçları modeller oluşturmak için kullanabilirsiniz.

Python Uzmanlığı ile Uygulamalı Veri Bilimi: https://www.coursera.org/specializations/data-science-python?ranMID=40328ranEAID=lVarvwc5BD0ranSiteID=lVarvwc5BD0-5xCr9hsFao15_9pstk.4OAsiteID=lVarvwc5Bhource0-5xCrut9

Bu profesyonel kursun nesne odaklı, temel bir Python veya programlama geçmişine sahip olmak ve popüler python araç kitleri (pandalar, matplotlib, scikit-learn, nltk ve networkx gibi) aracılığıyla istatistik, makine öğrenimi, bilgi görselleştirme, metin analizi ve sosyal ağ oluşturmayı ummaktır. Verilere ilişkin içgörü kazanmak için analiz teknikleri.

Makine öğrenimi teorisi ve temeli

Yukarıdaki kursları tamamladıktan sonra, başarılı bir şekilde başlayabileceksiniz.

Tebrikler! Veri bilimiyle ilgili temel bir anlayışa sahipsiniz ve bunu nasıl uygulayacağınızı da biliyorsunuz.

Ancak, bu modellerin arkasındaki matematiği tam olarak anlamadınız.

Clf.fit'in arkasındaki ayrıntıları anlamanız gerekir. Modelin arkasındaki matematiği anlamıyorsanız, matematik bilimcisi değilsiniz demektir.

Aşağıda, Stanford Üniversitesi tarafından sağlanan ve makine öğrenimi algoritmalarının arkasındaki birçok matematiksel bilgiyi içeren bir makine öğrenimi dersi verilmiştir.

Makine öğrenme:

https://www.coursera.org/learn/machine-learning?ranMID=40328ranEAID=lVarvwc5BD0ranSiteID=lVarvwc5BD0-btd7XBdF681VKxRe2H_OygsiteID=lVarvwc5BD0-source_td7XBdFems_source_td7XBmource ---------------- ranMID = 40328ranEAID = je6NUbpObpQranSiteID = je6NUbpObpQ-dEliPy0W03upl5lVg_ACYwsiteID = je6NUbpObpQ-dEliPy0W03upl5lVg_ACYwutm_contut6

Bence bu almanız gereken bir ders, çünkü bu kurs alana girmem için bana ilham verdi ve Andrew Ng harika bir öğretim görevlisi. Üstelik bu aynı zamanda çalıştığım ilk derstir.

Bu kurs, makine öğreniminin hemen hemen tüm içeriğini içerir: regresyon, sınıflandırma, anormallik algılama, öneri sistemi, sinir ağı ve birçok mükemmel öneri.

İstatistiksel çıkarımı öğrenme

Çıkarım istatistiğine ilişkin bu ders Duke Üniversitesi'nden Çetinkaya-Rundel tarafından verilmektedir. Bu, en kolay giriş kursudur.

Çıkarımsal istatistik: https://www.coursera.org/learn/inferential-statistics-intro?ranMID=40328ranEAID=lVarvwc5BD0ranSiteID=lVarvwc5BD0-ydEVG6k5kidzLtNqbbVQvQsiteID=lVarvwc5BD0-ydEVG6

Çetinkaya-Rundel inanılmaz bir öğretim görevlisidir ve gerekli bir ders olan istatistiksel çıkarımın temellerini çok iyi açıklamaktadır.

Bu kursta, sayısal ve kategorik veriler için hipotez testi, güven aralıkları ve istatistiksel çıkarım yöntemleri hakkında bilgi edineceksiniz.

Temel SQL bilgilerini öğrenin

Bir model oluşturmak ve farklı varsayımlar önermek çok tatmin edici olsa da, verilerin işlenmesi hafife alınmamalıdır.

ETL ve veri hazırlama görevlerinde SQL her yerdedir, bu nedenle herkesin temel SQL bilgisini anlaması gerekir.

Ek olarak SQL, Apache Spark gibi büyük veri araçları için standart haline geldi. California Üniversitesi, Davis'teki aşağıdaki kurslar size SQL uzmanlığını ve dağıtılmış bilgi işlem için SQL'i nasıl kullanacağınızı öğretecektir.

Veri Bilimi Uzmanlığı için SQL Temellerini Öğrenin:

https://www.coursera.org/specializations/learn-sql-basics-data-science?

Ders Tanımı: Veri bilimi uygulamalarında artan zorluklarla 4 SQL projesi aracılığıyla SQL'in temellerini, veri sıralama, SQL analizi, AB testi ve dağıtılmış hesaplama için Apache Spark'ın kullanımını öğrenin.

Gelişmiş makine öğrenimi

Yukarıda öğrendiğimiz bilgiler çok basittir (farklı fikirlere sahip olabilirsiniz), öğrenme materyalleri kolayca elde edilebilir ve kullanılan matematiksel bilgi de çok sınırlıdır. Ancak bu bilgi, bir sonraki adım için iyi bir temel oluşturabilir. Aşağıdaki, en iyi Kaggle makine öğrenimi uygulayıcıları ve CERN bilim adamları tarafından öğretilen gelişmiş bir makine öğrenimi kursudur. Çok zor birçok kavramı açıklar ve makinelerin geçmiş çalışma yöntemlerini ve makine öğrenimi dünyasındaki en son gelişmeleri anlamanıza yardımcı olabilir.

Gelişmiş Makine Öğrenimi Uzmanlığı:

https://www.coursera.org/specializations/aml?ranMID=40328ranEAID=lVarvwc5BD0ranSiteID=lVarvwc5BD0-hwTRi7XT6lsOWS0g2lGNcAsiteID=lVarvwc5BD0-hwTRiwmed_XT6TR

Ders Tanımı: Bu ders derin öğrenme, pekiştirmeli öğrenme, doğal dil anlama, bilgisayarla görme ve Bayes yöntemlerini tanıtmaktadır. En iyi Kaggle makine öğrenimi uygulayıcıları ve CERN bilim adamları, kursta gerçek dünyadaki sorunları çözmedeki deneyimlerini paylaşacak ve teori ve pratikteki boşlukları doldurmanıza yardımcı olacak.

Derin öğrenme

Aşağıdaki derin öğrenme profesyonel kursu çok yüksek altın içeriğine sahiptir.

Derin Öğrenme Uzmanlığı:

https://www.coursera.org/specializations/deep-learning?ranMID=40328ranEAID=lVarvwc5BD0ranSiteID=lVarvwc5BD0-m3SBadPJeg1Z1rWVng39OQsiteID=lVarvwc5BD0-medium3SBadm39

Öğretim Görevlisi Andrew Ng, çok zor kavramları anlaşılması çok kolay bir şekilde açıkladı.

Kurs açıklaması: Derin öğrenmenin temellerini anlayın, sinir ağlarının nasıl kurulacağını anlayın ve makine öğrenimi projelerini başarıya nasıl taşıyacağınızı öğrenin. Evrişimli ağlar, tekrarlayan sinir ağları (RNN), uzun kısa süreli bellek ağları (LSTM), Adam, Bırakma, toplu normalleştirme, Xavier / He başlatma ve daha fazlasını öğreneceksiniz. Buna ek olarak, sağlık hizmetleri, otonom sürüş, işaret dili okuma, müzik üretimi ve doğal dil işleme konularında derinlemesine vaka çalışmaları yapacaksınız.

Pytorch

Genelde öğrenme araçlarını asla savunmam ama burada Pytorch'u tavsiye ederim. Nedeni, inanılmaz ve çok önemli olmasıdır.Pytorch'u anlamak istiyorsanız, yeni araştırma makalelerinin çoğundaki kodu okumanız gerekir. Derin öğrenme alanındaki araştırmacılar için Pytorch varsayılan programlama dili haline geldi ve bize çok fayda sağlayacak.

IBM tarafından sağlanan kurslar PyTorch ile Derin Sinir Ağları :

https://www.coursera.org/learn/deep-neural-networks-with-pytorch?ranMID=40328ranEAID=lVarvwc5BD0ranSiteID=lVarvwc5BD0-qSeTzSahS03W9YVHnWT_QAsiteID=lVarvwc5Vah_medlink=lVarvwc5Vah_medlink=lVarvwc5Vah_med_partw9YVHnWT_QAsiteID=lVarvwc5Vah_medysource=WTzSutv

Kurs tanıtımı: Bu kurs ilk olarak Pytorch'un tensör ve otomatik farklılaştırma yazılım paketini tanıtacaktır. Her bölüm, doğrusal regresyon, lojistik regresyon / softmax regresyon gibi temel bilgilerle başlayan farklı modelleri kapsayacaktır. İkincisi, ileri beslemeli derin sinir ağı, farklı etkinleştirme işlevleri, standardizasyon ve Bırakma katmanının rolüdür. Sonra evrişimli sinir ağlarını tanıtacağız ve öğrenmeyi aktaracağız. Son olarak, birkaç başka derin öğrenme yöntemi tanıtılacaktır.

AWS makine öğrenimine başlarken

Harika bir makine öğrenimi sistemi oluştururken dikkate alınması gereken birçok faktör vardır. Ancak veri bilimcileri olarak, genellikle projenin yalnızca belirli bölümleri için endişeleniyoruz.

Ancak, modeli oluşturulduktan sonra nasıl konuşlandıracağımızı düşündük mü?

Çok sayıda makine öğrenimi projesi gördüm, ancak çoğu başarısız olmaya mahkum çünkü başından beri bu projelerin üretim planı yok. İyi bir platforma sahip olmak ve makine öğrenimi uygulamalarının nasıl dağıtılacağını anlamak gerçek dünyada çok önemlidir. Aşağıdaki AWS kursu, makine öğrenimi uygulamalarını uygulamak için AWS'nin nasıl kullanılacağını açıklamaktadır.

AWS Machine Learning'e Başlarken:

https://www.coursera.org/learn/aws-machine-learning?

Bu kursta öğreneceksiniz:

1. Modelleri oluşturmak, eğitmek ve dağıtmak için yerleşik algoritmalar ve Jupyter Notebook bulut sunucularıyla Amazon SageMaker nasıl kullanılır?

2. Akıllı uygulamalar oluşturmak için Amazon'un AI hizmetlerini (Amazon Comprehend, Amazon Rekognition, Amazon Translate vb.) Kullanma.

Veri yapısı ve algoritma

Algoritmalar ve veri yapıları, veri biliminin ayrılmaz bir parçasıdır. Çoğu veri bilimcisi algoritmaları ve veri yapılarını öğrenmemiş olsa da, hepsi çok önemlidir.

Birçok şirket, veri bilimcileriyle görüşmeler sırasında veri yapıları ve algoritmalar hakkında sorular soruyor.

Veri Yapıları ve Algoritma Uzmanlığı:

https://www.coursera.org/specializations/data-structures-algorithms?ranMID=40328ranEAID=lVarvwc5BD0ranSiteID=lVarvwc5BD0-GFspWabzEy8Lf9dKWHbYygsiteID=lVarvwc5BD0-GFYf9dKWHbYygsiteID=lVarvwc5BD0-GFYf9dKWHbYygsiteID=lVarvwc5BD0-GFYf9dKWHbYygsiteID=lVarvwc5BD0-GFYfvwc5BD0_mediumsourcelink=lVarvn

Bu kursta, çeşitli hesaplama problemlerini çözmek için algoritmalar öğrenecek ve en sevdiğiniz programlama dilinde yaklaşık 100 algoritma programlama problemini uygulayacaksınız. Bu kursta verilen algoritmik sorular, bir sonraki röportajda karşılaşabileceğiniz programlama sorularına çok yakındır.

Orijinal bağlantı: https://towardsdatascience.com/top-10-resources-to-become-a-data-scientist-in-2020-99a315194701

Yazar: Rahul Agarwal, veri bilimcileri @WalmartLabs.

Bu makale bir CSDN çevirisidir, lütfen yeniden basımın kaynağını belirtin.

"Programcılar verileri nasıl analiz edeceklerini bilmiyorlar, etkisi nedir?" Kıdemli programcılar: temelde kendi kendini yenilgiye uğratan dövüş sanatlarına eşittir
önceki
Komik: Büyük fabrikaların genel SaaS dağıtımında IaaS, PaaS ve SaaS nedir?
Sonraki
Microsoft'un açık kaynak derin öğrenme optimizasyon kitaplığı DeepSpeed, GitHub trend listesinde listelenmiştir
Iowa seçim uygulaması oylamasının maskaralıkları üzerine düşünceler: Yazılım mühendisliğinde neden bu kadar kötüüz?
Evde 270 milyon öğrenci derslere katılıyor, velilerin görüşleri var ...
Alternatif veri yorumlama: maskeler ne zaman geçerli hale geldi?
Sonunda size en yakın salgın bölgeyi kontrol edebilirsiniz.
Bekarlar için Sevgililer Günü'nün sırrı, programcının aşk sözlerinin harika bir envanteri! | CSDN blog seçimi
hatırlatmak! Bu blockchain platformunu hızla atın
Arka arkaya 11 düşüş, 0 büyüme ... Bu rakamlar bize umut veriyor
Tsinghua doktora danışmanı Yin Shouyi, sizi AI çiplerinin giriş ve çıkışlarına götürüyor
"Linux bilmiyorum, her şeyi yapmalıyım!" Kıdemli programcı: Artık çok çalışmayın
Ayrıntılı virüs açıklaması ve toplu virüs üretimi: kendi kendine başlatma, şifre değişikliği, programlı kapatma, mavi ekran, işlem kapatma
Buffett'in son pozisyon teşhiri! 1,68 trilyon hisseye sahip olan ve% 44 gibi büyük bir kâr elde eden Garip Apple, karı ikiye katladı, süpermarket hisse senetleri satın aldı ve banka hisse senetleri s
To Top