2020'de veri biliminde çığır açan dört adım

Tam metin 2357 Kelimeler, tahmini öğrenme süresi 7 dakika

Kaynak: Pexels

Bu sorun değil, ancak sizi bunaltacak küçük, zaman alıcı ve neredeyse imkansız hedeflerin bir listesini yapmanız muhtemeldir ve çok fazla görev olduğu için motivasyonunuzu kaybedebilirsiniz.

Bu yıl veri bilimi alanına girmeyi planlıyorsanız, bu harika bir karar. Bu alan yaygın olarak tanınmaktadır ve iş bulmak kolaydır ve maaş iyidir.Yönetim departmanı bile yavaş yavaş veri biliminin vazgeçilmez olduğunu fark etmektedir.

Ancak başlamadan önce, lütfen şok edici bir şey söylememe izin verin (söylemem gerekiyor): Veri biliminin tüm içeriğini bir yılda öğrenmek yeterli değil.

Beni yanlış anlamayın, ilk işinizi bulmanız için bir yıl yeterli, ancak sıfırdan veri bilimi ekibinin lideri olmanız imkansız (eğer öyleyseniz, lütfen yorum bölümünde hikayenizi paylaşın).

Bunu söyledikten sonra, uygulamalı operasyonunuzu tatmin etmek için gerekli becerileri ve becerileri keşfedelim.

1. Veritabanı?

Analiz ettiğimiz veriler, muhtemelen kitapların veya kursların tipik durumundan farklı olan belirli bir veritabanından geliyor - doğru formatta bir CSV dosyası alamayacaksınız. Genellikle, profesyonel bilgiye (veya bu bilgiyi anlayan birini tanımaya) ve belirli bir SQL anlayışına sahip olmanız gerekir.

Analiz etmek için Python veya R dilini kullanıyorsanız, SQL analiz işlevlerini, PLSQL / T-SQL ve tüm bu zor şeyleri öğrenmek için çok fazla zaman harcamayın. Bu durumda, SQL'in görevi büyük ölçüde birkaç tablo kümesini birleştirmeye ve bunları analiz etmeye dayanır.

Bu işlemin ne kadar süreceği, kullanıma ve önceki bilgilere bağlıdır, ancak acemi burada bir aydan fazla zaman geçirmeyecektir.

2. Şimdi veri biliminden bahsedelim

Kaynak: Pexels

Yukarıdaki adımların her birini izlerseniz ve önceden bilginiz yoksa, Ağustos veya Eylül 2020 olabilir. Çok zaman geçti, ancak ilk işinizi aramak için tüm ön koşullara sahipsiniz.

Her şeyin doğru olması gerekmez.

Veri biliminde bir iş bulmak için, şu anda yalnızca ön koşullardan bahsedilmektedir. Önümüzdeki iki ay içinde, aşağıdakiler gibi bazı temel veri analizi ve görselleştirme kitaplıklarının anlaşılması önerilir:

l huysuz

l Pandalar

l Matplotlib

l Scipy

l İstatistik modelleri

Bu, anlamadığınız zamandır (bu bilgiye neden ihtiyaç duyduğunuzu bilmiyorsanız, öğrenmek sıkıcı olacaktır).

Kursu süslü bir şekilde izlemeyin, web sitesindeki veri setini indirin ve tamamen analiz edin. Başkalarının aynı veri kümesiyle nasıl başa çıktığını görmek için İnternet'e gidin ve nasıl iyileştirebileceğinizi görün.

Benzer şekilde, bu iki ay boyunca, aşağıdakiler gibi bazı makine öğrenimi algoritmalarına aşina olmanız gerekir:

l Doğrusal Regresyon

l Lojistik Regresyon

l Sınıflandırma ve Regresyon Ağaçları

l KNN (k-NearestNeighbor, K en yakın komşu sınıflandırma algoritması)

l Naive Bayes sınıflandırması (Naive Bayes)

l SVM (Destek Vektör Makinesi, Destek Vektör Makinesi)

Belki bunlar gerçek operasyonda kullanılmayacak, ancak gelecekte XGBoost ve Sinir ağları daha gelişmiş algoritmaları öğrenmenin temelini oluşturacaklar. Analitik bir veritabanıyla, yalnızca öğreticileri takip etmeyi değil, yüksek kaliteli görevleri kendiniz tamamlamayı unutmayın. İsterseniz algoritmayı sıfırdan kullanmak için Numpy'yi kullanmayı deneyin, ancak bu herkes için zorunlu değildir.

3. Programlama ne olacak?

Kaynak: Pexels

Evet, veri bilimi programlama becerileri olmadan yapamaz. Bir iş bulursanız ancak kod yazmayı bilmiyorsanız, büyük olasılıkla ne yapmanız gerektiğini biliyorsunuz, ancak nereden başlayacağınızı bilmiyorsunuzdur. Ayrıca SOCPS (kod yazmayı bilmeden Stack Overfow web sitesinden kopyalayıp yapıştırma sendromu) yaşayabilirsiniz. ) Soru ve cevaplara bakmadan bile.

İnternette daha iyi çözümler aramak mümkündür, ancak temel bir planı nasıl yazacağınızı kendiniz bilmelisiniz.

Daha önce hiç yazmadıysanız, erken yaşlardan başlayıp Python veya R ve bunun veri bilimindeki rolü hakkında kitaplar okuyabilir, önce kapsamlı bir anlayışa sahip olabilir ve ardından dilbilgisini derinlemesine öğrenebilirsiniz. Her şeyi ezberleme konusunda endişelenmeyin, zorluklarla karşılaştığınızda hangi yöne baktığınızdan emin olabilirsiniz.

İlgili kitapları okuduysanız veya programlama dersleri aldıysanız ve grameri anladıysanız, ancak problemi nasıl çözeceğinizi bilmiyorsanız, algoritmaları ve veri yapılarını öğrenmek için biraz zaman ayırın. Aynı zamanda, bazı düzenli kodlama sorusu röportajlarını izleyin, bunlar sizi "fikirlerle dolu" hale getirecektir.

Programlama becerilerinizden memnun musunuz? Bu harika! Şimdi analiz kitaplıkları - Numpy ve Pandas kitaplıkları için zaman ayırın.

Herkes kodlama için farklı zaman harcıyor. Acemi Xiaobai, yalnızca kütüphane bilgisine ihtiyaç duyan birinden farklıdır. Hiç anlamayanlar için 3-4 ay yeterli olduğu söylenebilir.Sadece kütüphane bilgisini öğrenmesi gereken kişiler için yaklaşık 1 ay yeterlidir.

4. Matematik becerilerini geliştirin

Veri biliminin önce mükemmel matematik becerileri gerektirdiğini duymuş olmalısınız. Anlaşılması gereken matematik bilgisi iş pozisyonuna göre değişir.Başlamak için ne kadar ustalaşmanız gerektiğine gelince, yazarın verdiği cevap: sandığınız kadar değil.

Onları tek tek anlatayım. Yeni başlayanlar, hesaplamalar, doğrusal cebir, olasılık hesaplamaları veya istatistikler gibi herhangi bir ilgili alanda uzmanlaşmaya çalışacaklar, ancak bunu kabul etmek zorundalar.

Beni yanlış anlamayın, vaktiniz varsa yukarıda belirtilen alanlarda uzmanlaşın, aksi halde zaman kaybetmeyin. Alana yeni giren bir genç veri bilimcisi olarak, sadece matematiği değil, aynı zamanda sezgisel olarak da anlamalısınız. Belirli bir durumda ne yapılacağını bilmek için, sezginin devreye girdiği an budur, ancak karmaşık matematik problemlerini çözmek için çok fazla zaman harcamanıza gerek yoktur.

Güçlü bir anlayışınız olduğu ve nasıl kodlanacağını anladığınız sürece, bu yeterlidir. Bir iş bulduktan sonra, matematik okumak için çok zamanınız olacak, bu yüzden her şeyi önceden öğrenmenize gerek yok.

Matematikte bir temeliniz yoksa matematik becerilerinizi geliştirmek için 2-3 ay harcamanız önerilmez.

Kaynak: Pexels

sıradaki ne?

2020'nin geri kalan aylarında bir GitHub hesabı (a) oluşturun, en iyi analiz raporunu veya makine öğrenimi algoritmasını koyun ve potansiyel işverenlere sağlayın. Aynı zamanda güzel bir özgeçmiş ve ön yazı hazırlayın.

Gerçekten beğendiyseniz, öğrenme yolculuğunuz hakkında bir blog yayınlayın. Çevrimiçi sunum, işe yaramaz mesajlar göndermemeniz koşuluyla, kariyer gelişiminizde size yardımcı olacaktır, ancak kararınıza güveniyorum.

İşte bu, acele edin ve özgeçmişinizi ideal şirketinize gönderin.

Yorum Beğen Takip Et

Yapay zeka öğrenme ve geliştirmenin kuru mallarını paylaşalım

Yeniden yazdırıyorsanız, lütfen arka planda bir mesaj bırakın ve yeniden yazdırma şartnamelerine uyun

Geliştirici görmeli! KISS, DRY ve izlenecek kodlama ilkeleri
önceki
Bugün Core Voice | "Zorlu" Salgın Önleme! Sakinler topluluğa girmek için 5 metre uzunluğundaki bir dezenfeksiyon kanalından geçmelidir.
Sonraki
Çin Tüketiciler Derneği, kişisel mülkiyet güvenliğini ve kişisel gizliliği korumak için Bahar Festivali sırasında tüketime yönelik yedi ipucu yayınladı
Yaşamın geçişini açmak için ülke çapında bir çaba gösterildi ve birçok yerde itfaiye departmanları, itfaiye aracı geçitlerini işgal etmenin gizli tehlikelerini araştırdı.
Yeni Zelanda'nın Kuzey Adası'nda orman yangını çıktı
Çin Yeni Yılı Kültür Merkezi ücretsiz olarak açılarak size Yeni Yılı tattırıyor
Salgının altındaki üç zihniyet uykusuzluğa neden olabilir mi? Uzman: Bu, güvensizlikle ilgili
Guangzhou'dan trenle 29 işe dönüş bugün Hubei'ye gidiyor! 541 kurumsal çalışanı noktadan noktaya toplayın
Kurumsal yanıt verenlerin% 70'inden fazlası gelecekteki işlerine güveniyor ve sağlık sektörü en çok güven duyuyor
İtalya'nın en çok etkilenen bölgesinde Çinli bir adam duvara bir maske asarak komşulara dağıttı ama kızın kalbini aldı
58 gün boyunca Hubei'de "engellendikten" sonra, çok sayıda "kontrol noktasından" geçtim ve sonunda Guangzhou'daki evime döndüm.
Hankou Hastanesinde Nirvana: 50'den fazla hastane ve 3 hastane enfekte oldu ve Guangdong sağlık ekibi 54 gün boyunca görevi devraldı
Alman okul tatilleri, çılgın çocuklar çılgınca oynuyor, 500.000 hastane yatağı yeni tacın etkisine dayanabilir mi?
Hollanda salgın nedeniyle isteksizce milyonlarca lale ve gülü yok etti: çiçek almak ve daha az tuvalet kağıdı çalmak için yalvarmak
To Top