İyi bir veri bilimcisi, acilen güçlendirmek için hangi teknik becerilere ihtiyacınız var?

Tam metin 3387 Kelimeler, tahmini öğrenme süresi 10 dakika

Kaynak: Unsplash

Arenadaki insanlar genel olarak hayatta kalmaya elverişli bir beceriye sahiptir.

Veri bilimcileri için, çok sayıda makine öğrenimi, bilgisayar bilimi, istatistik, matematik, veri görselleştirme, iletişim ve derin öğrenmeyi biliyor gibi görünüyorlar. Peki veri bilimcilerinin gerçekten ihtiyaç duyduğu teknolojiler ve beceriler nelerdir?

En yaygın becerileri bulmak için birçok iş listesi ve anket okudum.

Daha önce istatistik ve bilgi becerilerine olan ihtiyacın yanı sıra Python ve R teknolojisine olan ihtiyacı araştırmıştım.

Yazılım teknolojisi değişiklikleri genel beceri gereksinimlerinden daha hızlı olmalıdır, bu nedenle bu makaledeki analiz sadece teknik kısmı içerir.

SimplyHired, Indeed, Monster ve LinkedIn'i araştırdım ve "veri bilimcisi" ile iş listesinde hangi anahtar kelimelerin görüneceğini bulmaya çalıştım.

Bu sefer el ile aramak yerine iş listesini aramak için kod yazmaya karar verdim. Bu çaba SimplyHired ve Monster için gerçekten etkilidir.İstekler ve Güzel Çorba Python kitaplıklarını kullanabilirim.

LinkedIn'de aramanın daha da zor olduğu ortaya çıktı. İş ilanlarının doğru sayısını görebilmeniz için kimliğinizi doğrulamanız gerekir. Bilgisiz tarama için Selenium kullanmaya karar verdim. Eylül 2019'da ABD Yüksek Mahkemesi, LinkedIn ile ilgili bir davaya karar vererek LinkedIn'deki verilerin silinmesine izin verdi. Ancak, birkaç arama denemesinden sonra hesaba hala erişemiyorum. Bu sorun, hız sınırlamasından kaynaklanıyor olabilir. Erişmeye devam etmek istiyorum, ancak tekrar denersem hesabımın kilitleneceğinden endişeleniyorum.

Değeri açısından Microsoft LinkedIn'i, Randstad Holding Monster'ı ve Recruit Holdings, Indeed ve SimplyHired'ı satın aldı.

Her halükarda, geçen yıldan bu yıla kadar LinkedIn verileri benzer karşılaştırmalar sağlamayabilir. Bu yazdan bu yana her hafta LinkedIn'in bazı teknik işler için arama terimlerinin büyük ölçüde dalgalandığını fark ettim. Sanırım amacı değerlendirmek ve arama sonucu algoritmaları ile deney yapmak için doğal dil işlemeyi kullanabilirler.

Her iş sitesi için, sitesinde görünen anahtar kelimelerle veri bilimcisi iş ilanlarının toplam sayısının yüzdesini hesapladım. Ardından, üç web sitesindeki her bir anahtar kelimenin ortalama yüzdesini hesaplayın.

Yeni arama terimlerini manuel olarak araştırdım ve potansiyeli varmış gibi görünenleri çıkardım. 2019 yılında yeni terim, aşağıdaki sonuçlarda kullandığım kritik değer olan listenin% 5'ine ulaşmadı.

Sonucu görelim!

sonuç

Her bir anahtar kelimenin sonuçlarını görüntülemenin en az dört yolu vardır:

1. Her iş sitesi, anahtar kelimeli giriş sayısını veri bilimcilerini içeren toplam arama terimi sayısına böler. Ardından üç sitenin ortalamasını alın. Bu, yukarıdaki süreçtir.

2. Yukarıdaki ilk maddeyi tamamladıktan sonra, listenin 2018'den 2019'a ortalama yüzde değişimini hesaplayın.

3. Yukarıdaki ilk maddeyi tamamladıktan sonra, listenin 2018'den 2019'a ortalama yüzde değişim oranını hesaplayın.

4. Yukarıdaki ilk öğeyi tamamladıktan sonra, her bir anahtar kelimenin yıl içindeki diğer anahtar kelimelere göre sıralamasını hesaplayın. Ardından yıllık sıralama değişikliğini hesaplayın.

Sütun grafiğin ilk üç seçeneğine birlikte bakalım, ardından verileri içeren bir tablo gösterelim ve sonuçları tartışalım.

Aşağıdakiler, Python'un toplam listenin yaklaşık% 75'ini oluşturduğunu gösteren yukarıdaki ilk 2019 çizelgesidir.

Aşağıda, listenin ortalama yüzdesinin 2018 ile 2019 yılları arasında artışını ve düşüşünü gösteren yukarıdaki ikinci madde için bir grafik bulunmaktadır. AWS, 2019 listesinde ortalama% 19,4 ve 2018 listesinde% 14,6 ile% 5 büyüdü.

Aşağıda, yukarıdaki üçüncü madde için yıllık yüzde değişimini gösteren bir grafik bulunmaktadır. 2018 listesinin ortalama yüzdesi ile karşılaştırıldığında PyTorch% 108,1 arttı.

Grafiklerin tamamı Plotly tarafından yapılmıştır.

Aşağıda, 2018'den 2019'a kadar ortalama liste sayısının yüzde değişim oranına göre sıralanmış, yalnızca tablo biçiminde sunulan yukarıdaki grafikteki bilgiler yer almaktadır.

Bu farklı ölçümlerin kafa karıştırıcı olabileceğini düşünüyorum, bu nedenle aşağıdaki tablo yukarıdaki tablo için bir kılavuzdur.

"2018 Ort.", 10 Ekim 2018'den itibaren SimplyHired, Indeed ve Monster iş ilanlarının ortalama yüzdesini ifade eder.

4 Aralık 2019 haricinde, 2019 Ort. 2018 Ort. İle aynıdır. Bu veriler yukarıdaki üç çizelgeden ilkinde gösterilmektedir.

"Ort. Değişim", 2019 sütunundaki veriler eksi ikinci tabloda gösterilen 2018 sütunundaki verileri ifade eder.

"Değişim Yüzdesi", üçüncü grafikte gösterilen 2018'den 2019'a değişim yüzdesini ifade eder.

"2018 Sıralaması", 2018'deki diğer anahtar kelimelere göre sıralamayı ifade eder.

"2019Rank", 2019'daki diğer anahtar kelimelerin sıralamasını ifade eder.

"RankChange", sıralamanın 2019'dan 2018'e yükselişini ve düşüşünü ifade eder.

sonuç olarak

14 aydan kısa bir süre içinde bazı önemli değişiklikler meydana geldi.

kazanan

Python hala ön plandadır ve şu anda en sık görülen anahtar kelimedir. Neredeyse dörtte üçü oran. Python 2018'den beri iyi bir büyüme kaydetti.

SQL yükselişte, neredeyse R'yi geçerek ikinci en yüksek ortalama puanı alıyor. Trend devam ederse, yakında ikinci sırada yer alacaktır.

En iyi derin öğrenme çerçeveleri giderek daha popüler hale geliyor. PyTorch, tüm anahtar kelimeler arasında en büyük artışa sahiptir. Keras ve TensorFlow'un da büyük faydaları vardır. Keras ve PyTorch'un sıralamaları 4 sıra yükseldi ve TensorFlow 3 sıra yükseldi. PyTorch'un başlangıç ortalamasının düşük olduğunu, ancak TensorFlow ortalamasının hala PyTorch'tan 2 kat daha yüksek olduğunu unutmayın.

Veri bilimcilerin bulut platformu becerilerine yönelik artan bir talebi var. AWS, listenin yaklaşık% 20'sinde, Azure ise listenin yaklaşık% 10'unda yer alıyor. Azure'un sıralaması 4 sıra yükseldi.

İşte hızla gelişen teknolojiler!

ezik

R'deki genel ortalama düşüş en büyüktür. Diğer araştırmaların sonuçları göz önüne alındığında, bu bulgu şaşırtıcı değildir. Python, veri bilimi için tercih edilen dil olarak R'nin yerini açıkça almıştır. Bununla birlikte, R çok popülerdir ve listelerin yaklaşık% 55'inde yer almaktadır. Zaten R'yi biliyorsanız, hayal kırıklığına uğramayın, ancak daha zorlu beceriler edinmek istiyorsanız, Python öğrenmeyi de düşünmelisiniz.

Pig, Hive, Hadoop ve Spark dahil olmak üzere birçok Apache ürününün popülaritesi azaldı. Domuzun sıralaması, diğer teknolojilerin düşüşünden daha büyük olan 5 basamak düştü. Spark ve Hadoop hala yaygın olarak istenen becerilerdir, ancak bulgularım, insanların onlardan uzaklaştığını ve diğer büyük veri teknolojilerine yöneldiğini gösteriyor.

Özel istatistiksel yazılım paketleri MATLAB ve SAS hızla düştü. MATLAB'ın sıralaması dört sıra düştü ve SAS altıncıdan sekizinci sıraya düştü. 2018'deki ortalama yüzdeyle karşılaştırıldığında, her iki dil de düşüş gösterdi.

Önermek

Bu listede birçok teknoloji var. Tabii ki her şeyi anlamanıza gerek yok. Gizemli veri bilimcilere bir sebepten dolayı tek boynuzlu at denir.

Kaynak: Unsplash

Veri bilimi alanına yeni giriyorsanız, yüksek talep gören teknolojileri öğrenmeye odaklanmanızı öneririm. Her seferinde bir teknik öğrenmeye odaklanın.

Aşağıdakiler benim önerdiğim öğrenme yollarıdır:

Genel programlama için Python öğrenin. Bazı temel bilgileri öğrenmek için "Unutulmaz Python" kitabına bakabilirsiniz.

Veri işleme için pandaları öğrenin. Veri bilimci olarak Python kullanan bir kuruluşun, başvuru sahiplerinin pandaları ve Scikit-learn kitaplıklarını anlayacağını umacağını düşünüyorum. Scikit-learn listede görünür, ancak pandalar listede görünmez. Pandaları öğrenirken, görselleştirmeyi öğrenmek için Matplotlib ve NumPy'yi de kullanabilirsiniz.

Makine öğrenimi için Scikit-learn kitaplığını kullanın. Müller ve Guido'nun "Python Makine Öğrenmesine Giriş" kitabını öneriyorum.

İlgili veritabanlarını etkili bir şekilde sorgulamak için SQL öğrenin.

Görselleştirme için Tableau'yu öğrenin. Bu muhtemelen listedeki öğrenilecek en ilginç ve en hızlı tekniktir.

Bulut platformuna uyum sağlayın. Pazar payı nedeniyle AWS iyi bir seçimdir. Microsoft Azure, iyi bir ikinci tercihtir. Daha az popüler olan Google Cloud'u tercih ediyorum çünkü kullanıcı deneyimini ve makine öğrenimi odağını seviyorum.

Derin öğrenme çerçevesini öğrenin. TensorFlow en yüksek talebe sahiptir. Chollet'in "Python Derin Öğrenmesi", Keras'ı ve derin öğrenmenin ilkelerini öğrenmek için iyi bir kaynaktır. Keras şu anda TensorFlow ile yakından ilişkilidir, bu nedenle iyi bir başlangıç noktasıdır. PyTorch da hızla gelişiyor.

Bu benim her zamanki öğrenme önerilerim. Fikirlerinize göre ihtiyaçlarınıza uygun öneriyi seçebilir veya görmezden gelebilirsiniz!

sonuç olarak

Veri bilimcilerinin acilen ihtiyaç duyduğu teknolojiyle ilgili bu eğitimin size yardımcı olacağını umuyorum. Durum buysa, lütfen başkalarının da bulabilmesi için en sevdiğiniz sosyal medyada paylaşın.

Paylaşmak bir tür mutluluktur, umarım herkes mutlu öğrenir!

Yorum Beğen Takip Et

Yapay zeka öğrenme ve geliştirmenin kuru mallarını paylaşalım

Yeniden yazdırıyorsanız, lütfen arka planda bir mesaj bırakın ve yeniden yazdırma şartnamelerine uyun

Rica ederim, öğreticide bulunması zor olan 11 JavaScript numarası, lütfen kabul edin
önceki
Kadın göğüslerini daha çekici hale getirir mi? Plastik cerrahlar sihirlerini göstermek için göz izleme teknolojisini kullanabilir mi?
Sonraki
Tahtaya vurun! (Muhtemelen) bilmediğiniz 4 önemli Numpy işlevi
Bugünün temel sesi | insanlara ait değil! Dünyanın ilk yapay zeka "mucidi" patent başvurusu reddedildi
Her şeyi bırakın ve Açısal 3 nedeni seçin
Python'da nasıl hızlı bir şekilde kullanıcı arayüzü oluşturacağınızı öğrenin, büyük tanrı sizi uçmaya götürecek
"Kel" atış mı? Programcıların çok verimsiz olmasına neden olan 7 alışkanlık
Richard Feynman, güçlü yapay zeka üzerine - makineler insanlar gibi düşünebilir mi?
Bugünün Çekirdek Sesi | Bill Gates'in Yeni Yıl Kararı: Ben ve diğer milyarderler daha fazla vergi öder
Sektörden sorular, JuliaSet Python'un yerini alacak mı?
Yapay zekanın ölümü - neden yapay zeka projeleri defalarca yenilgiye uğradı?
Android geliştirme mühendisinin anlatımı: 2 yıllık geliştirme, 7 deneyimi özetledim
Algoritmaların adilliğini ölçmek neden her zaman zordur?
Bugün Core Voice | Python 2.7 desteği resmi olarak sona erdiriyor: Python 3 burada
To Top