Veri Bilimcisi Bilgi Grafiği

Verinin her şeyi yönlendirdiği bir çağda yaşıyoruz Veri madenciliği ve veri analizi bu çağın "altına hücumudur" Ülkeler, şirketler, kuruluşlar ve bireyler kesinlikle çeşitli verilere dikkat edecek ve bu verilerden değer alacak.

Bu nedenle veri analizi yetenekleri popüler hale geldi.Bir veri analisti, veri analiz mühendisi, veri ürün yöneticisi veya hatta bir veri bilimcisi olsun, giderek daha popüler hale geliyorlar.Bunu yapmaya hazır mısınız? Bu alandaki hazırlıklar hakkında bilgi edinin?

Veri biliminin çeşitli alanlarında yaygın olarak kullanılan dillere bir göz atalım.

Python ve R arasındaki anlaşmazlık temelde sona erdi ve Python baskın oyuncu haline geldi

R ve Python arasında veri bilimi için tercih edilen dilin hangi dil olduğu konusunda bir tartışma olmuştur. Açıkçası, piyasa talebi bize Python artık lider . Bu nedenle, veri bilimi alanına girmeyi düşünüyorsanız, öğrenmenizi Python'a odaklamayı düşünün. Veritabanının dili olan SQL, veri bilimcileri için en önemli ikinci dildir. Veri bilimcilerin çok çeşitli meslekleri nedeniyle, diğer diller de önemli bir rol oynamaktadır.

[Özet] Veri bilimcilerin ana dilleri şunlardır: Python, SQL, Scala, Lua, Java, SAS, R, C ++ ve Matlab.

Veri mühendisi olmak istiyorsanız, SQL kesinlikle gereklidir

Veri mühendisleri her zaman veri ve veritabanları ile uğraşırlar.SQL veritabanı dilidir, bu nedenle SQL'in tercih edilen dil olduğuna şüphe yoktur.

[Özet] Veri mühendislerinin ana dilleri: SQL, Scala, Java, Python ve Lua'dır.

Scala, veri bilimindeki en önemli ikinci dildir (R değil)

Farklı rollerin dil tercihlerine baktığımızda ilginç bir şey bulduk: Scala her zaman ikinci veya üçüncü sırada. Dolayısıyla, veri bilimindeki ilk üç dilin Python, SQL ve Scala . Yeni bir dil öğrenmeyi düşünüyorsanız, lütfen Scala kullanmayı düşünün!

Makine öğrenimi mühendislerinin ihtiyaç duyduğu dil daha çeşitlidir

Makine öğreniminin gerçek dili olarak, Python Makine öğrenimi mühendisi olarak seçildi Tercih edilen dil Şaşırtıcı değil. Algoritmaları sıfırdan gerçekleştirmek ve ML modellerini bir büyük veri ortamında dağıtmak, C ++ ve Scala ve diğer ilgili dilleri de önemli hale getirir. Genel olarak, diğer iki rolle karşılaştırıldığında, makine öğrenimi mühendislerinin programlama dillerine olan ihtiyaçları daha dağınık görünüyor.

[Özet] Makine öğrenimi mühendislerinin ana dilleri şunlardır: Python, Scala, Java, C ++, Lua, SQL, Javascript, Matlab, CSS ve C #.

Dili okuduktan sonra, veri bilimi alanında yaygın olarak kullanılan büyük veri çerçevelerine bir göz atalım.

Veri mühendisleri dışındaki roller için Spark, büyük veri becerileri için ilk tercihtir

Yalnızca veri mühendisleri için, Hadoop'un Spark'tan daha fazlasına ihtiyacı var, ancak genel olarak, Spark kesinlikle ilk öğrenilmesi gereken büyük veri çerçevesidir. Cassandra mühendisler için bilim adamlarından daha önemlidir ve Storm yalnızca veri mühendisleriyle alakalı görünüyor.

[Özet] Veri bilimi için tercih edilen büyük veri teknolojileri: Spark, Hadoop, Kafka, Hive.

TensorFlow derin öğrenmenin kralıdır

Veri mühendisi iş ilanında neredeyse hiçbir derin öğrenme çerçevesi belirtilmedi, bu nedenle rol bu beceriyi gerektirmiyor gibi görünüyor. Makine öğrenimi mühendisleri en çok DL (Derin Öğrenme) çerçevesinden bahsetti ve bu da ML (Makine Öğrenimi) mühendislerinin yalnızca model dağıtımı değil, çok sayıda makine öğrenimi modellemesi yaptığını gösteriyor.

Ek olarak, TensorFlow kesinlikle derin öğrenme alanına hakimdir . Keras, gelişmiş bir derin öğrenme çerçevesi olarak veri bilimcileri arasında çok popüler olmasına rağmen, makine öğrenimi mühendisinin rolüyle neredeyse hiçbir ilgisi yoktur, bu da çoğu makine öğrenimi uygulayıcısının TensorFlow gibi daha düşük seviyeli çerçeveleri kullandığını gösterir.

[Özet] Veri bilimindeki en önemli derin öğrenme çerçeveleri şunlardır: TensorFlow, Torch, Caffee ve MXNet.

AWS yaygın olarak hakim

Görselleştirme için Tableau bir zorunluluktur

Görselleştirme araçlarına esas olarak veri bilimcileri tarafından ihtiyaç duyulur ve veri mühendisleri ve makine öğrenimi mühendislerinin pozisyonlarında nadiren bahsedilir. fakat, Tableau, tüm roller için ilk tercihtir . Veri bilimcileri için Shiny, Matplotlib, ggplot ve Seaborn da eşit derecede önemli görünüyor.

Git her uygulayıcı için önemlidir, Docker'a ise yalnızca bazı mühendisler ihtiyaç duyar

Daha sonra, her rol için en sık kullanılan anahtar kelimeleri keşfetmek için kelime bulutu kullanıyoruz ve tüm veri bilimi rolleri için ideal bir portre oluşturmak için ilgili becerileri birleştiriyoruz!

Küçük sarı araba nihayet olumlu yanıt verdi: Kayıt kuyruğu geri ödeme için ve 6 milyona sıraya alındı
önceki
"Öneri Algoritması Uygulaması" Müzik Çalma Listesi Akıllı Öneri
Sonraki
Bu çizgi roman dizisini okuduktan sonra, güvenilir bir yama panelini nasıl seçeceğinizi öğreneceksiniz!
Fetion dirildi mi? China Mobile, yalnızca veri göndermekle kalmayan, aynı zamanda ücretsiz aramalar da yapan Hefeixin'i piyasaya sürdü
Yazın en eğlenceli oyun hangisi? Gelin ve küçük aslan Lisesi oyun önerisini görün ~
Bugünün "Satın Al, Satın Al, Satın Al, Yaz Tatili" önerisi harika bir görünüme sahip, sevdiğiniz biri olmalı
Alipay, QR kodunu tarayarak altın yumurtalar alabilir ve taze yumurtaları kullanabilir. Şehriniz var mı?
Bir kaçış üçlemesi, acıyı senden uzak tut
IQIYI arama sıralama modeli yineleme yolu
Alipay UnionPay Cloud QuickPass için yeterince kırmızı paket almadınız mı? JD.com'un anlayacağı başka bir refah dalgası var
İPhone 8'in ilk 360 derecelik görünümü yayınlandı: tasarım artık merak uyandırmıyor!
Huawei'nin sırrı: 5G ve 700 milyar
Ali öneri motorunun kullanımının özeti
Google Store'dan indirin, yabancı sunuculardaki oyunları hızlandırın, tek ihtiyacınız olan bu
To Top