Veri bilimcisi ile veri mühendisi arasındaki fark nedir?

Makine zekası alanının sürekli gelişimi ile yeni roller ortaya çıkmaya devam ediyor ve mevcut roller genişlemeye devam ediyor. Birçok kişi veri bilimcileri ve veri mühendisleri arasındaki farkı net bir şekilde anlamıyor. Bu makaleler, bu iki farklı kariyer yolu için gerekli olan belirli becerileri açıklamaktadır.

Aşağıdakiler, veri bilimcileri ve veri mühendislerinin temel yetkinliklerinden ve örtüşen alanlarından bazılarıdır:

Veri bilimcisi-matematik ve istatistik, bilgisayar bilimi, makine öğrenimi ve yapay zeka / derin öğrenme, verilerle gelişmiş analiz ve hikaye anlatımı.

Veri mühendisi-üretim düzeyinde programlama, dağıtılmış sistemler, veri dönüştürme, veri analizi ve veri hatları.

Örtüşen alanlar-veri analizi ve programlama.

Farklılaştıran faktörleri daha iyi anlamak için bu alanlara dalalım.

Veri bilimcilerinin ihtiyaç duyduğu beceriler

Veri bilimcileri genellikle uygulamalı matematik ve / veya istatistik ve bilgisayar bilimi alanlarında bir geçmişe sahiptir. Makine öğrenimi, istatistiksel öğrenmenin matematiksel temeline dayanır. Matematik bilgisi olmadan, veri biliminde mükemmel sonuçlar elde etmeye çalışsanız bile, tam bir bakış açısına sahip olmak zordur.

Veri bilimcilerin ayrıca gerekli içgörüleri geliştirmek için iş alanı uzmanlarıyla etkileşime girmesi gerekir. Veri bilimcilerin ayrıca, şirketlerin veri varlıklarını kullanmalarına yardımcı olmak için verileri analiz etmeleri (keşifsel veri analizi) gerekir.

Veri bilimciler ayrıca uygun makine öğrenimi algoritmalarını seçmek, onları eğitmek ve doğruluklarını test etmek için yöntemler tasarlamak için arka plana sahip olacaklar.

Buna ek olarak, bir veri bilimi projesinin sonuçlarının iş paydaşlarına anlaşılır bir şekilde iletilmesi gerektiğinde, veri bilimcilerin hikayeleri anlatmak için verileri kullanma sanatında yetkin olmaları gerekir. Bu çalışma, karmaşık sonuçları ve gözlemleri, paydaşların anlayabileceği ve eyleme geçebileceği şekilde sözlü ve görsel olarak iletebilmelidir.

Veri bilimcileri, çoğu R veya Python'da olan kodlama becerilerini de geliştirmelidir. Veri bilimcilerin programlama becerileri genellikle veri mühendislerinin seviyesinin üzerinde değildir - onlar da olmamalıdır!

Veri mühendislerinin ihtiyaç duyduğu beceriler

Veri mühendisleri genellikle bilgisayar bilimi alanında bir dereceye sahiptir. Geçmişleri genellikle Python, Java veya Scala gibi dillerdedir. Odak noktaları dağıtılmış sistemler ve büyük veridir. Veri bilimcilerle karşılaştırıldığında, programlama becerileri daha ileri düzeydedir ve özellikle yüksek kullanılabilirliğe sahip üretim sistemleri oluşturmak için uygundurlar.

Bu programlama becerilerini kullanarak, veri mühendisleri büyük ölçekte veri ardışık düzenleri oluşturabilir. Bu, çok sayıda büyük veri teknolojisinin entegre edilmesini içerir. Veri mühendisinin görevi, iş için hangi araçların uygun olduğuna karar vermektir. Veri mühendisleri ayrıca veri teknolojileri ve çerçeveleri ve bunların veri ardışık düzenleriyle nasıl entegre edileceği konusunda derin bir anlayışa sahiptir. Ek olarak, veri mühendisleri kümeler, DevOps ve DataOps'tan sorumlu olanlarla yakın çalışır.

Veri mühendisleri, üretim ortamı için veri bilimcileri tarafından seçilen makine öğrenimi algoritmalarını da uygular. Örneğin, bu, veri bilimcileri tarafından kullanılan R'deki sınıflandırma algoritmalarını daha güçlü bir üretim platformuna dağıtmayı içerebilir.

Örtüşen beceriler

Veri mühendislerinin programlama becerileri genellikle veri bilimcilerinin becerilerini aşsa da, tabii ki, programlama konusunda birbiriyle örtüşen becerilere sahiptir. Örneğin, bir veri hattı üretmek için bir veri bilimcisi planına sahip olmak aşırı genişleyebilir ve bu görev doğrudan veri mühendisinin çalışması kapsamındadır. Burada, becerileri birbirini tamamlayıcı niteliktedir çünkü veri bilimcileri veri ardışık düzenleri tasarlayabilir ve veri mühendisleri bunları programlayıp bakımını yapacaktır. Veri bilimcilerinden genellikle veri ardışık düzenlerini programlamaları beklenmemelidir.

Diğer bir örtüşme alanı da veri analizidir. Veri bilimcilerinin analitik becerileri genellikle veri mühendislerininkinden daha fazla gelişmiştir. Veri mühendisleri bazı temel analizleri gerçekleştirebilir, ancak veri bilimcilerin kolayca yapabileceği daha gelişmiş analiz ihtiyaçlarını karşılayamazlar.

İşletmede dislokasyon

Birçok şirket, yukarıda belirtilen beceri setlerini gerçek iş unvanlarıyla eşleştirirken hata yapar. Her şeyden önce, iki şeyi tek başına yapabilen birini bulmaya çalışmanın sonsuz döngüsüne düşmeyin, veri bilimcisi ve veri mühendisinin işini tamamlamasını beklemeyin. Elbette bazı tek boynuzlu atlar olabilir, ancak talepleri çok yüksek ve maaşları da yüksek. Ayrıca, kiraladığınız tek boynuzlu at ayrılmaya karar verirse ne olur?

Diğer bir hata, veri bilimcisinin veri mühendisinin işini yapmasına izin vermektir. Bir veri hattı oluşturmak kolay değildir, üretim programlama çerçevesi hakkında ileri düzeyde bilgi gerektirir. Veri bilimciler bu becerileri edinebilir, ancak bu, bu kaynağın en etkili kullanımı değildir. Veri bilimcileri, üretim sistemleri kuran, veri ardışık düzenleri oluşturan ve makine öğreniminin sonuçlarını ortaya çıkaran mühendisler değildir.

Öte yandan, bir veri mühendisinin bir veri bilimcisinin işini tamamlaması, çok yaygın olmasa da bir hatadır. Bazı veri mühendisleri, matematiksel ve istatistiksel bilgilerini ve buna karşılık gelen makine öğrenimi becerilerini geliştirerek becerilerini genişletir. Bu kariyer yolu bazen başka bir kariyer kategorisi, yani "makine öğrenimi mühendisi" üretir.

Makine öğrenimi mühendisleri genellikle bir veri mühendisliği geçmişinden gelirler, ancak veri biliminin belirli yönlerinde zaten yetkinler ve veri bilimi ile veri mühendisliği arasında gidip geliyorlar. Bu kategori gerçekten bir tek boynuzlu at değil, makine öğreniminin nasıl çalıştırılacağını ve optimize edileceğini anlayan bir veri mühendisidir. Makine öğrenimi mühendisleri, veri bilimcileri tarafından oluşturulan içeriği alır ve ürünlerini hazır hale getirir.

Becerilerimi nasıl geliştirebilirim?

ODSC East 2019, bu iki alanda birden fazla yolu kapsayan eksiksiz bir odak alanına sahiptir. İster veri bilimcisi ister veri mühendisi olun, ODSC seminerleri, dersleri ve eğitim kursları veri bilimi uzmanları için idealdir! Veri bilimi ve veri mühendisliğinin aşağıdaki temel alanlarında bazı olağanüstü konferanslar:

Veri bilimci

Verilerle Programlama: Python ve Pandalar

Veri Bilimciler için Nedensel Çıkarım

https://odsc.com/training/portfolio/causal-inference-for-data-scientists?utm_campaign=ODSC20Eastutm_source=KDNutm_medium=DSvDEBlog

Üretimde Salesforce Ölçekli Makine Öğrenimi Sağlama

Shiny'de Orta Seviye RMarkdown

https://odsc.com/training/portfolio/intermediate-rmarkdown-in-shiny?utm_campaign=ODSC20Eastutm_source=KDNutm_medium=DSvDEBlog

Tidyverse modelleme

Tensorflow 2.0 ve Keras: Yenilikler, Paylaşılanlar, Farklı Olanlar

https://odsc.com/training/portfolio/pre-trained-models-transfer-learning-and-advanced-keras-features?utm_campaign=ODSC20Eastutm_source=KDNutm_medium=DSvDEBlog

Gerçek Dünya için Taklit Öğrenme-Pekiştirmeli Öğrenme

Bootstrap Bozulduğunda

https://odsc.com/training/portfolio/when-the-bootstrap-breaks?utm_campaign=ODSC20Eastutm_source=KDNutm_medium=DSvDEBlog

Python, R ve SAS Kullanarak Öneri Motorları ve Derin Öğrenme Modelleri Oluşturma

AI Uygulamalarını Ray ile Ölçeklendirme

https://odsc.com/training/portfolio/scaling-ai-applications-with-ray-2?utm_campaign=ODSC20Eastutm_source=KDNutm_medium=DSvDEBlog

Veri mühendisi

Verilerle Programlama: Python ve Pandalar

https://odsc.com/training/portfolio/programming-with-data-python-and-pandas?utm_campaign=ODSC20Eastutm_source=KDNutm_medium=DSvDEBlog

Veri Bilimi için Mühendislik

Üretimde Salesforce Ölçekli Makine Öğrenimi Sağlama

https://odsc.com/training/portfolio/title-coming-soon-18?utm_campaign=ODSC20Eastutm_source=KDNutm_medium=DSvDEBlog

Orbyter Kullanarak Tekrarlanabilir Veri Bilimi

https://odsc.com/training/portfolio/reproducible-data-science-using-orbyter?utm_campaign=ODSC20Eastutm_source=KDNutm_medium=DSvDEBlog

Tidyverse modelleme

https://odsc.com/training/portfolio/modeling-in-the-tidyverse?utm_campaign=ODSC20Eastutm_source=KDNutm_medium=DSvDEBlog

Spark Yapılandırılmış Akış ile Gerçek Zamanlı Tahmine Dayalı Analitik

https://odsc.com/training/portfolio/real-ish-time-predictive-analytics-with-spark-structured-streaming?utm_campaign=ODSC20Eastutm_source=KDNutm_medium=DSvDEBlog

Gerçek Dünya için Taklit Öğrenme-Pekiştirmeli Öğrenme

https://odsc.com/training/portfolio/title-coming-soon-20?utm_campaign=ODSC20Eastutm_source=KDNutm_medium=DSvDEBlog

Veri Bilimi Yapmak: AIG, Amazon, Albertsons

https://odsc.com/training/portfolio/title-coming-soon-11?utm_campaign=ODSC20Eastutm_source=KDNutm_medium=DSvDEBlog

Python, R ve SAS Kullanarak Öneri Motorları ve Derin Öğrenme Modelleri Oluşturma

https://odsc.com/training/portfolio/building-recommendation-engines-and-deep-learning-models-using-python-r-and-sas-3?utm_campaign=ODSC20Eastutm_source=KDNutm_medium=DSvDEBlog

Hayneedle'de Görsel Arama

https://odsc.com/training/portfolio/visual-search-on-hayneedle?utm_campaign=ODSC20Eastutm_source=KDNutm_medium=DSvDEBlog

Kısacası, veri bilimcilerin ve veri mühendislerinin birbirini nasıl tamamladığını anlamak önemlidir. Yetenekli bir veri bilimi ekibi iki beceriden oluşur. Veri bilimcilerinin veri mühendislerinin işini yapmasına izin vermek, iyi kaynak israfıdır ve bunun tersi de geçerlidir. Hem yetenekli bir veri mühendisi hem de uzman bir veri bilimcisi olan bir tek boynuzlu at bulmanız çok zor. Bu nedenle, her üyenin diğerlerinin becerilerini tamamlayabileceği ve birlikte iyi çalışabileceği bir ekip kurmanız gerekir.

Bu operasyon nedir? Petya fidye yazılımı fidyesi 250.000 ABD Dolarına yükseldi!
önceki
SSD sabit sürücülerin fiyatı düştü ve şimdi işlerin yeniden yavaşlaması gerektiği görülüyor!
Sonraki
Samsung S10 Sanayi ve Bilgi Teknolojileri Bakanlığı sık sık yabancı medyaya maruz kaldı, netizenler gerçek makine kullanıldıktan sonra buna inanmadı
Yüksek Sesle Haber | Çin'in futbol endüstrisi, tam sermaye penetrasyonu hala "kapıyı durdurmaktan" yetersiz
Haftalık görüşmeler | Çin takımı Dünya Kupası'na da "katılabilir" CES fuarı teknoloji şirketleri için sadece bir sahne değil
Ele.me.com'un birleşme sonrası mücadele etkinliği Hisse fiyatı düşen Meituan gerçekten tutabilir mi?
Kod ayrıntıları: inanılmaz doğruluk! Kredi R ile bir kredi riski puanlama modeli oluşturun
İpuçları | Bitiremiyorsanız, karpuzu buzdolabına koymayın! Bu yöntemle iki gün fena değil
10 yıl sonra Android 1.6 ile HTC G1'i yeniden deneyimlemek: utanç özellikli telefona indirgenmiş
Sahte haberleri gizlemek ister misiniz? Test etmek için bu üçlü ilişkiyi kullanın
Toshiba'nın ilk QLC flash belleğinin kullanım ömrü TLC ile karşılaştırılabilir!
Mahathir, Alibaba'nın küreselleşme konseptine övgüde bulundu, Malezyalı netizenler Taobao Alipay'i kullanmak için bağırdı
Çin'de ilk! OnePlus, Android 9.0'ın kararlı sürümünü yayınlayan ilk kişi. Yükseltme yaptınız mı?
Beklenmedik bir şekilde, Sony kendi mobil işlemcisini yapmak zorunda!
To Top