Bir veri bilimciyi mükemmelden harika yapan nedir?

Eser sahibi: Amadeus Magrabi

Çeviri: Chen Zhendong

Düzeltme: Wu Jindi

Bu makale hakkında 2400 kelime 6 dakika okumanız tavsiye edilir.

Veri bilimi endüstrisinin mevcut gelişimi açısından, bu makale en iyi veri bilimcileri için birkaç temel beceriyi özetlemektedir.

Veri bilimi alanındaki işgücü piyasası hızlı bir değişim geçiriyor. Bir zamanlar, makine öğrenimi modelleri oluşturabilmek, yalnızca birkaç üst düzey veri bilimcisinin ustalaşabileceği son teknoloji bir beceri olarak görülüyordu, ancak şimdi, küçük bir temel programlama deneyimine sahip kişiler, öğreticilere dayalı Scikit-learn veya keras model eğitimini tamamlayabilir.

"Yüzyılın en seksi işi" karşısında, sektördeki işe alım görevlileri çok sayıda veri bilimiyle ilgili iş başvurusuyla yüzleşmek zorunda kalıyor ve popülerlik düzeyi şu anda soğuma eğilimi görmüyor. Aynı zamanda, giderek daha fazla veri bilimi İlgili geliştirme araçlarının kullanımı da daha kolay hale geldi. İnsanların veri bilimcilerin bize neler getirebileceklerine dair beklentileri değişti ve giderek daha fazla şirket, makine öğrenimi modellerini eğitmenin veri bilimi alanında başarılı olmak için gereken işin sadece küçük bir parçası olduğunu fark etmeye başladı.

Burada, büyük bir veri bilimcisinin en değerli dört özelliğini sıralıyoruz:

1. İş etkisine odaklanın

Veri bilimcileri için en yaygın itici güçlerden biri, veri modellerini keşfetme merakından kaynaklanmaktadır: veri özelliklerini keşfetmeye odaklanmak, en son teknolojiyi denemek, sistematik testler yapmak ve nihayet yeni keşifler elde etmek. Hepsi veri bilimcilerini heyecanlandırıyor. Bu tür bilimsel motivasyon, bir veri bilimcinin sahip olması gereken şeydir. Ancak tek motivasyon buysa, aynı zamanda sorun olur.

Yalnızca veri düzeyinde kalırsanız, düşünceniz sınırlanır ve sonunda, belirli uygulama senaryolarını ve şirketin daha geniş iş geçmişini göz ardı ederek, veri istatistiklerinin ayrıntılarında kaybolursunuz.

En iyi veri bilimcileri, sonuçlarını şirketin genel işine nasıl entegre edeceklerini ve nihayetinde bunları iş değerine nasıl çevireceklerini bilirler. Basit ve uygulanabilir bir teknoloji varsa, karmaşık teknoloji uygulamasını takip etmek için çok fazla zaman harcamayacaklar; fiilen bir plan oluşturmadan önce, projenin anlamını netleştirecek ve sorunu doğrudan ele alacaklar; tüm ekip için eyleme veya plana odaklanacaklar. İlgili personeli önceden etkileyin ve onlarla iletişim kurun; yeni projeler ve planlar için sonsuz fikirler sunacaklar ve başkalarının gözünde fazla "açık fikirli" olup olmadıklarını önemsemiyorlar; kendi çözümlerine daha fazla yardımcı olacaklar İnsanlar daha ileri teknolojiyi kullanmak yerine gurur duyuyor.

Veri bilimi hala düzensiz bir endüstridir ve akademik eğitim ile endüstri ihtiyaçları arasında büyük nesil bir boşluk vardır. En iyi veri bilimcileri, daha zor sorunlarla yüzleşmek ve etkilerini en üst düzeye çıkarmak için "konfor bölgesinden" çıkmaya korkmuyor.

2. Sağlam yazılım mühendisliği becerileri

Bir veri bilimcisinin ideal imajını hayal ederken, genellikle insanların aklına en iyi üniversitelerde çalışan tanınmış yapay zeka profesörleri gelir. Şirketlerin daha şiddetli rekabetle yüzleşmek için model doğruluğunu iyileştirmeleri gerektiğinde, şüphesiz bu tür yetenekleri dahil etmek akıllıca olacaktır. Çünkü geleneksel yöntemlerin doğruluğunun son birkaç yüzde puanını iyileştirmek için matematiksel yöntemlerin ayrıntılarına dikkat etmek, karmaşık şemaları doğrulamak ve hatta belirli problemler için özelleştirilmiş istatistiksel teknikler geliştirmek gerekir.

Ancak gerçek çalışmada bu tür sahneler çok nadirdir. Çoğu şirket için, standart modelin doğruluğu yeterlidir ve daha sonra modeli en iyi ve en gelişmiş modele optimize etmek için çok fazla zaman ve insan gücü yatırmak o kadar uygun maliyetli değildir. Daha da önemlisi, mümkün olduğunca erken kabul edilebilir doğrulukta bir model oluşturmak ve model ile iş sistemi arasında bir geri bildirim döngüsü oluşturmaktır, böylece model için en iyi kullanım senaryosunu yinelemeye başlayabilir ve hızlı bir şekilde bulabilirsiniz. Doğruluktaki nüanslarla mücadele etmek genellikle bir veri bilimi projesinin başarısının veya başarısızlığının anahtarı değildir, bu nedenle mühendislik becerileri gerçek iş geliştirmede bilimsel becerilerden daha önemlidir.

Genellikle, bir veri ekibinin çalışma süreci şu şekildedir: İlk olarak, veri bilimcisi çözümün bir prototipini oluşturur ve deneme yanılma ve spagetti kodu sağlar (sistematik kodu değil işlev noktalarını kapsar); sonuç iyi görünüyorsa, Kod, bu taslakları ölçeklenebilir, verimli ve bakımı yapılabilir koda yeniden yazacak olan yazılım mühendisine teslim edilecektir. Veri bilimcilerinin, yazılım mühendisleri gibi ürün düzeyinde kod göndermeleri gerekmez, ancak veri bilimcileri yazılım mühendisliğine daha aşinaysa ve ortaya çıkabilecek mimari sorunları anlarsa, tüm proje daha sorunsuz ve daha verimli hale gelecektir.

Giderek daha fazla veri bilimi iş akışı yerini yeni yazılım çerçevelerine bıraktıkça, sağlam yazılım geliştirme becerileri veri bilimcileri için gerekli becerilerden biri haline geldi.

3. İhtiyatlı beklenti yönetimi

Dışarıdan bakıldığında, veri bilimi belirsiz sınırları olan ve anlaşılması zor bir alandır. Bu abartı mı yoksa dünya devrimci değişimlere mi geçiyor? Tüm veri bilimi projeleri makine öğrenimi projeleri midir? Bu insanlar bilim adamı, mühendis veya istatistikçi mi? Ne yaparlar, yazılım ürünleri mi yoksa görsel panolar mı? Modelin bana verdiği sonuç neden yanlış? Biri bu hatayı düzeltebilir mi? Şu anda sadece çok az satır kod verdiler, son birkaç ayda ne yaptılar?

Veri bilimi karşısında, birçok şey çok belirsiz görünüyor ve aynı şirketteki farklı kişilerin veri bilimcilerinden farklı beklentileri var.

Veri bilimcilerinin inisiyatif alması ve işle ilgili personel ile iletişim kurmaya devam etmesi, iş beklentilerini netleştirmesi, yanlış anlamaları bir an önce ortadan kaldırması ve herkesin kendi algısı üzerinde anlaşmaya varması çok önemlidir.

En iyi veri bilimcileri, farklı geçmişlere ve farklı hedeflere sahip insanların farklı iletişim yöntemleri kullandığını anlıyor, çünkü çeşitli faktörler farklı veri bilimi beklentilerine neden olacak. En iyi veri bilimcilerinin, iş hedeflerine ulaşmak için sıfır teknik temeli olan kişilere karmaşık veri işleme yöntemlerini basit ve anlaşılması kolay bir şekilde açıklayabilmeleri gerekir; aşırı iyimser beklentileri ne zaman ortadan kaldıracaklarını ve ne zaman aşırı karamsar ikna edeceklerini bilirler. çalışma arkadaşı. En önemlisi, veri biliminin doğasında var olan deneysel doğasını vurgularlar.Bir projenin başarısı hala belirsiz olduğunda, aşırı taahhütte bulunmazlar.

4. Bulut hizmetlerine aşina

Bulut bilişim, veri bilimi araçlarının temel bir parçasıdır. Çoğu durumda, Jupyter Notebook'u yerel sunucuda çalıştırmak, donanım kaynak sınırına ulaştıktan sonra görevi tamamlamak için hala yeterli değildir. Güçlü bilgi işlem gücüne sahip GPU'larda makine öğrenimi modellerini eğitmeniz gerektiğinde, dağıtılmış kümelerde veri ön işlemeyi paralel hale getirin, makine öğrenimi modellerini yayınlamak için REST API'leri dağıtın, veri kümelerini yönetin ve paylaşın veya büyük ölçekli analiz için bulut veritabanlarını sorgulayın Servis özellikle önemlidir.

Şu anda en büyük bulut hizmeti sağlayıcıları arasında Amazon Bulut Hizmetleri (AWS), Microsoft Azure ve Google Bulut Platformu (GCP) bulunmaktadır.

Hizmetler ve platformlar arasındaki çok sayıda farklılık göz önüne alındığında, bulut hizmet sağlayıcıları tarafından sağlanan hizmetler, veri biliminin tüm yönleri için yeterli değildir. Ancak, ihtiyaç duyduğunuzda nasıl çalıştıklarını anlamak için belgelere göz atabilmeniz için bulut bilişim hakkında temel bir anlayışa sahip olmak önemlidir. En azından bu, daha iyi sorular sormanıza ve arkadaş canlısı veri mühendisleri topluluğu için daha spesifik gereksinimler belirlemenize olanak tanır.

Sonuç

Sıfırdan bir veri bilimi ekibi kurmak isteyen şirketler için, güçlü mühendislik becerilerine ve keskin iş değeri içgörülerine sahip pragmatik problem çözücüler aramalarını tavsiye ederim. İstatistiksel becerilerin avantajları çok fazla değer getirebilir, ancak birçok uygulama senaryosunda, özellikle yaratılışın ilk günlerindeki veri bilimi ekipleri için eskisi kadar önemli değildir.

Ancak şimdilik çoğu şirket, matematik veya fizik alanında doktora gibi güçlü akademik geçmişe sahip veri bilimcilerini işe almayı tercih ediyor. Veri bilimi endüstrisinin son yıllardaki gelişme eğilimi göz önüne alındığında, gelecekte yazılım mühendislerinin veya teknik ürün yöneticilerinin daha büyük bir kısmının veri bilimi rollerine dönüşüp dönüşmeyeceği ilginç bir soru olacaktır.

Orjinal başlık:

İyiyi Büyük Veri Bilimcilerinden Ayıran Nedir?

Orijinal bağlantı:

https://towardsdatascience.com/what-separates-good-from-great-data-scientists-2906431455fd

Çevirmen Profili

Chen Zhendong , Düşük maaş ve şu anda Bank of Beijing'in yazılım geliştirme departmanında çalışan, çekirdek sistemin yapımından sorumlu olan ana yönler arasında müşteri bilgileri (CIF) modelleri, üç parti ödeme işlemleri vb. Yer almakta ve bankanın dağıtık ve bulut bilişimine ana üye olarak katılmaktadır. Platformun yapımı. Finansal veri mimarisi ve istatistiksel analiz yöntemlerini incelemeye meraklıyım ve daha fazla alışveriş yoluyla çalışmalarımı genişletmeyi ve fikirlerimi incelemeyi umuyorum.

- Bitiş -

Tsinghua-Qingdao Veri Bilimi Enstitüsü'nün resmi WeChat kamu platformunu takip edin " THU Veri Pastası "Ve kız kardeş numarası" Veri Pastası THU "Daha fazla ders avantajı ve kaliteli içerik elde edin.

Gece Okuması | En iyi aşk yol boyunca sana sahip olmaktır
önceki
Yetkili YayınTianjin Yerleşim Alanlarında Kısır Köpeklerin Yetiştirilmesinin Yasaklanmasına İlişkin Bildirim
Sonraki
Bin yelkenden geçmek ve 18 yaşındaki Göl Turu'na bir mektup geri döndükten sonra hala genç olmak istiyorum
Alman Çobanlar çok iyi ve sadık Alman çobanları neden şehirlerde "yasak"?
Ağır yağmur Heilongjiang'da 26 yolcu treninin askıya alınmasına neden oldu
Köpeğin sabit sinyali nedir? Köpek sakin bir sinyal gönderdiğinde, aslında size gergin olduğunu söylüyor.
Farklı köpekler nasıl iletişim kurar? Birleşik bir dil var mı? Karşı tarafın yabancı bir dil konuştuğunu düşünüyor musunuz?
10 yıl hapis! Rüşvetten ilk derece "Sekreter Yan" cezası
Naruto: Kırılan 4 büyük numara, Sasuke listeye girdi, sonuncusu hayatını kaybetti
Genel Sekreter Xi Jinping, İç Moğolistan'daki araştırmasının tüm harika anlarını kaydediyor
"Moda + Spor + İnternet Büyük Veri" Çin-Alman Modasının Yeni Modellerini Keşfediyor
Shi Tingmao arka arkaya üç Dünya Şampiyonası kazandı. Bir sonraki dalış kraliçesi mi olacak?
Seattle'da bir kadın yüksek teknoloji çalışanı yüz milyonlarca banka müşterisini etkileyen büyük bilgisayar korsanlığı suçlarına karıştı
Yağmur yağmur Yağmur! Oda, oda boşaltma odası, zorla boşaltma odası!
To Top