LinkedIn'de bir soru var: İyi bir veri bilimcisi ile en iyi veri bilimcisi arasındaki fark nedir?
LinkedIn'deki sorular
Bu soru, hayatın her kesiminden birçok önde gelen veri bilimcisinden yanıt aldı ve neredeyse tüm yanıtlar, en iyi veri bilimcisi olmak için gereken becerileri içeriyordu.
Aslında, iyi bir veri bilimcisi ile en iyi veri bilimcisi arasında bir fark vardır. Bir veri bilimcisi, bu makalede bahsedilen tüm becerilere sahip olamaz. Ancak, en iyi veri bilimcilerini birçok seçkin veri bilimcisinden ayıran işte bu becerilerdir.
Umarım bu makaleyi okuduktan sonra, bir veri bilimcisi olarak kariyerinize yardımcı olur.
Resim kaynağı: pexels.com/@pixabay
Veri bilimcilerinin eğitim düzeyi nispeten yüksektir.Veri bilim adamlarının% 88'i yüksek lisans derecesine ve% 46'sı doktora derecesine sahiptir. Elbette bazı istisnalar olmalı. Veri bilimcisi olmak, gerekli bilgi derinliğini genişletmek için yüksek düzeyde bir eğitim gerektirir. Bir veri bilimcisi olmak için bilgisayar bilimleri, sosyal bilimler, fizik bilimleri ve istatistik alanlarında lisans derecesi alabilirsiniz. En yaygın araştırma alanları matematik ve istatistiktir (% 32), bunu bilgisayar bilimi (% 19) ve mühendislik (% 16) izlemektedir. Bu dereceler size büyük verileri işlemek ve analiz etmek için gereken becerileri verecektir.
Lisans kursunu tamamladıktan sonra bile, öğrenme yolu henüz bitmedi. Aslında, çoğu veri bilimcinin bir yüksek lisans veya doktora derecesi vardır ve ayrıca özel becerileri öğrenmek için Hodoop veya büyük veri sorgularının nasıl kullanılacağı gibi çevrimiçi eğitimlere de katılırlar. Bu nedenle, veri bilimi, matematik, astrofizik veya diğer ilgili alanlarda yüksek lisans derecesi alabilirsiniz. Dereceniz sırasında öğrenilen beceriler, veri bilimi alanına kolayca geçiş yapmanıza yardımcı olacaktır.
Sınıfta öğrenmeye ek olarak, daha fazla bilgiye hakim olmak için bir uygulama oluşturarak, bir blog yazarak veya veri analizini keşfederek sınıfta öğrendiklerinizi de uygulayabilirsiniz.
İşi tamamlayabildiğiniz sürece, yüksek lisans veya doktora derecesi yalnızca isteğe bağlı bir seçenektir. Çoğu sektörde, iş sorunları çözülebildiği sürece, yeni ve son teknoloji makine öğrenimi modellerini araştırmaya ve benimsemeye gerek yoktur.
En az bir analiz aracını derinlemesine anlayın Veri bilimi söz konusu olduğunda, R programlama genellikle ilk tercihtir. R dili, veri biliminin ihtiyaçları için tasarlanmıştır ve veri bilimi alanında karşılaşılan herhangi bir sorunu çözmek için kullanılabilir. Aslında, veri bilimcilerinin% 43'ü istatistiksel problemleri çözmek için R kullanıyor. Bununla birlikte, R programlama için öğrenme eğrisi diktir.
Bir programlama dili konusunda ustalaştıysanız, R dilini öğrenmek zorlaşacaktır. Yine de, İnternette, hevesli veri bilimcileri için harika bir kaynak olan Simplilearn'ın R programlama dili veri bilimi eğitimi gibi, R ile başlamanıza yardımcı olacak birçok kaynak var.
Python, veri bilimindeki en yaygın programlama dilidir ve elbette Java, Perl veya C / C ++ vardır. Veri bilimcileri için Python, en iyi veri programlama dilidir. OReillyye yanıt verenlerin% 40ının ana programlama dili olarak Pythonu kullanmasının nedeni budur.
Python, çok yönlülüğü nedeniyle veri bilimi sürecinin tüm adımlarında kullanılabilir; çeşitli formatlardaki verileri de kullanabilir ve SQL tabloları kolayca koda aktarılabilir; ayrıca bir veri seti oluşturabilir ve Google'da arayabilir. Her tür veriden.
Python'un temelleri ve veri bilimindeki uygulamaları hakkında daha fazla bilgi edinmek için aşağıdaki kitapları okuyun:
· Python Veri Bilimi Kılavuzu
Veri analizi için Python
· Python Öğrenin
Bu gerekli bir platform olmasa da çoğu durumda tercih edilen platform budur. Hive veya Pig ile deneyim, iyi bir satış noktasıdır. Amazon S3 gibi bulut araçlarına aşinalık da faydalıdır. CrowdFlower tarafından 3490 LinkedIn veri bilimi pozisyonu için yapılan bir araştırma, insanların% 49'unun Apache Hadhoop'u veri bilimcileri için en önemli ikinci beceri olarak listelediğini gösterdi.
Bir veri bilimcisi, sahip olduğu veri miktarının sistemin belleğini aştığı veya verilerin farklı bir sunucuya gönderilmesi gereken bir durumla karşılaşabilir. Bu Hadhoop'un rolüdür. Hadoop, verileri sistemdeki çeşitli noktalara hızlı bir şekilde iletebilir. Bu, buzdağının sadece görünen kısmıdır. Hadoop ayrıca veri keşfi, veri filtreleme, veri örnekleme ve toplama gerçekleştirebilir.
NoSQL ve Hadoop, veri biliminin önemli parçaları olmasına rağmen. Ancak yine de adayların SQL'de karmaşık sorgular yazmasını veya yürütmesini bekleyin. SQL (Yapılandırılmış Sorgu Dili), veritabanından veri ekleme, silme ve veri çıkarma gibi işlemleri gerçekleştirmeye yardımcı olabilen bir programlama dilidir. Ayrıca, analiz işlevlerinin gerçekleştirilmesine ve veritabanı yapılarının dönüştürülmesine yardımcı olabilir.
Bir veri bilimcisi olarak, SQL konusunda uzman olmanız gerekir. SQL verilere erişmek, iletişim kurmak ve işlemek için tasarlandığından, veritabanını sorgulamak için kullandığınızda bazı içgörüler elde edebilirsiniz. Kısa komutlar zaman kazandırabilir ve zor sorguları gerçekleştirmek için gereken programlama miktarını azaltabilir. SQL öğrenmek, ilişkisel veritabanlarını daha iyi anlamaya ve kişisel bilgileri geliştirmeye yardımcı olur.
Apache Spark, dünyanın en popüler büyük veri teknolojisi haline geliyor. Tıpkı Hadoop'un büyük veri hesaplama çerçevesi gibi, tek fark, Spark'ın Hadoop'tan daha hızlı olmasıdır.Hadoop'un diske okuma ve yazma ihtiyacı olduğu için hız daha yavaş olacak ve Spark sonucu hesaplayacak. Bellekte önbelleğe alındı.
Apache Spark, karmaşık algoritmalarını daha hızlı çalıştırmaya yardımcı olmak için veri bilimi için tasarlanmıştır. Büyük miktarda veriyi işlerken veri işlemeyi yaymaya yardımcı olur ve böylece zamandan tasarruf sağlar; ayrıca veri bilimcilerin bir veya bir grup makinede yapılandırılmamış veri kümelerini işlemesine yardımcı olabilir.
Apache Spark, veri biliminde veri kaybını önleyebilir.Hız ve platform, veri bilimi projelerinin kolay uygulanmasına izin veren avantajlarıdır. Apache Spark ile, veri alımından dağıtılmış hesaplamaya kadar analiz gerçekleştirebilirsiniz.
Çoğu veri bilimcisi, sinir ağları, pekiştirmeli öğrenme ve düşmanca öğrenme dahil olmak üzere makine öğrenimi alanında ve teknolojisinde yetkin değildir. Göze çarpmak için, denetimli makine öğrenimi, karar ağaçları ve mantıksal inceleme gibi makine öğrenimi tekniklerini anlamak gerekir. Bu teknikler, büyük organizasyonel sonuçların tahminlerine dayalı olarak farklı veri bilimi problemlerinin çözülmesine yardımcı olabilir.
Veri bilimi, makine öğreniminin farklı alanlarında becerilerin uygulanmasını gerektirir. Kaggle tarafından yapılan bir anket, yalnızca az sayıda veri uzmanının denetimli makine öğrenimi, denetimsiz makine öğrenimi, zaman serileri, doğal dil gibi gelişmiş makine öğrenimi becerilerinde uzmanlaşabileceğini göstermektedir. İşleme, aykırı değer kontrolü, bilgisayarla görme, öneri motoru, hayatta kalma analizi, pekiştirmeli öğrenme ve düşmanca öğrenme.
Veri biliminin büyük veri kümeleriyle başa çıkması gerekir ve bu veri kümelerini işlemek için makine öğreniminde uzman olmak isteyebilirsiniz.
Resim kaynağı: pexels.com/@pixabay
İş dünyası büyük miktarda veri üretmeye devam edecek ve bu verilerin anlaşılması kolay versiyonlara dönüştürülmesi gerekiyor. İşlenmemiş verilerle karşılaştırıldığında, "bir resim bin kelimeye bedeldir", grafikler şeklindeki resimleri insanların anlamaları daha kolaydır.
Bir veri bilimcisi olarak, verileri ggplot, d3.js, Matplotlib ve Tableau gibi veri görselleştirme araçları yardımıyla görselleştirebilmelisiniz. Bu araçlar, projenin karmaşık sonuçlarının anlaşılması kolay versiyonlara dönüştürülmesine yardımcı olur. Sorun şu ki, pek çok kişi dizi korelasyonunu ve p değerini anlamıyor, bu nedenle bu terimlerin içeriğini sonuçlara sezgisel olarak yansıtmak gerekiyor.
Veri görselleştirme, kuruluşlara verileri doğrudan işleme fırsatı sunar. İş fırsatlarını değerlendirmek ve rekabette bir adım önde olmak için verileri hızla kavrayabilirler.
Yapılandırılmamış verilerle uğraşmak, veri bilimcileri için çok önemlidir. Yapılandırılmamış veriler, veritabanı tablolarına uygun olmayan tanımsız içeriklerdir.Örneğin videolar, blog yazıları, müşteri incelemeleri, sosyal medya makaleleri, video kaynakları, ses vb. Büyük miktarda metinden oluşmaktadır. Bu veriler yeterince öz olmadığından bunları sınıflandırmak zordur.
Yapılandırılmamış verilerin karmaşıklığından dolayı çoğu insan buna "karanlık analiz" adını verir. Yapılandırılmamış veriler, karar verme için faydalı içgörüleri netleştirmeye yardımcı olur. Bir veri bilimcisi olarak, farklı platformlardaki yapılandırılmamış verileri anlama ve kullanma becerisine sahip olmalısınız.
Hiç şüphe yok ki bu ünlü alıntı, özellikle veri bilimcileri söz konusu olduğunda son zamanlarda birçok yerde görülebiliyor. Frank Lo tarafından birkaç ay önce yayınlanan bir misafir blogunda, bunun anlamını açıkladı ve diğer gerekli "yumuşak beceriler" hakkında konuştu.
Merakın tanımı, daha fazla bilgi edinme arzusudur. Bir veri bilimcisi olarak, veriler hakkında sorular sorabilmeniz gerekir, çünkü veri bilimcileri, zamanlarının yaklaşık% 80'ini verileri keşfetmek ve hazırlamak için harcarlar. Veri bilimi alanı çok hızlı büyüyen bir alandır ve eğilime ayak uydurmak için daha fazla bilgi edinilmelidir.
Bilgi rezervinizi güncellemek için çevrimiçi olarak içerik ve veri bilimi geliştirme eğilimleri hakkında düzenli olarak kitaplar okumanız gerekir. İnternetteki göz kamaştırıcı veri kitlesine kapılmayın. Bunları nasıl kullanacağınızı bilmelisiniz Merak, veri bilimcisi olmak için gerekli becerilerden biridir. Örneğin, ilk başta toplanan verilerden hiçbir şey tespit edemeyebilirsiniz, ancak merak sizi verilerde yanıtlar bulmaya ve daha fazla içgörü getirmeye yönlendirecektir.
Bir veri bilimcisi olmak için, sektörünüz hakkında sağlam bir anlayışa sahip olmanız ve çözülmesi gereken şirketin sorunlarını anlamanız gerekir. Veri bilimi söz konusu olduğunda, verilerini yeni iş yöntemlerini belirlemek için kullanmanın yanı sıra, işletmeyi hangi sorunların çözebileceğini belirleyebilmek de çok önemlidir.
Bunu yapmak için çözülen sorunun işletmeyi nasıl etkileyeceğini anlamak gerekir. Ancak işletmenin işleyişini anlayarak doğru yönde çalışabiliriz.
Olağanüstü veri bilimcileri arayan şirketler, teknik bulguları pazarlama veya satış gibi teknik olmayan ekiplere net ve sorunsuz bir şekilde iletebilecek kişileri işe alıyor. Veri bilimcileri, verileri doğru bir şekilde tartışmak için teknik olmayan bölümlerdeki meslektaşların ihtiyaçlarını anlamanın yanı sıra, şirket tarafından alınan kararların yüksek kaliteli içgörülerle desteklenmesini sağlamalıdır.
Şirketin anlayabileceği dili kullanmanın yanı sıra, iletişim kurmak için hikayeler anlatmak için verileri de kullanması gerekiyor. Bir veri bilimcisi olarak, başkalarının kolayca anlayabilmesi için veriler etrafında bir olay örgüsünü nasıl yapılandıracağınızı bilmeniz gerekir. Örneğin, verileri doğrudan sunmak, verilerle ilgili içgörüleri hikaye anlatımı biçiminde paylaşmak kadar etkili değildir. Hikaye anlatma biçimi, veri bulgularını işverenlerle doğru şekilde iletmenize yardımcı olur.
İletişim kurarken, analiz verilerinin sonuçlarına ve değerlerine dikkat edin. Çoğu işveren neyi analiz ettiğinizi bilmek istemiyor, verilerin iş üzerinde ne gibi olumlu etkileri olacağıyla ilgileniyorlar. Değer iletmeyi ve kalıcı ilişkiler kurmayı öğrenin.
Resim kaynağı: pexels.com/@rawpixel
Veri bilimcileri bunu tek başlarına yapamaz. Stratejiyi incelemek, yeni ürünler geliştirmek için ürün yöneticileri ve tasarımcılarla çalışmak, daha iyi dönüştürme etkinlikleri geliştirmek için pazarlamacılarla birlikte çalışmak ve veri boru hatları oluşturmak ve iş akışlarını iyileştirmek için müşteri ve sunucu yazılımı geliştiricileriyle çalışmak için şirket yöneticileriyle birlikte çalışmalısınız. Müşterileriniz dahil şirketteki herkesle çalışmalısınız.
Temel olarak, sorunu çözmek için gereken iş hedeflerini ve verileri anlamak, kullanım senaryosuyla başa çıkmanın doğru yolunu, sorunu çözmek için gereken verileri ve ilgili kişiler tarafından nasıl kolayca anlaşılacağını bilmek için ekip üyeleriyle işbirliği içinde kullanım senaryoları geliştireceksiniz. Sonuçları sunmanın yolu.
Yorum Beğen Takip Et
AI öğrenme ve geliştirmenin kuru mallarını paylaşalım
Tam platform yapay zeka dikey öz medya "temel okuma" yı takip etmeye hoş geldiniz