Özel Acemi veri bilimcileri tarafından yapılan 13 yaygın hata (araçlara ve öğrenim kaynaklarına bağlantılar içeren)

Eser sahibi: Pranav Dar

Çeviri: He Zhonghua

Düzeltme: Zhang Ling

Bu makale hakkında 6000 kelime 10 dakikadan fazla okumanız tavsiye edilir.

Bu makale, deneyimli bir sürücüden acemi bir veri bilimcisine bazı tavsiyelerde bulunmaktadır. Veri bilimcisi olmayı taahhüt eden herkesin sapmalardan kaçınacağını umuyorum.

Giriş

Veri biliminin sizin için doğru alan olduğuna karar verdiniz mi? Günümüzde, giderek daha fazla şirket veri odaklı hale geliyor ve dünya gittikçe daha fazla bağlantılı hale geldi, bu nedenle her şirketin veri bilimi uygulamalarına ihtiyacı var gibi görünüyor. Bu nedenle, veri bilimcilerine olan talep çok büyük. Daha da iyisi, endüstrinin veri bilimi yeteneği eksikliği bir fikir birliğine varıldı.

Ancak veri bilimcisi olmak kolay değil. Gerçek anlamda bir veri bilimci olmak için birden fazla beceride uzmanlaşmanız gerekir. Bu beceriler şunları içerir: Problemi çöz , Yapılandırılmış düşünme , Programlama ile Diğer mesleki beceriler . Teknoloji veya matematikte bir geçmişiniz yoksa, kitaplar ve video kursları yoluyla öğrenmeniz muhtemeldir, ancak bunların çoğu endüstrinin veri bilimcilerinden bulmaya istekli ne olduğunu size öğretmez.

Veri bilimcisi olmak isteyen insanların kendi kendine eğitim ile gerçek dünya arasındaki boşluğu doldurmaya çalışmanın nedenlerinden biri budur.

Bu makalede, acemi veri bilimcileri tarafından yapılan yaygın hataları tartışacağım (bazılarını kendim yaptım) ve veri bilimi yolculuğunuzda bu tuzaklardan kaçınmanıza yardımcı olacak ilgili kaynakları sağlayacağım.

Bu makalenin içeriği

1. Yalnızca teorik kavramları öğrenin ama uygulamayın

2. Öğrenme ön koşullarını öğrenmeden doğrudan makine öğrenimi teknolojisini uygulayın

3. Yalnızca sertifikalara ve derecelere güvenin

4. Gerçek hayattaki çalışmanın tıpkı bir makine öğrenimi yarışmasında gördüğünüz gibi olduğunu yanlış anlama

5. Alandaki uygulanabilirliği ve yorumlanabilirliğinden çok modelin doğruluğuna odaklanın

6. Özgeçmişinizde çok fazla veri bilimi terimi kullanın

7. İşle ilgili sorunlar yerine araçlara ve kitaplıklara öncelik verin

8. Verileri keşfetmek ve görselleştirmek için yeterince zaman harcamamak (merak)

Dokuz, sorunu çözmek için yapılandırılmış bir yaklaşım kullanmadı

10. Birden çok aracı aynı anda öğrenmeye çalışın

11. Öğrenmede ısrar etmedi

12. Tartışma ve rekabetten uzak durun

13. İletişim becerilerini güçlendirememe

1. Yalnızca teorik kavramları öğrenin ama uygulamayın

Kaynak: Bilişsel Sınıf - YouTube

Pratik konularla ilgili başka bir makalede bahsettiğim gibi - makine öğrenimi tekniklerinin arkasındaki teoriye hakim olmak iyidir:

Makale bağlantısı: https://www.analyticsvidhya.com/blog/2018/07/learn-and-test-your-machine-learning-skills-with-avs-new-practice-problems-and-free-courses/

Ancak bunları uygulamazsanız, bunlar sadece teorik kavramlardır. Veri bilimini öğrenmeye ilk başladığımda, aynı hatayı yaptım - kitaplar ve çevrimiçi kurslar okudum, ancak bunları pratik problemleri çözmek için sıklıkla kullanmadım.

Bu nedenle, belirli bir zorluk veya problemle karşılaştığımda ve öğrendiğim her şeyi uygulama fırsatına sahip olduğumda, yarısını bile hatırlayamıyorum! Öğrenecek çok şey var - algoritmalar, türetmeler, araştırma makaleleri, vb. Büyük ihtimalle yarı yolda vazgeçeceksiniz. Veri bilimcisi olmak isteyen birçok insanın bu şekilde pes ettiğini gördüm.

Bu hatayı nasıl önleyebilirim?

Öğrenme sürecinde, teori ve pratik arasında iyi bir denge sağlanmalıdır. . Bir kavramı öğrendikten sonra, lütfen hemen Google'ı ziyaret edin ve onu uygulayabileceğiniz bir veri kümesi veya soru bulun, ardından kavramı eskisinden daha iyi hatırladığınızı göreceksiniz. Gerçek sorunları çözmek ve devam eden yarışmalara katılmak için AV'nin DataHack platformunu da kullanabilirsiniz.

Tek bir ısırıkla şişman olamayacağınız gerçeğini kabul etmelisiniz. Pratik yaparken boşlukları doldurun ve daha fazlasını öğreneceksiniz!

2. Öğrenme ön koşullarını öğrenmeden doğrudan makine öğrenimi teknolojisini uygulayın

Kaynak: Imperial College London - YouTube

Veri bilimcisi olmak isteyen çoğu insan, robot videolarından veya harika tahmin modellerinden ve hatta bazen bu pozisyon için yüksek maaşlardan ilham alır. Kötü haber şu ki (sizi hayal kırıklığına uğrattığım için üzgünüm!), İleriye giden yol hiçbir zaman sorunsuz olmadı.

Bir sorunu çözmek için teknolojiyi uygulamadan önce, teknolojinin nasıl çalıştığını anlamalısınız. Bu, bir algoritmanın nasıl çalıştığını, ona ince ayar yapmak için hangi işlemlerin yapılabileceğini ve mevcut teknolojiye dayalı olarak nasıl uygulanacağını anlamanıza yardımcı olacaktır. Matematik, belirli kavramları anlamak için her zaman yararlıdır, bu nedenle burada önemli bir rol oynar. Bir kurumsal veri bilimcinin günlük rolünde, ileri analizi anlamanız gerekmeyebilir, ancak genel bir anlayış kesinlikle yardımcı olacaktır.

Makine öğrenimi teknolojisinin nasıl çalıştığını merak ediyorsanız veya onu araştırma rolüne girmek istiyorsanız, temel makine öğrenimine girmeden önce anlamanız gereken dört ana konu şunlardır:

  • Lineer Cebir
  • hesap
  • İstatistik
  • Olasılık

Bu hatayı nasıl önleyebilirim?

Bir evin tuğlalardan yapılması gibi, bir veri bilimcisi de tüm benzersiz becerilerle bütünleşmiştir. Bu konuları öğrenmenize yardımcı olacak pek çok kaynak var. Aşağıda, başlamanıza yardımcı olabilecek her konu için bir kaynak listeleyeceğim:

  • Veri Bilimciler için Doğrusal Cebire Kapsamlı Yeni Başlayanlar Kılavuzu
  • https://www.analyticsvidhya.com/blog/2017/05/comprehensive-guide-to-linear-algebra/
  • Khan Academynin Matematik Kursu
  • https://www.khanacademy.org/math/calculus-home
  • Veri Bilimi için Olasılığın Temelleri Örneklerle Açıklandı
  • https://www.analyticsvidhya.com/blog/2017/02/basic-probability-data-science-with-examples/

İstatistikler ve olasılık üzerine kapsamlı bir modül içeren Analytics Vidhya'nın "Veri Bilimine Giriş" kursuna da göz atabilirsiniz.

  • Analytics Vidhya "Veri Bilimine Giriş" kursu
  • https://trainings.analyticsvidhya.com/courses/coursev1:AnalyticsVidhya+DS101+2018T2/about

3. Yalnızca sertifikalara ve derecelere güvenin

İşe alma yöneticileri ve işe alım görevlileri genellikle iş başvurusunda bulunanların tamamen sertifikalara ve akademik niteliklere bağlı olduğundan şikayet ederler. Veri bilimi çok popüler hale geldiğinden, çeşitli ilgili sertifikalar ve dereceler ortaya çıktı ve her yerde görülebilir. LinkedIn ana sayfama baktığımda, orada en az 5 sertifika görüntüleniyor. Bu sertifikaları almak kolay olmasa da sadece onlara güvenmek felakettir.

Artık internette buna benzer sertifikalar sunan birçok kurs var ve bunlar veri bilimcisi olmak isteyen binlerce kişi tarafından gözden geçirildi. Veri bilimi özgeçmişinizi renklendirmek için kullanılan bu kurslar, artık o kadar çekici değildir. İşe alma yöneticileri artık bu sertifikaları pek umursamıyor - bilginize ve bunları gerçek hayatta uygulama becerinize değer veriyorlar.

Gerçekten bir veri bilimcisi olabilmek için müşterilerle nasıl başa çıkılacağını, son teslim tarihleriyle nasıl başa çıkılacağını, bir veri bilimi projesinin yaşam döngüsünü nasıl anlayacağınızı ve mevcut iş çerçevesine uyum sağlayan bir modelin nasıl tasarlanacağını anlamanız gerekir. . Bu nedenle, sadece bir sertifika veya dereceye güvenmek yeterli değildir.

Bu hatayı nasıl önleyebilirim?

Beni yanlış anlamayın, sertifikalar değerlidir. Ancak, yalnızca bilgiyi sınıf dışında uyguladığınızda ve uygulamanın sonuçlarını herkese açık hale getirdiğinizde sertifika değerlidir. Gerçek dünya veri setlerini kullanın, hangi analizi yaparsanız yapın, bunları not ettiğinizden emin olun. Kendi blogunuzu oluşturun, LinkedIn'de yayınlayın ve topluluktan geri bildirim isteyin. Bu, öğrenmeye ve yeterince esnek olmaya, önerileri benimsemeye ve bu önerileri projeye uygulamaya istekli olduğunuzu gösterir.

Mevcut deneyim seviyeniz ne olursa olsun, staj fikrine açık olmalısınız. Bu şekilde, veri bilimi ekibinin nasıl çalıştığı hakkında çok şey öğrenecek ve başka bir röportajdan yararlanacaksınız.

Bir sonraki projenizi arıyorsanız, o zaman doğru yere geldiniz. Zorluklara bölünmüş harika bir proje listemiz var, şimdi başlayabilirsiniz:

Proje listesi bağlantısı: https://www.analyticsvidhya.com/blog/2018/05/24-ultimate-data-science-projects-to-boost-your-knowledge-and-skills/

4. Gerçek hayattaki çalışmanın tıpkı bir makine öğrenimi yarışmasında gördüğünüz gibi olduğunu yanlış anlama

Veri bilimcisi olmayı arzulayan insanlar için bu, en büyük yanlış anlamalardan biridir. Yarışmalara ve hackathonlara katıldığımızda temiz ve derli toplu veri setleri sağlıyorlar (eh, biraz fazla dedim ama çok kolaysınız), bu veri setlerini indiriyorsunuz ve problemi çözmeye başlıyorsunuz. Bu veri seti sütunlarında eksik değerler olsa bile, çok fazla beyin hücresi harcamanıza gerek yoktur, sadece eksik değerleri doldurmak için bir isnat tekniği bulun.

Ne yazık ki, gerçek dünya projeleri öyle değil. Genellikle uçtan uca veri akışına dahil olan bir grup insan vardır, bu nedenle neredeyse her zaman dağınık ve kirli verilerle uğraşmak zorunda kalırsınız. Eskilerin söylediği gibi: Verileri toplamak ve temizlemek zamanın% 70-80'ini alır, bu doğru. İşin bu kısmı yorucu ve bundan (muhtemelen) hoşlanmayacaksınız, ancak sonunda günlük işinizin bir parçası olacak.

Bunu bir sonraki bölümde daha ayrıntılı olarak ele alacağız: Doğruluk her zaman nihai hedef değildir, bu nedenle basit bir model herhangi bir karmaşık, birleşik entegre modelden daha iyi olacaktır. Bu, işte öğrendiğiniz en bariz şekilde farklı şeylerden biri olacak.

Bu hatayı nasıl önleyebilirim?

İronik olarak, bu yanlış anlaşılmayı ortadan kaldırmanın en önemli faktörlerinden biri deneyimdir. Ne kadar çok deneyim kazanırsanız (bu durumda stajyerlik çok yardımcı olabilir), ikisini daha iyi ayırt edebilirsiniz. Ayrıca sosyal medyadaki veri bilimcilerle iletişime geçebilir ve deneyimlerinden öğrenebilirsiniz.

Ek olarak, bu Quora gönderisine göz atmanızı öneririm:

https://www.quora.com/How-similar-are-Kaggle-competitions-to-what-data-scientists-do

Dünyanın her yerinden bu konuyla ilgili görüşlerini sunan veri bilimcileri var. Rekabet liderlik tablosunda elde edilen iyi sonuçlar, öğrenme ilerlemenizi ölçmek için çok uygundur.Ancak görüşmeci, modeli etkili kılmak için algoritmayı nasıl optimize ettiğinizi bilmek ister, aynı zamanda sadece doğruluğu iyileştirmek için değil. Bir veri bilimi projesine nasıl başlayacağınızı ve bir ekibin hangi farklı pozisyonlara sahip olduğunu (veri mühendisinden veri mimarına) anlayarak makul bir cevap verebilirsiniz.

Modelleri analiz etmenin standart yöntemini açıklayan bu LinkedIn gönderisini okuyun:

5. Alandaki uygulanabilirliği ve yorumlanabilirliğinden çok modelin doğruluğuna odaklanın

Daha önce de belirtildiği gibi, iş her zaman doğruluk peşinde değildir. Kredi ihlallerini% 95 doğrulukla tahmin edebilen bir modelin iyi olduğu doğrudur, ancak modelin nasıl uygulandığını, ona hangi özelliklerin katkıda bulunduğunu ve modeli oluştururken düşüncelerinizin neler olduğunu açıklayamazsanız, sizinki Müşteriler bunu reddedecek.

Çok az kişinin ticari uygulamalarda derin sinir ağlarını kullandığını göreceksiniz çünkü müşterilere sinir ağlarının (derin ağlardan bahsetmeden) gizli katmanlarla, evrişimli katmanlarla nasıl çalıştığını açıklayamıyorlar. yani biz Her zaman yapılacak ilk şey, modelin içinde neler olduğunu anladığınızdan emin olmaktır. . Kredi başvurusunun yaş veya aile bireylerinin sayısı veya geçmiş kredi geçmişi nedeniyle reddedilip reddedilmediğini belirlemek mümkün değilse, kredi işi nasıl işleyecektir?

Diğer bir anahtar da, modelinizin kuruluşun mevcut çerçevesine uyup uymadığıdır. Üretim ortamı bunu destekleyemezse, 10 farklı türden araç ve kitaplık kullanılarak oluşturulan modeller sefil bir şekilde başarısız olacaktır, çünkü modelleri sıfırdan tasarlamak ve eğitmek için daha basit yöntemler kullanmak zorunda kalacaksınız.

Bu hatayı nasıl önleyebilirim?

Kendinizi bu hatayı yapmaktan alıkoymanın en iyi yolu sektördeki insanlarla konuşmaktır çünkü daha iyi deneyime sahip öğretmen yoktur. Bir alan seçin (finans, insan kaynakları, pazarlama, satış, operasyonlar, vb.) Ve projelerinin nasıl çalıştığını anlamak için seçilen alandaki sektör içerisindeki kişilerle iletişime geçin.

Ek olarak, Ayrıca daha basit modeller uygulayabilir ve bunları teknik olmayan kişilere açıklayabilirsiniz. , Ardından, modele karmaşıklık katın ve modelin altında neler olduğunu anlamayana kadar buna devam edin. Bu, ne zaman durmanız gerektiğini ve pratik uygulamalarda neden her zaman basit modellerin tercih edildiğini anlamanızı sağlayacaktır.

6. Özgeçmişinizde çok fazla veri bilimi terimi kullanın

Bunu daha önce yaptıysanız, neden bahsettiğimi anlayacaksınız. Özgeçmişinizde şu anda bu sorun varsa, lütfen hemen düzeltin! Pek çok teknik ve araç biliyor olabilirsiniz, ancak bunların sıralanması potansiyel işe alım yöneticilerini kaçırmanıza neden olacaktır.

Özgeçmiş, yazılacak şeylerin basit bir listesi değil, nelerin başarıldığına ve nasıl yapıldığına dair genel bir bakış niteliğindedir. İşveren özgeçmişinize baktığında, Kısa ve öz Geçmişinizi ve başarılarınızı anlamanın yolu. Bununla birlikte, özgeçmişinizin yarısı herhangi bir açıklama olmaksızın doğrusal regresyon, XGBoost, LightGBM gibi belirsiz veri bilimi terimleriyle doluysa, özgeçmişiniz devam etme tarama aşamasını geçemeyebilir.

Bu hatayı nasıl önleyebilirim?

Özgeçmişinizde dağınıklığı ortadan kaldırmanın en kolay yolu madde işaretleri kullanmaktır. Sadece belirli başarıları elde etme sürecinde kullandığınız teknolojileri listeleyin (belki bir proje veya bir yarışma) ve sonra bu teknolojileri nasıl kullandığınızı açıklamak için bir veya iki cümle yazın; bu, işe alım görevlilerinin sizi anlamasına yardımcı olacaktır. Düşünceler.

Giriş seviyesi işlere başvururken, özgeçmişinizin işletmeye ekleyebileceğiniz potansiyel etkiyi yansıtması gerekir. Farklı alanlardaki pozisyonlar için başvuruyor olabilirsiniz, bu nedenle bir dizi özgeçmiş şablonuna sahip olmak en iyisidir. Böylece sadece hikayeyi değiştirerek seçilen alana olan ilginizi gösterebilirsiniz.

Kunal Jain tarafından yazılan bu makale, veri bilimcilerinin nasıl harika bir özgeçmiş hazırladığını anlamak için harika bir kaynaktır:

Makale bağlantısı: https://www.analyticsvidhya.com/blog/2014/11/tips-prepare-cv-data-science-roles/

7. İşle ilgili sorunlar yerine araçlara ve kitaplıklara öncelik verin

Bunun neden bir hata olduğunu açıklamak için bir örnek verelim. Size bir konut fiyatı veri seti verildiğini ve gelecekte gayrimenkulün değerini tahmin etmeniz gerektiğini hayal edin. Bu veri setinde bina sayısı, oda sayısı, kiracı sayısı, ailenin büyüklüğü, avlunun büyüklüğü ve musluk olup olmadığı gibi 200'den fazla değişken vardır. Bazı değişkenlerin anlamını bilmiyor olabilirsiniz. Ancak, bir değişkeni silmenizin nedenini bilmeden yine de iyi doğrulukta bir model oluşturabilirsiniz.

Nihai sonuç, bu değişkenin gerçek dünyada önemli bir faktör olduğunu göstermektedir. Bu feci bir hatadır.

Araçlar ve kitaplıklar hakkında sağlam bir bilgiye sahip olmak çok iyidir, ancak burada yalnızca size yardımcı olacaktır. Bu bilgiyi, alandaki iş problemleriyle birleştirmek, gerçek veri bilimcinin devreye girmesi gereken yerdir. Bu nedenle, en azından ilgilendiğiniz (veya başvurduğunuz) sektördeki temel zorlukların neler olduğunu anlamalısınız.

Bu hatayı nasıl önleyebilirim?

Birçok seçenek var:

  • Belirli bir sektörde veri bilimcisi pozisyonu için başvuruyorsanız, lütfen bu alandaki şirketlerin veri bilimini nasıl kullandığını anlayın.
  • Mümkünse, belirli sektörlerdeki veri kümelerini arayın ve bunları işlemeye çalışın. Bu, özgeçmişinizde bir vurgu olacaktır.
  • Alan bilgisinin neden veri biliminin ana itici gücü olduğunu anlamak için aşağıdaki mükemmel New York Times makalesini okuyun:
New York Times makalesi: https://www.forbes.com/sites/kalevleetaru/2016/06/12/why-we-need-more-domain-experts-in-the-data-sciences/#44d76b893b50

8. Verileri keşfetmek ve görselleştirmek için yeterince zaman harcamamak (merak)

Veri görselleştirme, veri biliminin çok ilginç bir yönüdür, ancak veri bilimcisi olmak isteyen birçok kişi, doğrudan model oluşturma aşamasına bir adım atmayı tercih eder. Bu yöntem yarışmalarda etkili olabilir, ancak kaçınılmaz olarak fiili çalışmasında başarısız olacaktır. Yapacağınız en önemli şey elinizdeki verileri anlamaktır ve modelin sonuçları bunu yansıtacaktır.

Veri kümesini anlamak için zaman ayırarak ve farklı çizelgeleri deneyerek, zorluk veya problem hakkında daha derin bir anlayışa sahip olacaksınız.Sadece bunu yaparak kalıpları, eğilimleri, hikayeleri ve verilerin en iyi kısımlarını keşfedebilirsiniz. Birçok içgörü karşısında şaşırdım. Görselleştirme aynı zamanda bulgularınızı müşterilere göstermenin en iyi yoludur.

Bir veri bilimcisi olarak, doğal olarak meraklısınız. Veri bilimi ile ilgili harika olan şey, ne kadar meraklı olursanız, o kadar çok soru soracağınızdır. Bu, verileri daha iyi anlamanız için sizi cesaretlendirecek ve ayrıca ilk başta bilmediğiniz sorunları çözmeye yardımcı olacaktır.

Bu hatayı nasıl önleyebilirim?

uygulama! Lütfen veri kümesini bir sonraki işlemenizde bu adıma daha fazla zaman ayırın. Size getireceği içgörüye şaşıracaksınız. sorular sor! Yöneticinize sorun, alan uzmanlarına sorun, İnternette çözüm arayın, bulamazsanız lütfen sosyal medyada sorun. Çok fazla seçenek!

Başlamanıza yardımcı olmak için bazı referans kaynakları aşağıda verilmiştir:

  • R'de Veri Görselleştirme için Kapsamlı Kılavuz
  • https://www.analyticsvidhya.com/blog/2015/07/guide-data-visualization-r/
  • Veri Keşfi İçin Kapsamlı Bir Kılavuz (Şiddetle Tavsiye Edilir)
  • https://www.analyticsvidhya.com/blog/2016/01/guide-data-exploration/
  • İyi kod yazmayanlar için 18 Ücretsiz Keşfedici Veri Analizi Aracı
  • https://www.analyticsvidhya.com/blog/2016/09/18-free-exploratory-data-analysis-tools-for-people-who-dont-code-so-well/

Dokuz, sorunu çözmek için yapılandırılmış bir yaklaşım kullanmadı

Yapılandırılmış düşünme, veri bilimcilere birçok yönden yardımcı olur:

  • Sorun ifadesini parçalara ayırmanıza yardımcı olur Farklı mantıksal parçalar .
  • Sana yardım etmek Sorun ifadelerinin ve tasarım çözümlerinin kapsamlı analiz sürecini görselleştirin .
  • Son kullanıcılara veya müşterilere yardımcı olun Mantıklı ve anlaşılması kolay bir şekilde Çerçeve sıranızı anlayın.

Yapılandırılmış düşünmenin yardımcı olmasının birçok nedeni vardır. Tahmin edebileceğiniz gibi, bir kişinin yapılandırılmış düşünceye sahip olmaması mantık dışıdır. Çalışmanız ve problem çözme yöntemleriniz keyfi olacak ve karmaşık problemlerle vs. karşılaştığınızda kendi hızınızı izleyemeyeceksiniz.

Bir veri bilimi görüşmesi yaparken, görüşmeci kaçınılmaz olarak sizden bir vaka çalışmasını analiz etmenizi veya bir değeri tahmin etmenizi veya zor problemleri çözmenizi isteyecektir. Görüşme odasındaki havadaki baskı ve zaman kısıtlamaları nedeniyle görüşmeci, fikirlerinizi nihai sonuca nasıl yapılandırdığınızı gözlemleyecektir. Çoğu durumda, sonunda işi alıp alamayacağınız önemlidir.

Bu hatayı nasıl önleyebilirim?

Basit eğitim ve titiz eğitimle kendi yapısal düşünme tarzınızı geliştirebilirsiniz. Başlamanıza yardımcı olacak bazı makaleleri aşağıda listeledim:

  • Yapılandırılmış Düşünme ve Analiz Sanatı
  • https://www.analyticsvidhya.com/blog/2013/06/art-structured-thinking-analyzing/
  • Yapılandırılmış Düşünmeyi Geliştirmek İçin Araçlar
  • https://www.analyticsvidhya.com/blog/2014/02/tools-structured-thinking/
  • Veri Bilimciler ve Analistler için Zorunluluk: Analitik Düşünme için Beyin Eğitimi
  • https://www.analyticsvidhya.com/blog/2015/07/brain-training-analytical-thinking/

10. Birden çok aracı aynı anda öğrenmeye çalışın

Bu sorun çok yaygındır. Her araç benzersiz özellikler sağladığından, insanlar tüm araçları aynı anda öğrenme eğilimindedir. Ama sonunda, herhangi bir kontrole sahip değilsiniz, bu yüzden bu kötü bir fikir. Araçlar, nihai hedef değil, veri bilimini uygulama aracıdır.

Bu hatayı nasıl önleyebilirim?

Bir araç seçin ve ustalaşana kadar ona bağlı kalın. Zaten R öğreniyorsanız, Python'dan etkilenmeyin. R'ye bağlı kalın, uçtan uca öğrenin ve ardından becerilerinize başka bir araç eklemeye çalışın. Bu şekilde daha fazlasını öğreneceksiniz.

Her aracın, zorluklarla karşılaştığınızda kullanabileceğiniz mükemmel bir kullanıcı topluluğu vardır. Soru sormak için forumumuzu kullanın, çevrimiçi arama yapın, pes etmeyin:

Forum bağlantısı: https://discuss.analyticsvidhya.com/

Amaç, araçları veri bilimi yoluyla öğrenmek değil, araçlar aracılığıyla veri bilimini öğrenmektir.

Hangi aracı kullanmanız gerektiğinden emin değilseniz, her bir aracın (SAS dahil) avantajlarını ve dezavantajlarını listeleyen bu harika makaleye bakın:

Makale bağlantısı: https://www.analyticsvidhya.com/blog/2017/09/sas-vs-vs-python-tool-learn/

11. Öğrenmede ısrar etmedi

Bu sadece yeni gelenler için değil, tüm veri bilimcileri için geçerlidir. İnsanların dikkati doğal olarak dağılıyor, bu yüzden bir süre (örneğin bir ay) çalışıyoruz ve sonraki iki ay ara veriyoruz. Ondan sonra, orijinal haline dönmeye çalışmak bir kabus gibiydi, çünkü daha önce öğrenilen kavramların çoğu unutulmuş, notlar kaybolmuş ve daha önce öğrendiğim zaman boşa gitmiş gibi hissettim.

Bunu şahsen yaşadım. Pek çok şey yaşadığımız için öğrenmeye dönmemek için her türlü bahane ve sebep bulabiliriz. Ama bu nihayetinde bizim kaybımız ... Nedeni, veri biliminin sadece bir ders kitabı açmak ve bilgiyi sindirmek kadar basit olmaması, aksi takdirde sokaklar bugün veri bilimcileriyle dolu. Sürekli sıkı çalışma ve çalışma gerektirir ve bu iki niteliğe ancak kişi kaybettikten sonra değer verilir.

Bu hatayı nasıl önleyebilirim?

Kendinize hedefler belirleyin. Bir zaman çizelgesi çizin ve duvara asın, nasıl ve ne öğrenmek istediğinizi planlayın ve kendinize bir son tarih belirleyin. Örneğin, sinir ağları hakkında bilgi edinmek istediğimde kendime birkaç hafta zaman tanıdım ve sonra öğrendiklerimi bir hackathon'da test ettim.

Artık bir veri bilimcisi olmaya karar verdiğinize göre, zaman ayırmaya hazır olmalısınız. Sürekli öğrenmemek için bahaneler arıyorsanız, o zaman veri bilimcinin pozisyonu sizin için olmayabilir.

12. Tartışma ve rekabetten uzak durun

Bu, yukarıdaki noktalarda gördüğümüz bazı şeylerin birleşimidir. Veri bilimcisi olmak isteyen kişiler, eleştiri korkusuyla analizlerini çevrimiçi yayınlamaktan kaçınma eğilimindedir. Ancak, topluluktan geri bildirim almazsanız, bir veri bilimcisi olarak büyümeyeceksiniz.

Veri bilimi alanında tartışma, fikirler ve beyin fırtınası çok önemlidir. Bu nedenle, işbirliği yapmanız ve diğer veri bilimcilerinin görüşlerini anlamanız gerekir, bu da silolarda çalışamayacağınız anlamına gelir. Benzer şekilde insanlar kazanamayacaklarını düşündükleri için yarışmaya katılmıyorlar, bu yanlış bir zihniyet! Yarışmaya sadece kazanmak için değil öğrenmek için katılıyorsunuz. Kazanmak ödüldür, öğrenmek amaçtır.

Bu hatayı nasıl önleyebilirim?

Çok basit, lütfen tartışmalara ve yarışmalara katılmaya başlayın! İlk% 5'i girmemeniz önemli değil. Tüm süreçten yeni bir teknik öğrenirseniz, zaten kazandınız.

13. İletişim becerilerini güçlendirememe

İletişim becerileri, veri bilimcilerin mutlaka sahip olması gereken, ancak en az değerlendirilen ve hakkında konuşulan alanlardan biridir. Bu noktayı vurgulayan bir kursla karşılaşmadım. En son teknolojileri öğrenebilir, birden fazla araçta ustalaşabilir ve en iyi grafikleri oluşturabilirsiniz, ancak analizinizi müşterilerinize açıklayamıyorsanız, iyi bir veri bilimcisi değilsiniz.

Ve bu sadece müşteriler değil, BT, insan kaynakları, finans, operasyonlar vb. Gibi veri bilimine aşina olmayan ekip üyeleriyle çalışmalısınız. Görüşmecinin her zaman iletişim becerilerinizi kontrol edeceğinden emin olabilirsiniz.

Bir düşünme alıştırması olarak, bir kredi riski modeli oluşturmak için lojistik regresyon kullandığınızı varsayalım Lütfen teknik bilgisi olmayan kişilere nihai sonuca nasıl vardığınızı nasıl açıklayacağınızı düşünün. Herhangi bir teknik kelime kullandıysanız, iletişim becerilerinizi mümkün olan en kısa sürede güçlendirmeniz gerekir!

Bu hatayı nasıl önleyebilirim?

Günümüzde çoğu veri bilimcisi, bilgisayar bilimi geçmişinden geliyor, bu yüzden bunun edinilmesi zor bir beceri olabileceğini anlıyorum. Ancak başarılı bir veri bilimcisi olmak ve pozisyonunuzda ilerlemek için kişiliğinizi geliştirmek dışında seçeneğiniz yok.

Bence en yararlı nokta, veri bilimi terminolojisini teknik olmayan kişilere açıklamaktır, bu da problemi anlamamın netliğini ölçmeme yardımcı olabilir. Küçük ve orta ölçekli bir şirkette çalışıyorsanız, pazarlama veya satış departmanından birini bulun ve bu alıştırmayı onlarla birlikte yapın. Uzun vadede size çok yardımcı olacaktır.

İnternette başlamanıza yardımcı olacak birçok ücretsiz kaynak var, ancak uygulamanın anahtar olduğunu unutmayın. Lütfen bunu bugün yapmaya başladığınızdan emin olun.

Sonuç

Kendini veri bilimci olmaya adamış kişiler genellikle başka birçok hata yaparlar, bu nedenle bu kesinlikle kapsamlı bir liste değildir. Ancak, daha önce de belirtildiği gibi, bunlar gördüğüm en yaygın hatalardır. Amacım başkalarının (mümkün olduğunca) bunlardan kaçınmasına yardımcı olmaktır.

Bu görüşlerinize ilişkin görüşlerinizi ve benzer konulardaki kişisel deneyiminizi duymak isterim. Lütfen aşağıdaki yorumlar bölümünde bize bildirin!

Orjinal başlık:

Amatör Veri Bilimcilerin Yaptığı Yaygın Hatalar ve Bunlardan Nasıl Kaçınılır?

Orijinal bağlantı:

https://www.analyticsvidhya.com/blog/2018/07/13-common-mistakes-aspiring-fresher-data-scientists-make-how-to-avoid-them/

Çevirmen Profili

Ve Çin, Almanya'da Yazılım Mühendisliği Yüksek Lisansı. Makine öğrenimine olan ilgiden dolayı, yüksek lisans tezi geleneksel anlamlarını iyileştirmek için genetik algoritma fikirlerini kullanmayı seçti. Şu anda Hangzhou'da büyük veri ile ilgili uygulamalar yapıyor. Datapie'ye katılmak THU, BT çalışanları için üzerine düşeni yapmayı ve aynı zamanda benzer düşünen birçok arkadaş edinmeyi umuyor.

Patlayıcı performans! Uzman: Zidane, Tehlike değil Sterlin almalı!
önceki
Yeni Yılı Kutlayan Yeni Yılı Karşılama, Yangyang Talking Resim Yeni Yıl Resim Sergisi
Sonraki
AI'nın ilk dersi! CMU Derin Öğrenme Sonbahar Kursu başladı (PPT ve video ile)
Yeni Yılı Kutlayan Yeni Yılı Karşılama, Yangyang Talking Resim Yeni Yıl Resim Sergisi
Wei Shihao geçen yıl şovda açık bir şekilde şunları söyledi: Yurtdışında oynayamazsanız, çok para kazanmak için eve döneceksiniz!
Koleksiyon Bir programcı görüşmesine yanıt vermek için bilmeniz gereken 8 veri yapısı
Çiçekleri geri ödedikten sonra tekrar toprak yemeye gerek yok! "Doğru mu? (Kod eklenmiştir)
Çin futboluyla ilgili bir başka garip şey: genç Shenhua, Olimpiyat takım doktoru tarafından yanlış teşhis edildi ve ciddi bir şekilde ertelendi!
MIT, su altında balık yakalayabilen şeffaf robotlar yapıyor
Dünyanın en iyi pilotları PK 16'sında "F1 havada" başladı
Sahiplerin işlem döngüsü yeni bir zirveye ulaştı, Chengdu ikinci el konut işlemleri yavaş
Tek bir makalede okuyun | Ücretli bir AI işi bulmak ne kadar zor?
Sevgililer Günü'ne uygun 9 bilim kurgu aşk filmi
Zhejiang medyası Wei Shihao'yu bombaladı: Ulusal futbol ne kadar kötü olursa olsun, onu şiddetle kurtarmaya gerek yok, üzgünüm milli futbol forması!
To Top