Küçük veri bilimcileri için özel 8 ipucu (öğrenme kaynakları ile)

Yazar: Robert Chang

Çeviri: Su Jinliu

Bu makalenin uzunluğu 5300 kelime , Okumanız tavsiye edilir 10 dakika

Robert Chang, Twitter için çalışıyordu ve şimdi iki yıldır Airbnb'de çalışıyor. Kıdemli bir veri bilimcisi olmaya dönüp baktığında, veri bilimcisi yoluna yeni giren yeni gelenler için yol seçimi, araç seçimi ve öğrenme planı formülasyonunu kapsayan birkaç fikir yazdı.

motivasyon

İki yıl önce, sektörde veri bilimi çalışması yapma konusunda bazı deneyimlerimi paylaştım (https://medium.com/@rchang/my-two-year-journey-as-a-data-scientist-at-twitter-f0c13298aee6 ). Başlangıçta, Twitter'da iki yıldönümümü kutlamak için kişisel anılarımın bir özetiydi. Ama sonra bunu Medium'da yayınladım çünkü bu özetlerin hevesli veri bilimcilere yardımcı olabileceğine inanıyorum.

Bir göz açıp kapayıncaya kadar 2017 geldi ve ben de Airbnb'de yaklaşık iki yıl çalıştım. Son zamanlarda nihayet kıdemli bir veri bilimcisi oldum. Bu başlık, bir kişinin belirli bir düzeyde mesleki bilgi edindiğini belirtmek için kullanılır. Kariyerime dönüp baktığımda ve bir sonraki adımı dört gözle beklediğimde, kariyerimin ilk günlerinde bilmem gereken deneyimleri bir kez daha yazıyorum.

İlk eğitim yazılarımın hedef okuyucuları veri bilimiyle ilgilenen yeni gelenler ise, o zaman bu makale veri bilimi endüstrisine giren ancak yeni başlayanlar içindir. Bir yandan bu öğreticiyi, kendimi bu önemli öğrenme deneyimlerini unutmamaya teşvik etmek için yazdım, diğer yandan da veri bilimine yeni girenleri teşvik etmek istiyorum.

Hangi ana akım yolundasın?

Philip Guo, akademik olarak başarılı bir blog yazarıdır. Öğrenci, stajyer ve araştırmacı olarak mentorlarla iletişim kurma deneyimini hatırladı ve özetledi. "Hangi Ana Akım Yolundasınız?" (Http://www.pgbovine.net/critical-path.html) gönderisinde şunları yazdı:

"Kariyer gelişimi adına akıl hocamın ana akım yolunda durursam, o zaman bana yardımcı olmak için ellerinden geleni yapacaklar. Aksine, yalnızca kendime güvenebilirim. Yani başkalarının ana akım yolunda durduğunuzda, yapabilirsiniz Kendi başarınızı başkalarının başarısına bağlayın, diğer insanların kaynaklarına güvenin, birlikte çok çalışın ve birlikte başarılı olun. "

Fotoğraf Kredisi: Daniel Han

Bu çalışma mekanizması çok basit ve sezgiseldir. Umarım kariyerimin başlarında, örneğin bir proje seçtiğimde, bir ekip seçtiğimde, hatta hangi mentor veya şirket için çalışacağıma karar verdiğimde, bunu zaten biliyorum.

Örneğin, hala Twitter'da çalışırken, her zaman makine öğrenimi okumak istemişimdir. Ancak ekibim verilere çok bağımlı olsa da, veri bilimcilerin deneysel tasarıma ve ürün analizine daha fazla dikkat etmesine ihtiyacı var. Elimden gelenin en iyisini denedim ama yine de kişisel fikirlerimi ve takım planlarımı birleştiremedim.

Bu nedenle, Airbnb'ye varır varmaz hedefim, makine öğreniminin önemli bir rol oynayacağı bir projeye veya ekibe katılmaktı. Yöneticim ve ben, biri Airbnb'nin müşteri yaşam boyu değeri (LTV) değerlendirmesini modelleyen birkaç gelecek vaat eden projeyi onayladık.

Bu proje sadece işimiz için değil, kişisel kariyer gelişimim için de önemli. Makine öğrenimi büyük ölçekli modellemeyle ilgili birçok süreç bilgisi öğrendim (https://medium.com/airbnb-engineering/using-machine-learning-to-predict-value-of-homes-on-airbnb-9272d3d4739d). Doğrudan belirli iş sorunlarını çözmeye kararlı olmaktan daha etkili bir öğrenme yöntemi yoktur.

Şüphesiz hırslarımı gerçekleştirebilecek ve becerilerimi geliştirebilecek bir proje bulduğum için şanslıydım. Hedef yöntemini seçmek için mentorun ana akım yolunda durmanın bizi giderek daha fazla "şanslı" yapacağına ve hedeflerimizi ve dahil olduğumuz projeleri mükemmel bir şekilde birleştirebileceğine inanıyorum.

Ne öğrendim: Hepimizin geliştirmek ve geliştirmek istediğimiz becerilere ve hobilere sahibiz. Bu nedenle, tutkularımız ile ana akım yol arasındaki ilişkiyi tartmalıyız. Projeler, ekipler ve şirketler ararken, genel yolun hedeflerinizle eşleştiğinden emin olun.

Sorun için doğru aracı seçin

Airbnb'ye girmeden önce R ve dplyr (https://github.com/tidyverse/dplyr) ile programlama yapıyordum. LTV projesini başlattıktan sonra, sunmam gereken şeyin bir analiz kodu parçası değil, bir makine öğrenimi üretim iş akışı olması gerektiğini çabucak keşfettim. Airflow'da karmaşık bir iş akışı oluşturmayı kolaylaştırmak için Python dilini kullanmayı düşünün (https://medium.com/the-astronomer-journey/airflow-and-the-future-of-data-engineering-aqa-266f68d956a9), Bir ikilem içindeyim - R'den Python'a geçmeli miyim?

Resim kaynağı: quickmeme.com

(R ve Python'a ek olarak, Excel aynı zamanda güçlü bir rakiptir)

Bu, veri bilimcileri arasında çok yaygın bir sorundur, çünkü herkes hangi dili seçeceğiyle mücadele ediyor. Benim için ortada bir programlama dilini değiştirmenin maliyeti açıkça çok büyük. Artıları ve eksileri tartıyorum ve düşünüyorum, ama ne kadar çok düşünüyorum, düşüncem o kadar felç oluyor. Bu, R veya Python seçimiyle ilgili ilginç bir analizdir (https://blog.dominodatalab.com/video-huge-debate-r-vs-python-data-science/) Son olarak, Reddit'e bir yanıt (https: / /www.reddit.com/r/Python/ comments / 2tkkxd / Think_putting_my_efforts_into_python /) kafa karışıklığından kurtulmama izin verin:

"Hangi programlama dilini öğreneceğiniz konusunda endişelenmek yerine, sorununuzu çözmek için hangi dilin en iyi etki alanına özgü dili (DSL) sağlayabileceğini düşünmek daha iyidir."

Bir aracın uygunluğu her zaman çevreye ve sorunun doğasına bağlıdır. Soru Python öğrenmem gerekip gerekmediği değil, Python'un işime uygun olup olmadığıdır. Bu noktayı daha iyi açıklamak için işte bazı örnekler:

Amacınız en modern ve en gelişmiş istatistiksel yöntemleri uygulamaksa, R en iyi seçiminiz olmalıdır. Neden? Çünkü R, istatistikçiler tarafından tasarlanır ve istatistikçilere hizmet eder. Günümüzde, akademisyenler araştırma sonuçlarını yalnızca makalede değil, aynı zamanda R paketinde de yayınlamaktadır. Her hafta, CRAN'da (https://cran.r-project.org/mirrors.html) bunun gibi (https://github.com/susanathey/causalTree) birçok ilginç ve yeni R paketi yayınlanmaktadır.

Öte yandan Python, genel amaçlı bir programlama dili olduğu için üretim verileri iş akışları oluşturmak için özellikle uygundur. Örneğin, Hive'da yapmak için scikit-learn modelini ( paketlemek için Python UDF'yi ( / 2016/10 / python_udf_in_hive /) kullanabilirsiniz. Dağıtılmış puanlama (Dağıtılmış Puanlama), Airflow DAG yazmak için karmaşık mantığı kullanabilir, ayrıca modelin çıktı değerini tarayıcıda görüntülemek için bir Flask web uygulaması da yazabilirsiniz.

Kendi projem için toplu bir makine öğrenimi iş akışı oluşturmam gerekiyor. Python kullanırsam, işim kesinlikle çok daha kolay olacaktır. Sonunda kolumu sıvadım ve yeni bir meydan okumaya başladım.

Ne öğrendim: Bir teknolojiye veya programlama diline bakmak yerine, kendinize sorun, hangi araç veya teknoloji sorunumu en iyi çözebilir? Sorunun çözümüne odaklanın, ardından araç gelir.

Bir öğrenim projesi oluşturun

Python'u daha önce veri bilimi çalışması yapmak için hiç kullanmamış olsam da, Python diline az çok maruz kaldım (https://medium.com/@rchang/learning-how-to-build-a-web-application-c5499bd15c8f ). Ancak, temel Python bilgisini asla kabul etmedim. Bu nedenle, kod sınıflar halinde organize edildiğinde (https: // jeffknupp. Com / blog / 2014/06/18 / iyileştir-senin-python-piton sınıfları-ve-nesne-yönelimli-programlama /), ben çok Korku, __init__.py'nin ne için olduğunu genellikle bilmiyorum (https://stackoverflow.com / Questions / 448271 / what-is-is-init-py-for).

Bu sefer temel bilgileri öğrenmek için, Anders Ericsson'un kasıtlı eğitim üzerine araştırmasından ilham aldım (https://www.amazon.com/Peak-Secrets-New-Science-Expertise/dp/1531864880):

"Bilinçli eğitim, öğretmenler tarafından belirli alanlarda bireysel performansı etkili bir şekilde iyileştirmek için tasarlanmış eğitimdir."

Kendi öğretmenim olduğumu düşünürsek, Dr. Ericsson'un görüşleri bana çok yardımcı oldu. Örneğin, öğrenme projesini başlatmak için ilk olarak Python'da makine öğrenimiyle en alakalı bir dizi malzemeyi entegre ettim. Kişisel çalışma taslağını bitirmem birkaç haftamı aldı (https://github.com/robert8138/python-deliberate-practice). Taslağın geçerliliğini sağlamak için Python uzmanlarından taslağı benim için kontrol etmelerini istedim. Tüm hazırlıklar doğru öğrenme yolunda olmamı sağlamak içindir.

Kişisel çalışma müfredatımın bir parçası

Net bir taslağım olduğunda, bilinçli eğitime aşağıdaki stratejileri uygulayacağım:

  • Tekrar eğitimi: Sıkıcı, amaçsız analizler yapmak için kendimi R yerine Python kullanmaya zorluyorum. Bu, iş verimliliğimi düşürdü, ancak Pandaların temel API'sine ( daha aşina olmamı sağladı. Tabii ki, acil bir son tarihe takılıp kalmanıza gerek yok.

  • Bir geri bildirim çemberi oluşturun: Başkalarının kodlarına bakma ve gerekirse birkaç hatayı düzeltme fırsatları arıyorum. Örneğin Python standart kitaplığını kullanmadan önce nasıl tasarlandığını anlamaya çalışıyorum. Kendi kodumu yazdığımda, daha fazla insanın anlayabilmesi için onu yeniden düzenlemeye devam edeceğim.

  • Entegrasyon ve geri çağırma yoluyla öğrenin: Her haftanın sonunda, öğrenme kaynaklarımı, kavramları ve önemli olanları içeren haftalık ilerlemeyi (https://github.com/robert8138/python-deliberate-practice/blob/master/Planning.md) yazacağım. İçeriği düşünün. Öğrendiğim materyalleri hatırlayarak kavramları daha iyi sindirebilirim.

Süreç çok zor olsa da giderek durumum her hafta iyileşiyor. R ve Python'un temel sözdizimini birçok kez kontrol etmem gerekiyor çünkü iki dil arasında gidip gelmem gerekiyor. Kendime bunun uzun vadeli bir yatırım olduğunu ve bir makine öğrenimi projesine katıldığımda iyi getiri sağlayacağını söyledim.

Ne öğrendim: Birçok saha denemesi (https://qz.com/978273/a-stanford-professors-15-minute-study-hack-improves-test-grades-by-a-third-of-a-grade/) bir noktayı kanıtladı , Projeye yatırım yapmadan önce önceden planlama yapmak, daha derin eğitime yardımcı olacaktır. Tekrarlama, entegrasyon, hatırlama ve geri bildirim toplama, öğrenmeyi güçlendirmenin önemli yollarıdır.

Büyük veri bilimi uzmanlarıyla çalışın

Kasten eğitmek Anahtar faktörlerden biri, zamanında ve doğru geri bildirim alma yeteneğidir. Hiçbir sporcu, müzisyen veya matematikçi eğitim ve geri bildirim olmadan başarılı olamaz.

Güçlü bir büyüme zihniyetine sahip olanların (https: //www.ted. Com / talks / carol_dweck_the_power_of_believing_that_you_can_improve / up-next) bazı alanlardaki cehaletlerinden utanmadıkları bir özellik keşfettim ve Genellikle başkalarından geri bildirim istiyor.

Kişisel akademik ve profesyonel kariyerime dönüp baktığımda, sorularımı çoğu kez kendi kendime kontrol ettim çünkü cahil görünmek istemiyorum. Ancak yavaş yavaş bu zihniyetin oldukça kötü olduğunu keşfettim. Uzun vadeli bir perspektiften, birçok öz kontrolde bulunan sorunlar, utanç için değil, öğrenmek için iyi fırsatlardır.

Resim kaynağı: edutopia-büyüme zihniyeti çok önemlidir!

Bu projeden önce, makine öğrenimini üretime nasıl uygulayacağım konusunda çok az şey biliyordum (https://www.slideshare.net/mobile/SharathRao6/lessons-from-integrating-machine-learning-models-into-data-products) . Proje için pek çok karar verdim, en iyisi iş arkadaşlarıma makine öğrenimi hakkında çok az bilgim olduğunu ve güçlü bir öğrenme arzusu olduğunu açık bir şekilde açıklamak. Onlara, ne kadar çok bilgi öğrenirsem o kadar çok yardımcı olabileceğimi temin ederim.

Bu çok iyi bir strateji haline geldi çünkü insanlar genellikle bilgilerini paylaşmayı severler, özellikle de birbirlerine nasıl öğreteceklerini bildiklerinde. Aşağıdaki örnekler, arkadaşlarımın rehberliği olmadan bu kadar hızlı öğrenemeyeceğimi gösteriyor:

  • Scikit-Learn iş akışı (Http: // scikit-learn. Org / stable / modules / generated / sklearn.pipeline.Pipeline.html) : Meslektaşım, kodlamamı daha modüler hale getirmek için Scikit-Learn iş akışını kullanmamı önerdi. Esasen bir iş akışı, eğitim ve puanlama (Puanlama) boyunca sabit olan bir dizi veri dönüşümünü tanımlar. Bu araç, kodlamamı daha net, daha kullanışlı ve diğer üretim modelleriyle daha uyumlu hale getiriyor.

  • Model teşhisi: Tahmin sorunumuzun zaman içerdiğini düşünen meslektaşım bana klasik çapraz doğrulama yönteminin işe yaramadığını, çünkü geçmişi doğrulamak için gelecekteki verileri kullanma riskimiz olduğunu söyledi. Daha iyi bir yöntem, çapraz doğrulamayı zamanlamaktır. (Https://robjhyndman.com/hyndsight/tscv/) Ayrıca, kaldırma tablosu gibi birçok farklı teşhis tekniği de öğrendim (https://www.analyticsvidhya.com/blog/2016/02/7-important-model -evaluation-error-metrics /), SMAPE gibi çeşitli değerlendirme matrisleri (https://en.m.wikipedia.org/wiki/Symmetric_mean_absolute_percentage_error).

  • Makine öğrenimi altyapısı: Bir makine öğrenimi altyapı mühendisinin yardımıyla, paketlerin birbirine bağımlılığını virtualenv'ler aracılığıyla nasıl yöneteceğimi ve dekapaj yoluyla modelleri nasıl serileştireceğimi (https://docs.python.org/3/library/pickle.html) öğrendim. Modelin puanlamada kullanılabilmesini sağlamak için Python UDF ( nasıl kullanılır. Bunların hepsi daha önce bilmediğim veri mühendisliği becerileridir.

Pek çok yeni kavram öğrendikten sonra, bunları yalnızca kendi projelerime uygulayamıyorum, aynı zamanda makine öğrenimi altyapı ekibiyle derinlemesine tartışmalar da yapabilirim, böylece veri bilimcileri için daha iyi makine öğrenimi araçları oluşturabilirler. Bu erdemli bir döngü oluşturdu, çünkü benimle paylaşılan bilgi daha iyi bir işbirlikçi olmamı sağladı.

Ne öğrendim: Uzun vadede, çoğu kendini kontrol etme problemi utanç için değil öğrenme fırsatları için kullanılır. Açıkça ve dürüstçe öğrenme arzunuzu gösterin ve sizi daha iyi ve daha yararlı hale getirin.

Öğretim ve sunum

Modelimi üretime daha fazla uygulayabilir hale geldikçe, sahip olduğum becerilerin çoğunun ekibimizdeki diğer veri bilimcileri için değerli olduğunu görüyorum. Birkaç yıldır lisans öğretmenliği yapıyorum ve öğretmenlik konusunda her zaman tutkulu oldum. Öğretmen olduğumda, bilginin kendisine daha aşina oldum. Nobel Ödülü sahibi ve mükemmel bir öğretmen (https://m.youtube.com/watch?v=0KmimDq4cSU), Richard Freeman öğretim konseptini şöyle açıkladı:

California Teknoloji Enstitüsü'ndeki bir öğretim üyesi, Richard Freeman'a bir parçacığın 1/2 spininin Fermi istatistiklerine uygun olduğunu nasıl açıklayacağını sorduğunda. Bu zorluğu kabul ettikten sonra, "Bunun hakkında, giriş seviyesinde bir ders hazırlayacağım" dedi. Ancak birkaç gün sonra eğitmene "Bunu gerçekten yapamam. Dersi giriş seviyesine kadar basitleştiremiyorum. Seviye. Bu, henüz tam olarak çözemediğimiz anlamına geliyor. "

Bu hikaye çok aydınlatıcı. Bir sorunu, başkalarının anlayabilmesi için özüne indirgeyemiyorsanız, o zaman henüz gerçekten anlamadığınız anlamına gelir. Öğretme ve öğrenme hakkındaki gerçeği öğrendikten sonra, modelimi kanıtlamak ve başkalarını modelimi denemeye teşvik etmek için fırsatlar ararım. Bu bir kazan-kazan durumudur, çünkü vaaz etme dikkati artırabilir, böylece ekipte kullanılabilir.

Eylül ayının sonunda, ben ve dahili Data University (https://medium.com/airbnb-engineering/how-airbnb-democratizes-data-science-with-data-university-3eccc71e073a) ekibimiz hakkında makine hakkında bir dizi hazırlamaya başladık Dahili araçları öğrenmek için dersler. Bunun nereye gideceğinden pek emin değilim, ancak Airbnb'de çalışırken daha fazla öğretim işi yapabildiğim için çok mutluyum.

Sonunda, Hadley Wickham'ın (https: // mobile. Twitter.com/hadleywickham) Twitter'daki gönderisiyle özetledim:

(Https://mobile.twitter.com/hadleywickham/status/890107458219368448)

Ne öğrendim: Öğretim, bilgi anlayışınızı test etmenin ve becerilerinizi geliştirmenin en etkili yoludur. Değerli bir şey öğrendiğinizde bunu başkalarıyla paylaşmayı unutmayın. Her zaman yeni bir yazılım oluşturmayı düşünmek zorunda değilsiniz. Mevcut araçların nasıl çalıştığını açıklamak da değerlidir.

K adımında, K + 1 adımını düşünün

Başından beri sadece kendi görevlerime odaklandım ve daha sonra makine öğrenimi altyapı ekibiyle çalıştım ve ardından diğer veri bilimcilerinin makine öğrenimi araçları hakkında daha fazla bilgi edinmesine yardımcı oldum.Proje alanım önceki birkaç ayla karşılaştırıldığı için çok mutluydum. Çok genişledi. İlk başta bunun olmasını beklemediğimi kabul ediyorum.

Geri dönüp proje geliştirme sürecini düşündüğümde, önceki projelerimden bir farkım, mevcut durumdan her zaman biraz memnun kalmam ve her zaman daha iyi olmayı umuyorum. Claude Shannonun makalesi (https://medium.com/the-mission/a-genius-explains-how-to-be-creative-claude-shannons-long-lost-1952-speech-fbbcb2ebe07f) bu noktayı en iyi şekilde göstermektedir :

Resim kaynağı: Oynayan Bir Akıl: Claude Shannon Bilgi Sayfası kapağını nasıl icat etti

"Denen bir zihniyet var hiç bir zaman tatmin olamayan . Dünyayla ilgili karamsar bir tatminsizlikten bahsetmiyorum, bunu da istemiyorum. Yapıcı bir tatminsizlikten bahsediyorum. Memnuniyetsizlik kelimelerle ifade edilebilir, bu iyi, ama bence işler daha iyi yapılabilir. Daha özlü bir yöntem olmalı. İşler kesinlikle geliştirilebilir. Başka bir deyişle, işler o kadar mükemmel görünmediğinde, her zaman hafif bir öfke vardır. Statükodan memnuniyetsizliğin iyi bilim adamları için önemli bir itici güç olduğunu düşünüyorum. "

Kıdemli bir veri bilimcisi unvanına sahip olmama rağmen, hala nitelikli bir bilim insanı değilim. Ancak bu tür bir tatminsizliğin bir kişinin projenin etkisini genişletip genişletemeyeceğini belirleyebileceğine inanıyorum. Proje boyunca, K adımındayken, doğal olarak K + 1 adımını nasıl yapacağımı düşünmeye başlardım. ve:

  • "Nasıl modelleyeceğimi bilmiyorum, keşfetmeme izin verin" den "Aracın optimize edilebileceğini düşünüyorum, bu benim düşüncelerimin, aracın nasıl optimize edileceğine dair bazı öneriler ve geri bildirimlerimin bir sonucu" na kadar, kendimi bir müşteriden dönüştürdüm Makine öğrenimi altyapı ekibinin bir ortak çalışanı olun.

  • "İzin verin bu araçları, onları yetkin bir şekilde çalıştırabilmem için öğrenmeme izin verin" den "Makine öğrenimiyle ilgilenen daha fazla veri bilimcisinin bu araçları kullanabilmesi için bu araçları değiştirmemize izin verin" e, kendimi bir ortak çalışandan dönüştürdüm Bir propagandacı olun.

Bu düşünme şeklini son derece yararlı buluyorum. Sebatınızı artırmak için iyi zevkinizi ve memnuniyetsizliğinizi kullanın. Başka bir deyişle, bu tür bir tatminsizliğin basit bir havadan yaratılabileceğini düşünmüyorum, sadece ilgilendiğiniz konuları ele alma sürecinden kaynaklanabilir.

Ne öğrendim: Bir proje için mücadele ederken, iç memnuniyetsizliğinize dikkat edin. Becerilerinizi geliştirmenin ve projeyi daha yüksek bir seviyeye yükseltmenin sırrı budur.

Düşünmenin reddi: siz ve işiniz

Geçenlerde yanlışlıkla Richard Hamming'den (https://en.m.wikipedia.org/wiki/Richard_Hamming) bir konferans duydum. Richard Hamming, Hamming kodu ve Hamming mesafesi gibi birçok bilimsel katkısı olan tanınmış bir matematikçidir. Ders başlığı "Siz ve Araştırmanız" dır (https://m.youtube.com/watch?v=a1zDuOPkM

Sw), ancak Richard Hamming, başlığın da adlandırılabileceğini söyledi "Sen ve kariyerin" .

Hikayesini paylaştığında aklıma birkaç düşünce geldi:

"Yaptığınız şey önemli değilse ve gelecekte önemli olmayacaksa, o zaman neden hala bunları yapıyorsunuz? Önemli şeyler yapmanız gerekiyor. Uzun yıllar Cuma öğleden sonra alanımda ne olduğunu düşüneceğim Sorun önemli, tüm çalışma zamanımın% 10'unu oluşturuyor. "

Size önemli konuları hatırlatmama izin verin. Önemli sonuç değil, bazı sorunlar önemli değil çünkü başkaları tarafından eleştirilmiyorsunuz. Sorunun önemli olup olmadığı büyük ölçüde sorunu çözmek için bir yolunuzun olup olmamasına bağlıdır.

"Sana anlatmaya çalışıyorum Stil ve tat Bunun gerçeği, birazcık hissedebilmeniz için sorunun ne zaman doğru olduğunu, hangi sorunun doğru olduğunu ve sorunun nasıl çözüleceğini bilin. En önemli şey doğru problemi doğru zamanda doğru şekilde çözmektir ve diğer her şey göz ardı edilebilir. "

Dr. Hamming önemden bahsettiğinde, bu Kişiden kişiye değişir nın-nin. Onun için bilimsel konular çok önemli. Çoğumuz için başka konular önemli olabilir. Eleştirinin öneminden de bahsetti. Eleştirecek fikriniz bile yoksa, sonuç ne kadar büyük olursa olsun, sorun önemli değildir. Son olarak bir şeyler yapmak için kendi tarzını ve zevkini kullanması gerektiğinden de bahsetti.

Bir şeyler yapma konusunda yüksek bir standardı var, ancak peşinden gitmeye değer. Kendi önemli probleminizi bulduğunuzda, doğal olarak onu iyi yapmak ve daha etkili hale getirmek isteyeceksiniz. Başkalarına bunun ne kadar önemli olduğunu anlatmaya çalışacak ve kendi bilgi sisteminizi oluşturmak için harika insanlardan öğrenmek için zaman ayıracaksınız.

Mücadelenizde hangi konular sizin için önemli?

Orijinal bağlantı:

https://medium.com/@rchang/advice-for-new-and-junior-data-scientists-2ab02396cf5b

Orjinal başlık:

Yeni ve Genç Veri Bilimciler İçin Tavsiyeler ---- Birkaç Yıl Önce Kendime Söylediklerim

I.Dünya Savaşı'nda yüz yıllık zafer Cesurların marifeti: Çinli işçiler sanat eserlerine deniz kabukları kazdılar
önceki
İtalyan Çin Fotoğraf Derneği üyesi Wang Hui, 13. İtalyan Ulusal Sanat Ödülü'nü kazandı.
Sonraki
GIF-Daegu AFC, Evergrande'nin savunma hattını 2-0 mağlup etti, Güney Koreli hayranlar çılgınlığı kutladı!
Münhasır Öneri sisteminin bilgi sistemini anlamak için bir makale (konsept, yapı, algoritma)
Bahar Şenliği için olmazsa olmaz bir atıştırmalık, öğrenmek için 2 dakika, tatlı ve yumuşak, satın alınandan daha iyi
İngiliz hükümeti: Dünya AI gücü oluşturmak için 18 öneri (rapor indirilerek)
Anneler Günü Özel | Bir kadının kalbinin kalbindeki akupunktur iğneleri, bu teknoloji ürünleri "anneler" göndermeye haklıdır
Diğer programcıların nasıl itiraf ettiğini görün! (Öğretici ile ~)
Özel Tek bir makalede entegre öğrenme (öğrenme kaynakları ile)
Özel Size kendi veri kümenizi oluşturmak için Scrapy'yi kullanmayı öğretin
The New York Times: 2016'nın en unutulmaz bilim haberleri
Bugün, Bai Yansong, Mulan Dağı Maratonuna katıldı.
Manyetik Rezonans Plak Görüntülemenin Özel Teknik Ar-Ge, Durumları ve Veri Zorlukları
Sıcak kış güneşini hissedin 2018 Panzhihua Mutlu Güneş Festivali 28 Kasım'da başlıyor
To Top