Veri bilimi uzmanı olmak ister misiniz? Blog yazmakla başlamalısınız (bağlantıyla)

Kaynak: Uzmanlık

Yazar: William Koehrsen

Bu makale var 3100 Word, önerilen okuma 9 dakika.

Bu makale, fırsatları yaratmak, size temel iletişim uygulamaları sunmak ve geri bildirim yoluyla sizi daha iyi bir veri bilimcisi yapmak için yazmayı nasıl kullanacağınızı öğretir.

Son kodu GitHub'a yükledikten veya görevinizi gönderdikten sonra, bir veri bilimi projesini "tamamlandı" olarak adlandırmak kolay olabilir. Ancak, burada durursanız, süreçteki en kritik adımı kaçıracaksınız: projeniz hakkında bir makale yazmak ve paylaşmak. Blog oluşturma genellikle veri bilimi hattının bir parçası olarak kabul edilmez, ancak işinizden en iyi şekilde yararlanmak için, projelerinizden herhangi biri için standardın son adımı olmalıdır.

Çalışmanız hakkında basit bir blog yazısı yazmanın üç avantajı vardır:

  • İletişim pratiği: Tek başına iyi kod yeterli değildir. İnsanların bu işe dikkat etmesini sağlayamazsanız, makalede herhangi bir kalite analizi beklerseniz hiçbir etkiniz olmayacaktır.
  • Yazmak fırsatlar yaratır: Çalışmanızı dünyaya göstererek, bağlantılar kurabilecek ve iş fırsatları, işbirlikleri ve yeni proje fikirleri elde edebileceksiniz.
  • Geri bildirim: Sizi iyileştirmenin döngüsel yolu şudur: işinizi yapın, paylaşın, yapıcı eleştiriyi dinleyin, işinizi geliştirin, tekrarlayın.

Yazma, egzersiz ve eğitime benzer faaliyetlerden biridir.Kısa vadede geri dönüş olmayabilir, ancak uzun vadede neredeyse sınırsız potansiyel getiriler vardır. Her gün alınan blog yazılarımın 10.000 görüntülemesinden 0 $ alıyorum ve her makaleyi yazmak 3 ila 15 saat sürüyor. Ancak makalem olmasaydı, tam zamanlı bir veri bilimi işim olmazdı.

Ayrıca veri bilimi çalışmalarımın kalitesinin çok daha yüksek olduğunu biliyorum, bir yandan bu makaleyi yazmak niyetindeyim, diğer yandan daha önce aldığım geri bildirimleri kullandığım ve yazmaktan uzun vadeli olumlu kazandığım için Dönüş.

İletişim: iyi kod yeterli değildir

Bir his biliyorum: GitHub'a bazı Jupyter Not Defterleri veya komut dosyaları yüklediniz ve durup şunu söylemek istiyorsunuz: "Bu çalışmayı ben yaptım ve şimdi başkalarının keşfetmesine izin vereceğim." Bu yalnızca birinde olabilir İdeal dünyada, ancak gerçek dünyada, projenizin farkedilmesi için, çalışmalarınızın sonuçlarını açıkça iletmeniz gerekir.

GitHub'daki en iyi çalışmalar otomatik olarak ortaya çıkarsa harika olurdu, ancak gerçekte iyi iletişim yöntemleri en etkili olanıdır.

GitHub'da en son ne zaman bir proje kodu tabanı bulduğunuzu düşünün: eğer benim gibiyseniz, o zaman bir proje hakkında ilginç bir makale okursunuz ve sonra kodu okursunuz. İnsanlar bir makaleden diğerine geçerler çünkü önce kodu kontrol etmek için ikna edici bir nedene ihtiyaç duyarlar. Bu alaycı olmak anlamına gelmez, sadece işler böyle yürür: İnsanlar ne yaptığınızı ve neden önemli / ilginç olduğunu anlayana kadar analizinize derinlemesine girmeyecekler.

Gerçek bir örnek vermek gerekirse, veri analizi depom, çoğu çok kaba kodlarla yazılmış birçok veri bilimi projesinin bir koleksiyonudur. Ancak bu projelerden bazıları hakkında birkaç makale yazdığım için 600'den fazla yıldızı var. Yıldızların sayısı etkiyi ölçmek için iyi bir yol olmasa da, insanların bu kodu kullandığı ve ondan değer elde ettiği açıktır. Ancak birkaç gün önce, kodu yazdığım her şeyden daha iyi olan Bayes Kombinatoryal Yapının Optimizasyonu'na (BOCS) rastladığımda, sadece 2 yıldıza sahip olduğunu görünce şaşırdım. Tıpkı büyük fikirlerin tek başına ölmesi gibi, sonuçların ikna edici bir şekilde iletilmesi olmadan en iyi kod yok sayılacaktır.

Analiz ancak açıklanırsa değerlidir

Analizin değeri, kullanılan en iyi algoritmayla veya en çok veriyle orantılı değil, sonuçları kullanıcıların çoğunluğuyla nasıl paylaştığınızla orantılıdır. 1854'te John Snow, Londra'daki kolera salgınını yavaşlatmaya yardımcı olmak için 578 veri noktası, halka açık bir makale ve bir nokta haritası kullandı. Sonuçları bir deftere saklamadı, ancak insanların onları keşfetmesini istedi. Çalışmalarını yayınladı ve kolayca erişilebilir hale getirdi.

John Snow'un Londra kolera salgını haritası. (kaynak)

Son olarak, kasaba üyelerini koleranın yayılmasını önlemek için bir su pompasını devre dışı bırakmaya ve bilimsel verilerin amacına ulaşmaya ikna etti: daha iyi gerçek dünya kararları vermek için verileri kullanmak.

Bir blog yazısı yazmak, veri biliminin en kritik bölümlerinden birini uygulamanıza olanak tanır: çalışmanızı geniş bir kitleye iletmek. İyi kod ve kapsamlı analiz iyi bir başlangıçtır, ancak projenizi tamamlamak için onu ilgi çekici bir anlatıyla bağlamanız gerekir. Bir makale, sonuçlarınızı açıklamak ve insanların tüm sıkı çalışmalarınızı önemsemelerini sağlamak için mükemmel bir ortamdır.

Fırsat: Yazmak kapıyı açar

Veri bilimi işe alımda diğer alanlardan daha objektif olabilse de, bir iş bulmak, bildiğinize değil, esas olarak kimi tanıdığınıza veya sizi kimin tanıdığına bağlıdır. Üniversiteye gitmenin bütün amacı (burada biraz abartılı) kariyerinizde ne kullanacağınızı öğrenmek değil. İnsanları tanımak ve istediğiniz kariyer alanında bağlantılar kurmakla ilgilidir.

Neyse ki, mevcut veri bilimi alanında üniversiteye gitmek faydalı olsa da gerekli değildir. Bloglar aracılığıyla çevrimiçi olarak binlerce kişiyle iletişim kurma becerisiyle, bu önemli bağlantıları yazarak ve paylaşarak kurabilir, herhangi bir öğrenim ücreti olmadan kapıyı açabilirsiniz. Projenizi halka açık bir forumda yazdığınızda, fırsatlar elde edebilirsiniz ve bu fırsatlar yalnızca çalışmanızı göndermenizden kaynaklanmaz.

Gittiğim üniversite makine mühendisliği ana dalıydı.Okulda veri bilimi alanında herhangi bir bağlantı kurmadım (herhangi bir yararlı beceriyi öğrenmekten bahsetmiyorum bile). Ancak, geçen dönem yazmaya başladım, bu yüzden potansiyel işverenler, işbirlikçiler ve hatta kitap editörleriyle sayısız ilişki kurabildim.Bu ilişkiler, veri bilimi kariyerime başladığımda çok yardımcı oldu.

İlk noktaya geri dönersek, kodum diğer birçok veri bilimcininkinden çok daha düşük, ancak fırsat bulduğum için şanslıydım çünkü işimi daha erişilebilir hale getirebildim.

Benimle hiç bireysel olarak iletişime geçmedim Birisi beni GitHub'da buldu, ancak makalemi okuyan kişilerden yüzlerce kez iletişim aldım.

Ve patronum Feature Labs GitHub çalışmamı buldu, ancak GitHub'da "harika veri bilimi analizi" arayarak bulamadı. Bunun yerine, tamamlanmış bir projeyi detaylandırdığım ve bu sonuçları özetlediğim yazdığım bir makale aracılığıyla oldu. Unutmayın, bu bir kod bölümü değil, kodla ilgili bir makale.

Bir blog yazısı, şunları gösterdiği için önemli bağlantılar kurmak için harika bir araçtır:

  • İyi bir veri bilimi işi yaptınız;
  • Paylaşmayı ve başkalarına öğretmeyi önemsiyorsunuz.

Veri bilimine olan aşırı heves, bir iş için gerekli bir koşul değildir. Ancak bu alanla ilgilendiğinizi ve öğrenmeyi göstermek, özellikle yeni başlıyorsanız ve çok fazla deneyime sahip değilseniz, işverenlerin ilgisini çekmeye yardımcı olacaktır. Dahası, iyi yazılmış blog yazıları uzun bir raf ömrüne sahip olabilir ve bu da size önümüzdeki birkaç yıl için bir portföy sağlar.

Şu anda veri bilimi çalışmalarına giden bir yol yok, bu da hepimizin kendi işlerimizi kurmamız gerektiği anlamına geliyor. Toplulukla yazmak ve paylaşmak, tüm önemli bağlantıları kurmanıza ve bu alanda bir yer edinmenize yardımcı olabilir.

Geri bildirim: çalışın, paylaşın, dinleyin, geliştirin, tekrarlayın

Yeni bir alan olarak, veri biliminde birkaç standart yanıt vardır. Öğrenmenin en iyi yolu bir şeyler denemek, hata yapmak ve onlardan ders almaktır. Çalışmanızı herkese açık hale getirmek, toplu deneyime sahip binlerce veri bilimcisinden geri bildirim alabileceğiniz anlamına gelir. Bu, bir topluluğun parçası olmanın faydasıdır: Kısacası, herkesten daha fazlasını biliyoruz ve topluluğun bir üyesi olarak, bu bilgiyi kullanabilir ve kendi işinizi geliştirmek için geri bildirimlerden yararlanabilirsiniz.

İnternette geri bildirimi işlemek zor olabilir, ancak veri bilimi topluluğunun, özellikle de Ortamda Veri Bilimine Doğru çok medeni olduğunu görüyorum. Yorumları ele alma stratejim:

  • Olumlu yorumlar: teşekkür.
  • Yapıcı eleştiri: Yorumları yazın, mevcut analizin düzeltilebilecek herhangi bir bölümünü düzeltin ve mümkün olduğunca gelecekteki projelerde önerileri uygulayın.
  • Yapıcı olmayan eleştiri: göz ardı etmek.

Ne yazık ki, genellikle kendi çalışmamızı gözden geçirmek için zaman ayırmıyoruz, ancak neyse ki, Dünyayla paylaşabilir ve başkalarının çalışmalarımızı incelemesine izin verebiliriz. Bu insanlar işimize bizden daha dürüst olabilirler, bu yüzden paylaşarak daha objektif bir değerlendirme elde ederiz.

Kursun en değerli kısmı hiçbir şekilde içerik değil, size atanan hocadan aldığınız geri bildirimlerdir. Neyse ki, projenizi herhangi bir ders almadan bir blog gönderisinde veri bilimi topluluğu ile herkese açık olarak paylaşabilirsiniz.

Okul bize başarısızlıktan kaçınmayı öğretirse de, yalnızca tekrarlanan başarısızlıklar ve sürekli iyileştirme yoluyla daha iyi olacağız. Hiç şüphe yok ki daha iyi bir yazar ve veri bilimciyim, çünkü çalışmalarımı kamuoyuna açıkladım ve eleştirileri kabul ettim ve geri bildirimleri dinledim.

Nasıl yapılır?

Şimdi, iyi makaleler yazmak için bir ila bir düzine Jupyternotebook'unuz olabilir ve bunlardan birini yazıp blogunuza koymak için bir veya iki saatinizi harcayabilirsiniz. Mutlaka mükemmel değildir: Veri bilimi çalışması yaptığınız sürece insanlar makalenize saygı duyacaktır.

Kusurlu olan herhangi bir şeyi yayınlamak sizin için zorsa (benim en büyük sorunumdan biri), bir zaman sınırı belirleyin, 60 dakika diyelim 60 dakikada ne başarırsanız başarın, yayınlamalısınız. Bunu birkaç kez yaptım ve işimi daha anlamlı ve verimli hale getiriyor.

Şimdi bir Jupyternotebook çıkarın ve bir makale yazın. Medyaya koyun ve topluluğun çalışmanızı görmesine izin verin. Geri dönüş anında gerçekleşmese de faydalar zamanla artacaktır:

  • Temel iletişim görevlerini tamamlamada daha iyi olacaksınız
  • Fırsat / kişi açılacak
  • Yapıcı eleştiriye dayalı olarak, veri bilimi çalışmanız ve yazmanız geliştirilecektir.

Veri bilimi projeniz üzerinde çalışmaya devam edin, ancak kod GitHub'a yüklendiğinde veya gönderildiğinde durmayın. Son adımı atın ve bir makale yazın. Gelecekteki benliğiniz size teşekkür edecek!

Referans bağlantısı:

https://github.com/WillKoehrsen/Data-Analysis

https://github.com/baptistar/BOCS

https://medium.com/key-lessons-from-books/the-key-lessons-from-where-good-ideas-come-from-by-steven-johnson-1798e11becdb

https://en.wikipedia.org/wiki/John_Snow

https://en.wikipedia.org/wiki/1854_Broad_Street_cholera_outbreak

https://upload.wikimedia.org/wikipedia/commons/thumb/2/27/Snow-cholera-map-1.jpg/1024px-Snow-cholera-map-1.jpg

https://www.featurelabs.com/

Orijinal bağlantı:

https://towardsdatascience.com/the-most-important-part-of-a-data-science-project-is-writing-a-blog-post-50715f37833a

Dünyanın en büyük bitmemiş projesi Dubai "Dünya Adası": 15 yıllık inşaatın maliyeti 80 milyar alıcı intihar etti
önceki
CCTV bu gece Almanya VS Hollanda'nın odağını yayınlayacak Van Dijk, Neuer'in golünü üst üste dört kez kırabilecek mi?
Sonraki
Batı Süper Kupası: Cristiano Ronaldo gol attı + kırmızı Real Madrid ilk maçında 3-1 Barcelona! Juventus 2-3 Sinirli Süper Kupa
Beşeri Bilimler Qilu | Lao O stand-up komedisi "Picture Friends", Qilu Üniversitesi Çin Bölümü'nde gülüyor
Koleksiyon 15 CNN anahtar cevabından oluşan bir koleksiyon, 2019 okul işe alım görüşmeleri için bir zorunluluktur!
Avrupa elemeleri şok edici bir üzüntü yaşadı: dünyanın 182.'si ilk olarak kazanır, arazi alanı Haidian Bölgesi kadar büyük değildir!
Neymar'ın Paris'teki ilk maçı 1 gol ve 1 asist sunuyor! Grand Paris 3-0 kazandı! Lukaku 2 gol Manchester United 4-0
8 yaşındaki kız ortadan kayboldu ve eksik bilgiler şehirde büyük bir aramayı tetikledi.
Milli takım arka arkaya 5 maç + birinci olarak aktif serviste gol attı, Real Madrid kaptanı en çok gol atan defans oyuncusu!
Collection 12 ggplot2 genişletme programları, R görselleştirmeyi güçlendirmenize yardımcı olur
Entelektüel yardımı gerçekleştiren "Sichuan Eyaleti Uzman Hizmet Ekibinin kıdemli uzmanı" Gongjing'e yürüdü
Airbnb Veri Ekibi Başkanı: Bir veri bilimcinin işi üçe nasıl bölünür?
İnanılmaz! 60 yaşında bir adam ginkgo biloba yapraklarına karidesler çizdi. Ziyaretçiler için yüzlerce parça çizildi
36 yaşındaki iblis, 3048 gün sonra tekrar İtalya'da forma giydi. Lippi, seçilen son teknik direktördü!
To Top