Kaynak: Uzmanlık
Yazar: William Koehrsen
Bu makale var 3100 Word, önerilen okuma 9 dakika.
Bu makale, fırsatları yaratmak, size temel iletişim uygulamaları sunmak ve geri bildirim yoluyla sizi daha iyi bir veri bilimcisi yapmak için yazmayı nasıl kullanacağınızı öğretir.
Son kodu GitHub'a yükledikten veya görevinizi gönderdikten sonra, bir veri bilimi projesini "tamamlandı" olarak adlandırmak kolay olabilir. Ancak, burada durursanız, süreçteki en kritik adımı kaçıracaksınız: projeniz hakkında bir makale yazmak ve paylaşmak. Blog oluşturma genellikle veri bilimi hattının bir parçası olarak kabul edilmez, ancak işinizden en iyi şekilde yararlanmak için, projelerinizden herhangi biri için standardın son adımı olmalıdır.
Çalışmanız hakkında basit bir blog yazısı yazmanın üç avantajı vardır:
Yazma, egzersiz ve eğitime benzer faaliyetlerden biridir.Kısa vadede geri dönüş olmayabilir, ancak uzun vadede neredeyse sınırsız potansiyel getiriler vardır. Her gün alınan blog yazılarımın 10.000 görüntülemesinden 0 $ alıyorum ve her makaleyi yazmak 3 ila 15 saat sürüyor. Ancak makalem olmasaydı, tam zamanlı bir veri bilimi işim olmazdı.
Ayrıca veri bilimi çalışmalarımın kalitesinin çok daha yüksek olduğunu biliyorum, bir yandan bu makaleyi yazmak niyetindeyim, diğer yandan daha önce aldığım geri bildirimleri kullandığım ve yazmaktan uzun vadeli olumlu kazandığım için Dönüş.
İletişim: iyi kod yeterli değildir
Bir his biliyorum: GitHub'a bazı Jupyter Not Defterleri veya komut dosyaları yüklediniz ve durup şunu söylemek istiyorsunuz: "Bu çalışmayı ben yaptım ve şimdi başkalarının keşfetmesine izin vereceğim." Bu yalnızca birinde olabilir İdeal dünyada, ancak gerçek dünyada, projenizin farkedilmesi için, çalışmalarınızın sonuçlarını açıkça iletmeniz gerekir.
GitHub'daki en iyi çalışmalar otomatik olarak ortaya çıkarsa harika olurdu, ancak gerçekte iyi iletişim yöntemleri en etkili olanıdır.
GitHub'da en son ne zaman bir proje kodu tabanı bulduğunuzu düşünün: eğer benim gibiyseniz, o zaman bir proje hakkında ilginç bir makale okursunuz ve sonra kodu okursunuz. İnsanlar bir makaleden diğerine geçerler çünkü önce kodu kontrol etmek için ikna edici bir nedene ihtiyaç duyarlar. Bu alaycı olmak anlamına gelmez, sadece işler böyle yürür: İnsanlar ne yaptığınızı ve neden önemli / ilginç olduğunu anlayana kadar analizinize derinlemesine girmeyecekler.
Gerçek bir örnek vermek gerekirse, veri analizi depom, çoğu çok kaba kodlarla yazılmış birçok veri bilimi projesinin bir koleksiyonudur. Ancak bu projelerden bazıları hakkında birkaç makale yazdığım için 600'den fazla yıldızı var. Yıldızların sayısı etkiyi ölçmek için iyi bir yol olmasa da, insanların bu kodu kullandığı ve ondan değer elde ettiği açıktır. Ancak birkaç gün önce, kodu yazdığım her şeyden daha iyi olan Bayes Kombinatoryal Yapının Optimizasyonu'na (BOCS) rastladığımda, sadece 2 yıldıza sahip olduğunu görünce şaşırdım. Tıpkı büyük fikirlerin tek başına ölmesi gibi, sonuçların ikna edici bir şekilde iletilmesi olmadan en iyi kod yok sayılacaktır.
Analiz ancak açıklanırsa değerlidir
Analizin değeri, kullanılan en iyi algoritmayla veya en çok veriyle orantılı değil, sonuçları kullanıcıların çoğunluğuyla nasıl paylaştığınızla orantılıdır. 1854'te John Snow, Londra'daki kolera salgınını yavaşlatmaya yardımcı olmak için 578 veri noktası, halka açık bir makale ve bir nokta haritası kullandı. Sonuçları bir deftere saklamadı, ancak insanların onları keşfetmesini istedi. Çalışmalarını yayınladı ve kolayca erişilebilir hale getirdi.
John Snow'un Londra kolera salgını haritası. (kaynak)
Son olarak, kasaba üyelerini koleranın yayılmasını önlemek için bir su pompasını devre dışı bırakmaya ve bilimsel verilerin amacına ulaşmaya ikna etti: daha iyi gerçek dünya kararları vermek için verileri kullanmak.
Bir blog yazısı yazmak, veri biliminin en kritik bölümlerinden birini uygulamanıza olanak tanır: çalışmanızı geniş bir kitleye iletmek. İyi kod ve kapsamlı analiz iyi bir başlangıçtır, ancak projenizi tamamlamak için onu ilgi çekici bir anlatıyla bağlamanız gerekir. Bir makale, sonuçlarınızı açıklamak ve insanların tüm sıkı çalışmalarınızı önemsemelerini sağlamak için mükemmel bir ortamdır.
Fırsat: Yazmak kapıyı açar
Veri bilimi işe alımda diğer alanlardan daha objektif olabilse de, bir iş bulmak, bildiğinize değil, esas olarak kimi tanıdığınıza veya sizi kimin tanıdığına bağlıdır. Üniversiteye gitmenin bütün amacı (burada biraz abartılı) kariyerinizde ne kullanacağınızı öğrenmek değil. İnsanları tanımak ve istediğiniz kariyer alanında bağlantılar kurmakla ilgilidir.
Neyse ki, mevcut veri bilimi alanında üniversiteye gitmek faydalı olsa da gerekli değildir. Bloglar aracılığıyla çevrimiçi olarak binlerce kişiyle iletişim kurma becerisiyle, bu önemli bağlantıları yazarak ve paylaşarak kurabilir, herhangi bir öğrenim ücreti olmadan kapıyı açabilirsiniz. Projenizi halka açık bir forumda yazdığınızda, fırsatlar elde edebilirsiniz ve bu fırsatlar yalnızca çalışmanızı göndermenizden kaynaklanmaz.
Gittiğim üniversite makine mühendisliği ana dalıydı.Okulda veri bilimi alanında herhangi bir bağlantı kurmadım (herhangi bir yararlı beceriyi öğrenmekten bahsetmiyorum bile). Ancak, geçen dönem yazmaya başladım, bu yüzden potansiyel işverenler, işbirlikçiler ve hatta kitap editörleriyle sayısız ilişki kurabildim.Bu ilişkiler, veri bilimi kariyerime başladığımda çok yardımcı oldu.
İlk noktaya geri dönersek, kodum diğer birçok veri bilimcininkinden çok daha düşük, ancak fırsat bulduğum için şanslıydım çünkü işimi daha erişilebilir hale getirebildim.
Benimle hiç bireysel olarak iletişime geçmedim Birisi beni GitHub'da buldu, ancak makalemi okuyan kişilerden yüzlerce kez iletişim aldım.
Ve patronum Feature Labs GitHub çalışmamı buldu, ancak GitHub'da "harika veri bilimi analizi" arayarak bulamadı. Bunun yerine, tamamlanmış bir projeyi detaylandırdığım ve bu sonuçları özetlediğim yazdığım bir makale aracılığıyla oldu. Unutmayın, bu bir kod bölümü değil, kodla ilgili bir makale.
Bir blog yazısı, şunları gösterdiği için önemli bağlantılar kurmak için harika bir araçtır:
Veri bilimine olan aşırı heves, bir iş için gerekli bir koşul değildir. Ancak bu alanla ilgilendiğinizi ve öğrenmeyi göstermek, özellikle yeni başlıyorsanız ve çok fazla deneyime sahip değilseniz, işverenlerin ilgisini çekmeye yardımcı olacaktır. Dahası, iyi yazılmış blog yazıları uzun bir raf ömrüne sahip olabilir ve bu da size önümüzdeki birkaç yıl için bir portföy sağlar.
Şu anda veri bilimi çalışmalarına giden bir yol yok, bu da hepimizin kendi işlerimizi kurmamız gerektiği anlamına geliyor. Toplulukla yazmak ve paylaşmak, tüm önemli bağlantıları kurmanıza ve bu alanda bir yer edinmenize yardımcı olabilir.
Geri bildirim: çalışın, paylaşın, dinleyin, geliştirin, tekrarlayın
Yeni bir alan olarak, veri biliminde birkaç standart yanıt vardır. Öğrenmenin en iyi yolu bir şeyler denemek, hata yapmak ve onlardan ders almaktır. Çalışmanızı herkese açık hale getirmek, toplu deneyime sahip binlerce veri bilimcisinden geri bildirim alabileceğiniz anlamına gelir. Bu, bir topluluğun parçası olmanın faydasıdır: Kısacası, herkesten daha fazlasını biliyoruz ve topluluğun bir üyesi olarak, bu bilgiyi kullanabilir ve kendi işinizi geliştirmek için geri bildirimlerden yararlanabilirsiniz.
İnternette geri bildirimi işlemek zor olabilir, ancak veri bilimi topluluğunun, özellikle de Ortamda Veri Bilimine Doğru çok medeni olduğunu görüyorum. Yorumları ele alma stratejim:
Ne yazık ki, genellikle kendi çalışmamızı gözden geçirmek için zaman ayırmıyoruz, ancak neyse ki, Dünyayla paylaşabilir ve başkalarının çalışmalarımızı incelemesine izin verebiliriz. Bu insanlar işimize bizden daha dürüst olabilirler, bu yüzden paylaşarak daha objektif bir değerlendirme elde ederiz.
Kursun en değerli kısmı hiçbir şekilde içerik değil, size atanan hocadan aldığınız geri bildirimlerdir. Neyse ki, projenizi herhangi bir ders almadan bir blog gönderisinde veri bilimi topluluğu ile herkese açık olarak paylaşabilirsiniz.
Okul bize başarısızlıktan kaçınmayı öğretirse de, yalnızca tekrarlanan başarısızlıklar ve sürekli iyileştirme yoluyla daha iyi olacağız. Hiç şüphe yok ki daha iyi bir yazar ve veri bilimciyim, çünkü çalışmalarımı kamuoyuna açıkladım ve eleştirileri kabul ettim ve geri bildirimleri dinledim.
Nasıl yapılır?
Şimdi, iyi makaleler yazmak için bir ila bir düzine Jupyternotebook'unuz olabilir ve bunlardan birini yazıp blogunuza koymak için bir veya iki saatinizi harcayabilirsiniz. Mutlaka mükemmel değildir: Veri bilimi çalışması yaptığınız sürece insanlar makalenize saygı duyacaktır.
Kusurlu olan herhangi bir şeyi yayınlamak sizin için zorsa (benim en büyük sorunumdan biri), bir zaman sınırı belirleyin, 60 dakika diyelim 60 dakikada ne başarırsanız başarın, yayınlamalısınız. Bunu birkaç kez yaptım ve işimi daha anlamlı ve verimli hale getiriyor.
Şimdi bir Jupyternotebook çıkarın ve bir makale yazın. Medyaya koyun ve topluluğun çalışmanızı görmesine izin verin. Geri dönüş anında gerçekleşmese de faydalar zamanla artacaktır:
Veri bilimi projeniz üzerinde çalışmaya devam edin, ancak kod GitHub'a yüklendiğinde veya gönderildiğinde durmayın. Son adımı atın ve bir makale yazın. Gelecekteki benliğiniz size teşekkür edecek!
Referans bağlantısı:
https://github.com/WillKoehrsen/Data-Analysis
https://github.com/baptistar/BOCS
https://medium.com/key-lessons-from-books/the-key-lessons-from-where-good-ideas-come-from-by-steven-johnson-1798e11becdb
https://en.wikipedia.org/wiki/John_Snow
https://en.wikipedia.org/wiki/1854_Broad_Street_cholera_outbreak
https://upload.wikimedia.org/wikipedia/commons/thumb/2/27/Snow-cholera-map-1.jpg/1024px-Snow-cholera-map-1.jpg
https://www.featurelabs.com/
Orijinal bağlantı:
https://towardsdatascience.com/the-most-important-part-of-a-data-science-project-is-writing-a-blog-post-50715f37833a