Veri bilimi endüstrisinde, iş reddinin nedenleri aslında bunlar

Tam metin 3713 Kelimeler, tahmini öğrenme süresi 7 dakika

Veri bilimi endüstrisinde bir yer bulmak isteyen birçok kişi bu sorunu yavaş yavaş fark ediyor: Veri bilimi alanında iş arama veya görüşme geri bildirimi almak temelde imkansız.

Resim kaynağı: unsplash.com/@kentreloar

İnternet şirketleri pek çok nedenden ötürü bu bilgilere sıkı sıkıya bağlıdır. Birincisi, firmanın reddine dair verdiği her sebep, yasal takibata yol açabilir. İkincisi, birçok insan olumsuz haberleri iyi sindiremez ve hatta bazı insanlar çok aşırı hale gelir. Üçüncüsü, eğer bunu yapmak istiyorsanız, görüşmecinin düzinelerce hatta yüzlerce başvuru sahibine iyi tasarlanmış bir geri bildirim yazmasının ne kadar sürdüğünü düşünün. Ayrıca şirket bundan herhangi bir fayda sağlamadı.

Sonuç olarak, kafası karışan, kafası karışan ve bir şeyler başarmak isteyen çok sayıda veri bilimcisi var. Ancak iyi haber şu ki, bu sektörde işin reddedilmesi için aslında sadece birkaç neden var ve bu eksiklikleri telafi etmenin birçok yolu var.

Adaylar ister teknik ister teknik olmayan beceriler olsun, bu şirketlerin acilen ihtiyaç duydukları şeylere sahip değiller Bu makale bu konuları keşfetmeyi amaçlamaktadır.

Neden 1: Veri bilimi becerileriyle başa çıkmak için Python dilini kullanın

Çoğu veri bilimi modeli Python ortamına dayanır. Veri yapılarını işlemek için Python kullanırken, acemileri deneyimli tecrübeli kişilerden ayıran yalnızca birkaç araç vardır. İstisnai projeler oluşturarak işverenlerin dikkatini çekmeyi bekliyorsanız, bu araçlar sizinle diğerleri arasındaki boşluğu hızla kapatabilir.

Veri bilimi teorisi hakkındaki bilgilerinizi genişletmek ve pratik becerinizi geliştirmek için kendinizi teşvik etmek istiyorsanız, projenizde aşağıdaki yöntemleri deneyebilirsiniz:

Veri madenciliği. .Corr (), scatter_matrix (), .hist () ve .bar () gibi pandalar işlevlerinin kullanımında uzman olmalısınız. Verileri görselleştirmek için temel bileşen analizi (PCA) ilkesini veya t-SNE yöntemini kullanmaya her zaman dikkat etmelisiniz.Sklearn'ın PCA ve TSNE'sini Python dilinde kullanabilirsiniz.

Öznitelik Seçimi. Vakaların% 90'ında, veri seti birçok gereksiz özelliğe sahip olacak, bu da gereksiz hata ayıklama süresini tüketecek ve aynı zamanda gereğinden fazla olabilir. Bu, veri bilimcilerinin temel tarama yöntemlerinde (Scikit-learn kitaplığının Varyans Eşik işlevi ve SelectKBest işlevi gibi) ve biraz daha karmaşık model tabanlı özellik tarama yöntemlerinde (SelectFromModel gibi) yetkin olmasını gerektirir.

En uygun modeli bulmak için hiperparametre arama yöntemini kullanın. Veri bilimcileri, GridSearchCV işlevinin ne olduğunu ve nasıl kullanılacağını bilmelidir. RandomSearchCV işlevi aynıdır. Mükemmel olmak için, Bayes optimizasyonunun hiperparametre aramasına nasıl uygulanacağını denemek ve görmek için skopt kitaplığındaki BayesSearchCV işlevini kullanabilirsiniz.

Boru hattı mekanizması. Sklearn'deki boru hattı kitaplığı, veri ön işleme, özellik seçimi ve modelleme adımlarını tek durakta tamamlamanıza yardımcı olabilir. Boru hattına aşina değilseniz, bu modelleme araç setini öğrenmenizi güçlendirmeniz gerektiği anlamına gelir.

Sebep 2: Olasılık ve istatistik bilgisi

Resim kaynağı: unsplash.com/@johnmoeses

Olasılık teorisi ve istatistik bilgisi, veri bilimi çalışmasında ayrı ayrı uygulanmayacaktır, ancak bunlar tüm veri bilimi çalışmalarının temelini oluşturur. Bu nedenle, aşağıdaki bilgileri dikkatlice çalışmadıysanız, röportajı kolayca alt üst edebilirsiniz.

Bayes kuralı. Bu, olasılık teorisinin temelidir ve genellikle görüşmelerde görülür. Bazı temel Bayesçi "beyaz tahta" problemlerini uygulayabilir ve bu yasanın anlamını ve nedenini derinlemesine anlamak için aşağıdaki kitabı okuyabilirsiniz.

Olasılık teorisinin temel bilgisi. Aşağıdaki soruları nasıl cevaplayacağınızı bilmelisiniz.

Model değerlendirmesi. Sınıflandırma problemlerinde, birçok acemi modelin doğruluğunu bir ölçüm standardı olarak kullanmaya alışkındır ve bu genellikle iyi bir seçim değildir. Sklearn'ın Precision_score, recall_score, fl_score ve roc_auc_score fonksiyonlarını kullanmaya alışmalı ve bunların arkasındaki teorik bilgiyi anlamalısınız. Regresyon problemleri için, ortalama mutlak hata (ortalama_ mutlak_hata) yerine neden ortalama karesel hatanın (ortalama_ kareli_hata) kullanıldığını bilmek de aynı derecede önemlidir. Resmi sklearn belgelerinde listelenen tüm model değerlendirme kriterlerini bulmak için zaman ayırmaya değer.

Neden 3: Yazılım Mühendisliği İpuçları

Veri bilimcilerinden, yazılım mühendisliği işi yapmak için giderek daha fazla ihtiyaç duyulmaktadır. Birçok işveren, adayların kodlarını yönetmelerini ve not defterlerinde ve taslaklarda net notlar bırakmasını ister. Özellikle aşağıdaki hususlar:

sürüm kontrolü. Git sistemini nasıl kullanacağınızı bilmeli ve komut satırını kullanarak GitHub deponuzla uzaktan etkileşim kurabilmelisiniz. Henüz yapamıyorsanız, aşağıdaki eğitimle başlamanızı öneririm.

Web Geliştirme. Bazı şirketler verileri kendi web uygulamalarında (WebApp) depolamayı veya API'ler aracılığıyla verilere erişmeyi tercih ediyor. Bu nedenle, web geliştirmenin temel bilgilerine aşina olmak da çok önemlidir.En iyi yol, Flask çerçevesi hakkında biraz bilgi edinmektir.

Web taraması. Bu biraz web geliştirmeye benzer: Bazen verileri doğrudan web'den alarak veri toplamayı otomatikleştirmeniz gerekir. BeautifulSoup ve scrapy, iki çok iyi web tarama aracıdır.

Açık ve özlü kod. Dizelerin kullanımını öğrenin. Satır içi yorumları kötüye kullanmayın. Uzun işlevi kısa işlevlere ayırın, ne kadar kısa olursa o kadar iyidir. 10'dan fazla satırı olan işlevler kodunuzda görünmemelidir. Her işlev açıkça adlandırılmalıdır, işlev_1 iyi bir isim değildir. Değişkenleri adlandırırken, LikeThis veya LikeThis yerine Python dilinin kurallarına uyun. Bir Python modülündeki (.py format dosyası) kod 400 kod satırını geçmemelidir. Her modülün data_processing.py, tahmin.py gibi açık bir amacı olmalıdır. İf name == '_main_' ifadesinin ne olduğunu ve neden önemli olduğunu öğrenin. Liste anlama özelliğini kullanın. For döngüsünü kötüye kullanmayın. Son olarak, projenize bir README dosyası eklemeyi unutmayın.

Sebep 4: İş anlayışı

Resim kaynağı: unsplash.com/@emmamatthews

Görünüşe göre birçok insan, becerileri yeterince güçlü olduğu sürece en sevdikleri şirkete kabul edilebileceklerini düşünüyor. aslında değil. Aslında şirket, daha hızlı fayda sağlayabilen çalışanları tercih ediyor.

Bu, iş arayanların yalnızca teknik becerileri geçmekle kalmayıp aynı zamanda diğer bazı becerilerde de ustalaşmaları gerektiği anlamına gelir.

Başkalarının ne düşündüğünü düşünün ve ona göre hareket edin. Çoğu kişi "veri bilimi öğrenme modeline" daldığında bir dizi adımı takip ederler: verileri içe aktarma, verileri analiz etme, verileri temizleme, veri görselleştirme, modelleme ve model değerlendirme.

Yeni bir kütüphane veya yeni bir beceri öğreniyorsanız, bu adımlar fena değildir. Ancak bir iş ortamında, "sürücüsüz" benzeri bu tür bir çalışma modeli kötü bir alışkanlıktır, çünkü çalışma saatlerinin her dakikası ve saniyesi, yaptığınız her şeyi şirket sizin için yapıyor. Faturayı ödemek. İş düşüncenizi geliştirmeli, zamanınızı nasıl doğru bir şekilde ayarlayacağınızı düşünmeli ve ekibe ve şirkete anlamlı katkılar sağlamalısınız.

İşte bir yöntem. Bir veri bilimi projesine başlamadan önce, önce onunla ne elde etmek istediğinizi düşünün ve önce kendinize birkaç soru sorun, böylece bazı sözde DS iş akışlarına yarı yolda kalmayacaksınız ( iş akışı) ve diğer alakasız işler düşünmeyi bozar. Bu soruları olabildiğince pratik düşünün Tüm projeyi bitirdikten sonra, geriye bakın ve bu projenin bu soruları ciddiye almanıza yardımcı olup olmadığını düşünün.

Doğru soruyu sorun. Şirket, işe alınan çalışanların genel durumu dikkate almalarını ve çalışma modelini ayarlarken bazı konular hakkında net düşünmelerini umuyor. Örneğin, "Sorumlu olduğum iş gerçekten takıma ve şirkete yardımcı olduğu için mi yoksa en sevdiğim algoritmayı bunda kullanabildiğim için mi?" Veya "Hangi önemli iş göstergelerini optimize etmeliyim? Başka var mı? İyileştirmenin iyi bir yolu mu?

Sonuçlarınızı net bir şekilde açıklayın. Yönetim, hangi ürünlerin iyi satıldığını ve hangi kullanıcıların rakiplerin ürünlerini kullanmaya başladığını onlara söylemenizi istiyor. Nedenini söylemelisiniz. Ancak, bir kesinlik / geri çağırma oranı eğrisinin ne olduğunu veya modelin gereğinden fazla uymasını önlemek için ne kadar çaba harcadığınızı anlamıyorlar (ve anlama zahmetine girmiyorlar). Bu nedenle, hedef kitlenizin yaptığınız sonuçları ve bunun ne gibi bir etkiye sahip olduğunu anlamasını sağlamak için basit ve anlaşılması kolay bir yol kullanmak, bir veri bilimcinin sahip olması gereken bir beceridir.

Liseden beri matematik dersi almamış bir arkadaş bulabilir ve bu arkadaşa projenin ne için olduğunu anlatırken bir proje üzerinde çalışmaya çalışabilirsin. Dostça bir hatırlatma: Açıklarken herhangi bir algoritmanın adından bahsedemezsiniz ve hiperparametrelerde hata ayıklama ile ilgili terminolojiden bahsedemezsiniz.Kullandığınız dil olabildiğince basit olmalıdır.

Yukarıdaki nedenlere ek olarak, var ...

İş reddinin nedenleri ile ilgili olarak, yukarıdaki nedenlerden daha ayrıntılı bir şey yoktur.Tahık olduğum yüzlerce acemi veri bilimcisi iş arama ve mülakat rehberliği vakasından ve görüşmecilerle iletişimin sonuçlarından, insanların% 70'i yukarıdaki nedenlerden kaynaklanmaktadır. Reddedildi.

Ancak, kişilik gibi daha esnek tanımlara sahip bir şeyin de değerlendirme kriterlerinden biri olarak kabul edilebileceğini unutmayın. Siz ve görüşmeci iyi anlaşamıyorsanız ve konuşma iyi ya da tuhaf gitmiyorsa, güçlü gücünüz yeterli olabilir, ancak görüşmeci, auranızın şirket kültürü ile pek tutarlı olmadığını hissediyor. Bu nedenle birçok teknik uzman reddedilecek, bu yüzden fazla ciddiye almayın!

Yorum Beğen Takip Et

AI öğrenme ve geliştirmenin kuru mallarını paylaşalım

Tam platform yapay zeka dikey öz medya "temel okuma" yı takip etmeye hoş geldiniz

(Taze yapay zekalı kuru ürünleri tartışmak için çevreye katılın)

(Daire kartı buraya eklendi, lütfen görüntülemek için Toutiao istemcisine gidin)
Bugün Çekirdek Ses | Söylemesi zor mu? Bu sohbet robotu, gençlerin "cinsel ilişkileri" karıştırması için tasarlanmıştır.
önceki
5G hayatımızı ne kadar değiştiriyor?
Sonraki
Bir karta takılabilen taşınabilir bir projektör, Nut T9'u bir iş gezisine götürebilir ve takip edebilirsiniz.
Çok fazla yol yok, sadece faydalı! Aşırı uydurma sorununu çözmek için Bırakma'yı kullanın
190623 Popüler Bilim "Küresel Figürler" Wang Yuan sütunu Herkesin gençlik sütununu görmesine izin verin
"TFBOYS" "Haberler" 190623 Popüler Bilim "Küresel İnsanlar" Wang Yuan sütunu Herkesin gençlik sütununu görmesine izin verin
190623 Zhu Yilong'un Karşılaşma Koleksiyonu
Mini stereo tarzı, 3 saat pil ömrü, Dangbei'nin yeni projeksiyon ürününde oynamanın birçok yolu var
190623 Bir hayran, bir hayran, parıldıyor, ejderhalar küçük yıldızlarla dolu
Xiaomi Ekolojik Zinciri yine bir fiyat katili, AI akıllı eğitim egzersiz bisikletleri geliyor
190623 Altı altı tp'yi devirdiniz mi? Çift Zhao Liying Çift Tatlı
Bir haftalık kullanım, 3 + 32GB yapılandırmalı Dangbei Super Box'ın kullanıcı deneyiminden bahsedin
Çocuklarının yeteneklerini en kolay gömen üç anne, orada mısın, gördün mü?
Guorong Fonu Duyuru Hatası: Toplam 6 fonun kurulduğu hala belirsiz
To Top