Özel Kaçırmayacağınız en popüler 15 GitHub deposu!

Orijinal Başlık: 2017'de kaçıramayacağınız 15 Trend Veri Bilimi GitHub Deposu

Eser sahibi: SUNIL RAY

Çeviri: Yang Jinhong

Redaksiyon: Min Li

Bu makalenin uzunluğu 3400 kelime , Okumanız tavsiye edilir 5 dakika

Bu makale sizi 2017'deki en popüler GitHub projelerinin bir listesiyle paylaşıyor.

Giriş

GitHub başlangıçta sadece yazılım sürümlerini kontrol etmek için bir araçtı ve şimdi kendi geliştirmelerini paylaşan farklı geçmişlerden GitHub kullanıcıları tarafından geliştirilen araçlar / kitaplıklar ve hatta kullanışlı kod kitaplıkları haline geldi.

GitHub, zengin kaynaklara sahip bir bilgi hazinesidir.Sadece en iyi açık kaynak katkı projelerini görmekle kalmaz, aynı zamanda bu projelerin kodlarının nasıl yazıldığını ve uygulandığını da görebilirsiniz. Hevesli bir veri bilimi meraklısı olarak 2017'nin sonunda en popüler GitHub projelerinin bir listesini derledim. Gel ve eğlenmeye devam et!

içindekiler

1. Öğrenme Kaynak Kitaplığı

1. Güçlü veri bilimi

2. Makine Öğrenimi / Derin Öğrenme El Kitabı

3. Oxford Derinlemesine Doğal Dil İşleme Kursu Dersi

4. PyTorch-Eğitimi

5. NIPS 2017 kaynakları

İki, açık kaynaklı yazılım

1. TensorFlow

2. TuriCreate - basitleştirilmiş bir makine öğrenimi kitaplığı

3. OpenPose

4. DeepSpeech

5. Mobil Derin Öğrenme

6. Görme

7. Derinlemesine fotoğraf türü dönüştürme

8. CycleGAN

9. Eşitlik2seq

10.Pix2code

1. Öğrenme Kaynak Kitaplığı

1. Güçlü bilimsel veri bilimi

GitHub deposu, veri bilimi için tercih edilen nihai kaynak kılavuzudur. Yıllar içinde, bir dizi farklı açık kaynak kaynak projesi üzerine inşa edilmiştir.Bu kaynaklar arasında başlangıç kılavuzları, infografikler ve twitter, facebook, Instagram gibi insanların sosyal kaynak siteleri yer almaktadır. İster acemi ister deneyimli olun, öğrenmenizi bekleyen çok sayıda proje kaynağı vardır.

GitHub kütüphanesinin dizin yapısından görülebileceği gibi, tüm Github kütüphaneleri çeşitli kaynak kütüphanelerinin derin bir koleksiyonudur.

Github kütüphanesinin bağlantı adresi:

https://github.com/bulutyazilim/awesome-datascience

2. Makine Öğrenimi / Derin Öğrenme Başvuru Kılavuzu

Bu kaynak kitaplığı, yaygın olarak kullanılan araçları ve teknikleri başvuru kılavuzları biçiminde düzenler. Bu referans kılavuzları, çok basit araçlardan (pandalar gibi) çok karmaşık tekniklere (derin öğrenme gibi) kadar çeşitlilik gösterir. Bir yıldıza yıldız verdikten veya bir kaynak kitaplığı dallandırdıktan sonra, artık Google Chrome aracılığıyla genel ipuçlarını ve püf noktalarını aramanıza gerek kalmaz.

Pandalar, numpy, scikit learn, matplotlib, ggplot, dplyr, tidyr, pySpark ve sinir ağları gibi farklı başvuru kılavuzlarına bir göz atalım.

Bu referans materyallere bağlantılar:

https://github.com/kailashahirwar/cheatsheets-ai

3. Oxford Üniversitesi Derinlemesine Doğal Dil İşleme Kursu

Stanford Üniversitesi'ndeki NLP kursu, doğal dil işleme alanına girmek isteyenler için her zaman altın bir kurs olmuştur. Ancak derin öğrenmenin gelişiyle birlikte NLP, RNN ve LSTM'ler gibi derin öğrenme mimarileri sayesinde muazzam bir ilerleme kaydetti.

Oxford Üniversitesi'nin NLP kursuna dayanan kaynak kütüphanesi, NLP öğrenimini yeni bir seviyeye taşıdı. Bu kurslar, RNN'leri kullanarak dil modelleme, konuşma tanıma, konuşma sentezi metni vb. Gibi pratik işlemlerle ilgili teknoloji ve terminolojiyi kapsar. Bu kaynak kütüphanesi, Oxford kurslarının tüm ders kitaplarının tek bir yerde depolanmasıdır ve pratik işlemler için gerekli bilgileri sağlar.

Bu kitaplığın bağlantı adresi:

https://github.com/oxford-cs-deepnlp-2017/lectures

4. PyTorch-Eğitimi

Şimdiye kadar PyTorch, Tensorflow'un tek rakibi. PyTorch'un Python tabanlı kodlama stili, dinamik hesaplamalar ve hızlı prototip oluşturma övgüler kazandı ve bu nedenle derin öğrenme topluluğundan büyük ilgi gördü.

Bu kaynak kitaplığı, PyTorch'da bir sinir ağı oluşturma gibi temel görevler ve RNN, GAN'lar ve sinir stili aktarım algoritmaları yazmak için kod gibi derin öğrenme için çalışma kodu içerir. Çoğu modelin işlevsel gerçekleştirilmesi yalnızca 30 satır kod gerektirir. Bu, PyTorch tarafından sağlanan soyutlama işlevinin, araştırmacıların, programlama dilleri veya araçlarının seçimine karışmak yerine doğru modeli hızlı bir şekilde bulmaya odaklanmalarını sağladığını göstermektedir.

PyTorch kütüphanesinin bağlantı adresi:

https://github.com/yunjey/pytorch-tutorial

5. NIPS 2017 kaynakları

Bu kaynak kitaplığı, davet edilen tüm konuşmalar, öğretici dersler ve seminer materyalleri ve slaytlar dahil olmak üzere NIPS 2017 konferansı için bir kaynak listesi sağlar. NIPS (Sinirsel Bilgi İşleme Sistemleri), özellikle makine öğrenimi ve hesaplamalı sinirbilim alanı için düzenlenen yıllık en iyi uluslararası bir konferanstır.

Son birkaç yılda, veri bilimi endüstrisinde meydana gelen çığır açan araştırma sonuçlarının çoğu bu konferansta sunuldu. Veri biliminin ön saflarında yer almak istiyorsanız, doğru kaynakları buradan edinebilirsiniz.

İki, açık kaynaklı yazılım

1. TensorFlow

TensorFlow'un resmi olarak piyasaya sürülmesinden bu yana 2 yıl geçti, ancak en iyi makine öğrenimi / derin öğrenme kitaplığı statüsünü korudu. Google Brain ve TensorFlow tarafından geliştirilen topluluk, özellikle derin öğrenme alanında en son teknolojik gelişmelere aktif olarak katkıda bulunuyor ve ayak uyduruyor.

TensorFlow, başlangıçta sayısal hesaplamalar için veri akış grafiklerini kullanan açık kaynaklı bir yazılım kitaplığıydı. Ancak TensorFlow'un geliştirme durumuna bakılırsa, derin öğrenme modelleri oluşturmak için eksiksiz bir kaynak kütüphanesi olduğu söylenebilir. TensorFlow ağırlıklı olarak Python'u desteklese de C, C ++, Java ve diğer dilleri de destekler.En önemlisi mobil platformlarda çalışabilmesidir.

TensorFlow bağlantı adresi:

https://github.com/tensorflow/tensorflow

2. TuriCreate - basitleştirilmiş bir makine öğrenimi kitaplığı

Son zamanlarda en sıcak konu, Apple'ın açık kaynak katkı projesi TuriCreate. Makine öğrenimi modellerinin oluşturulmasını ve devreye alınmasını basitleştirir ve nesne algılama, etkinlik sınıflandırması ve öneri sistemleri gibi karmaşık görevler için kullanılabilir.

Bir veri bilimi meraklısı olarak, Turi'nin Apple tarafından satın alınan harika bir makine öğrenimi kitaplığı olan GraphLab'i yarattığını hatırlıyorum. Veri bilimi endüstrisindeki herkes bu patlayıcı olayın olmasını bekliyor.

TuriCreate, Python kullanıcıları için özel olarak geliştirilmiştir. Sağladığı en iyi özelliklerden biri, iOS, macOS, watchOS ve tvOS uygulamalarında kullanılmak üzere makine öğrenimi modellerini Core ML'ye (Apple'dan başka bir açık kaynaklı yazılım) kolayca dağıtabilmesidir.

TuriCreate'in bağlantı adresi:

https://github.com/apple/turicreate

3. OpenPose

OpenPose, görüntülerde veya videolardaki kişilerin konumunu gerçek zamanlı olarak tespit etmenize yardımcı olabilecek çok hedefli bir insan anahtar nokta algılama kitaplığıdır. OpenPose, CMU'nun Algısal Hesaplama Laboratuvarı tarafından geliştirilmiştir.Aşağıdaki örnek, açık kaynak araştırma projelerinin de endüstri tarafından kolayca kabul edilebileceğini göstermektedir.

Lütfen orijinal bağlantıyı kontrol edin

OpenPose'un en iyi kullanım durumu, insanların aktivite algılama sorununu çözmelerine yardımcı olmaktır. Örneğin, katılımcıların eylemleri gerçek zamanlı olarak kaydedilebilir. Daha sonra bu kilit noktalar ve eylemleri animasyon filmlere dönüştürülebilir.

OpenPose, erişim için C ++ API kullanır. Aynı zamanda, görüntüleri veya videoları işlemek için basit bir komut satırı arayüzü de kullanabilirsiniz.

OpenPose bağlantı adresi:

https://github.com/CMU-Perceptual-Computing-Lab/openpose

4. DeepSpeech

DeepSpeech kütüphanesi, Baidu'nun araştırmasındaki en gelişmiş konuşma metni sentezi teknolojisinin açık kaynaklı bir projesidir. TensorFlow tabanlıdır ve Python, NodeJS ve komut satırında kullanılabilir.

Mozilla, açık kaynak DeepSpeech kütüphanesinin inşasına sıfırdan katılan ana üyelerden biridir. "Ticari yüksek kaliteli konuşma tanıma hizmetlerine hakim olan yalnızca birkaç büyük şirket iyi derin dil teknolojisi üretebilir. Bu yalnızca kullanıcının seçimini azaltmakla kalmaz, aynı zamanda Yeni başlayanlar, araştırmacılar ve hatta daha büyük şirketler için ürünlerin bulunabilirliğini de azaltır.Bu nedenle, bu şirketler ürünlerini ve hizmetlerini daha iyi hale getirmek istiyorlarsa, benzer düşünen geliştiriciler, şirketler ve araştırmacılardan oluşan bir topluluk oluşturmaları gerekir. Konuşmadan metne bir motor oluşturmak için gelişmiş makine öğrenimi ve çeşitli yenilikçi teknolojiler kullandık. " Mozillanın teknoloji stratejisi başkan yardımcısı Sean White bir blog yazısı yazdı (https://blog.mozilla.org/blog/2017/11/29/announcing-the-initial-release-of-mozillas-open-source-speech- tanıma-model-ve-ses-veri kümesi /) yazdı.

DeepSpeech kitaplığının bağlantı adresi:

https://github.com/CMU-Perceptual-Computing-Lab/openpose

5. Mobil Derin Öğrenme

Bu bilgi tabanı, en gelişmiş veri bilimi teknolojisini mobil platforma getiriyor. Bilgi tabanı, karmaşıklığı azaltmak ve işletim hızını artırmak için Android ve IOS gibi mobil cihazlarda derin öğrenme modellerini dağıtmak amacıyla Baidu tarafından araştırılmış ve geliştirilmiştir. Bir görüntüdeki hareket eden bir nesnenin tam konumunu belirleyebilen nesne algılama gibi açıklamak için mobil derin öğrenme kitaplığındaki basit bir kullanım senaryosu kullanın. Harika değil mi?

Lütfen orijinal bağlantıyı kontrol edin

Mobil derin öğrenme kütüphanesinin adresi:

https://github.com/baidu/mobile-deep-learning

6. Görme

Visdom, ortak çalışanlar arasında grafiklerin, görüntülerin ve metnin yayılmasını destekleyen bir kütüphanedir. Görselleştirme alanınızı bir program veya kullanıcı arayüzü yazarak, gerçek zamanlı verilerden oluşan bir ekran paneli oluşturarak, deneysel sonuçları kontrol ederek veya deneysel kodda hata ayıklayarak oluşturabilirsiniz.

Girdinin çizim fonksiyonunun doğruluğu farklıdır, ancak çoğu bir tensör (üç boyutlu) giriyor olsa da, X veri içermiyor ve bir (isteğe bağlı) tensör (üç boyutlu) Y isteğe bağlı veri değişkenleri (etiketler veya Zaman damgası). Plot işlevi, Plotly tarafından sağlanan görselleştirmeler oluşturarak tüm temel çizim türlerini destekler.

Visdom, Python'da Torch ve Numpy'yi destekler.

Visdom kütüphanesinin bağlantı adresi:

https://github.com/facebookresearch/visdom

7. Derinlemesine fotoğraf türü dönüştürme

Kütüphane, büyük miktarda görüntü içeriğini işleyebilen ve görüntüyle ilgili türleri ve stilleri aslına sadık kalarak aktarabilen, fotoğraf türü dönüştürme yönteminin derinlemesine incelenmesini sunan bir araştırma makalesinden (https://arxiv.org/pdf/1703.07511.pdf) gelir. Bu yöntem, bozulmayı başarılı bir şekilde bastırdı ve zaman kayması, hava durumu, mevsim ve sanatsal düzenleme dahil olmak üzere çeşitli sahnelerde tatmin edici fotoğraf benzeri gerçekçi bir stil üretti. Bu kod Torch'a dayanmaktadır.

Kütüphanenin bağlantı adresi:

https://github.com/luanfujun/deep-photo-styletransfer

8. CycleGAN

CycleGAN, potansiyel olarak en son teknolojiyi sergileyen ilginç ve güçlü bir kitaplıktır. Örneğin, aşağıdaki resim, kütüphanenin yapabileceği şeydir - görüntünün derinlik algısını ayarlayabilir. Gelişmiş doğası, algoritmaya görüntünün hangi kısmının işlenmesi gerektiğini söylemenize gerek kalmamasıdır, kendi algoritması aracılığıyla bir yargıya varabilir.

Şu anda, kütüphane Lua dilinde yazılmıştır, ancak komut satırında da kullanılabilir.

Kütüphanenin bağlantı adresi:

https://github.com/junyanz/CycleGAN

9. Sıra2seq

Seq2seq başlangıçta makine çevirisi için yazılmıştı, ancak daha sonra özetleme, oturum modelleme ve resim altyazıları dahil olmak üzere çeşitli diğer görevler için geliştirildi. Bir soru bir formatta girilebildiği ve başka bir formatta kodu çözülebildiği sürece, bu çerçeve kullanılabilir. Python'daki popüler Tensorflow kitaplığı kullanılarak yazılmıştır.

Kütüphanenin bağlantı adresi:

https://github.com/google/seq2seq

10. Pix2code

Pix2code, derin öğrenme alanında çok heyecan verici bir projedir.Bu projenin işlevi, GUI için otomatik olarak kod üretmeye çalışmaktır. Bir web sitesi veya mobil arayüz oluştururken, ön uç mühendislerin genellikle tekrarlayan kod yazmaları gerekir.Bu zaman alıcı ve üretken olmayan çalışma, geliştiricilerin zamanlarının çoğunu geliştirdikleri yazılımın gerçek işlevlerini ve mantığını gerçekleştirmeye harcamalarını engeller. Pix2code bu sıkıcı görevi otomatik olarak tamamlayabilir. Tek bir GUI ekran görüntüsünden girdi olarak bilgisayar tanımlama dilinin oluşturulmasına izin veren yeni bir yöntemi temel alır.

İşte pix2code, bağlantı adresinin kullanım durumlarını açıklayan bir video:

https://youtu.be/pqKeXkhFA3I

Pix2code python ile yazılmıştır ve mobil ve web arayüzlerinin görüntülerini yakalamak ve bunları koda dönüştürmek için kullanılabilir.

Kütüphanenin bağlantı adresi:

https://github.com/tonybeltramelli/pix2code

Son not

Umarım 2017'de GitHub'da yayınlanan bazı yeni açık kaynaklı araçlar veya teknolojiler hakkında bilgi edinebilirsiniz. Geçmişte bu kadar yararlı kaynaklar gördüyseniz, lütfen aşağıdaki yorumlarda bana bildirin.

Orijinal bağlantı:

https://www.analyticsvidhya.com/blog/2017/12/15-data-science-repositories-github-2017/

Ginkgo sarı! Chengdu üniversitelerinde ginkgo görüntülemek için bu kılavuzu kabul edin
önceki
CES 2017 Konusu: Deep Technology, tüketici sektörüne tamamen giriyor
Sonraki
Deyang, şehir içi otobüs ücretinin ayarlanması üzerine halka açık bir duruşma düzenledi, kıdemli araba planları 2 yuan / kişiye ayarlanacak
On iki akademisyen ve uzman, Wuhan'ın birinci sınıf bir biyotıp ve tıbbi cihaz endüstrisi kümesi oluşturmasına yardımcı oluyor
2016'da dünyanın en etkili beş temiz enerji teknolojisi
Zigong Iron Fist "Yedi Yıllık Sorunu", Ağaçlandırmayı Yeşillendiriyor ve 20 km "Ekolojik Bariyer" İnşa Ediyor
Özel | Bu makale sizi evrişimli sinir ağlarının gerçek savaşına götürür (veri seti öğrenme materyalleri ile)
Resimli Wuhan | Luojia Altın Sonbahar Uluslararası Kültür Festivali düzenlendi
Machine Intelligence Accelerator: Büyük Veri Ortamında Bilgi Mühendisliğinin Fırsatları ve Zorlukları
Afet düzeyinde performans! Avrupa yarışmasına 5 takım gitti, sadece 1 takım ileri gitti, sadece Ligue 1 onlardan daha kötüydü
Hua Taohuayuan'ı arıyor Maobian Kitabevi · Taokei Koleji
Evrişimli sinir ağı CNN'yi anlamak için bir makale (çalışma notları)
Avrupa Ligi'nde büyük bir üzüntü daha! 119. dakika geri sayımı seyirci karnavalını öldürüyor, sahne kazanmak gibi
Reformun 40. yıldönümünü anma ve açılış
To Top