Python, R'yi zorlayarak veri bilimi alanında patlama yaşıyor

Eylül ayında TIOBE tarafından yayınlanan en son programlama dili sıralamasında Python,% 4,67 büyüme oranı ve% 0,26 avantajıyla C ++ 'ı aşarak İlk 3 karşı saldırısına başarıyla girdi.

TIOBE Eylül En İyi 5 Programlama Dili

Veri analizi alanında, geçtiğimiz yıl ivme kazanan Python, uzmanlar için vazgeçilmez bir beceridir. BT endüstrisinin büyümesiyle, deneyimli veri bilimcilerine olan talep arttı ve Python da en popüler dil haline geldi. Bu makale, verileri analiz etmenin temellerini tanıtmayı ve bazı güzel veri görselleştirmeleri oluşturmak için Python'u kullanmayı amaçlamaktadır.

özet
  • Veri biliminde neden Python öğrenmelisiniz?
  • Python'a Giriş
  • Veri Biliminde Python için Jupyter'i Kurun
  • Temel Python bilgisi
  • Veri bilimi için Python kitaplığı
  • Demo: pratik uygulama

Veri bilimi alanında, Python olmayan dil nedir?

Python, veri bilimcileri için en uygun dildir, herhangi bir ihtilaf yoktur. Aşağıdaki noktalar, veri bilimindeki insanların neden Python'u seçtiğini anlamanıza yardımcı olabilir:

  • Python ücretsiz, esnek ve güçlü bir açık kaynak dilidir.
  • Python, özlü ve okunabilir bir sözdizimi sağlarken geliştirme süresini yarıya indirebilir.
  • Veri işleme, veri analizi ve görselleştirme gerçekleştirmek için Python kullanın.
  • Python, makine öğrenimi uygulamaları ve diğer bilimsel hesaplamalar için güçlü kitaplıklar sağlar.

En büyük faydayı biliyor musun? Veri bilimci şu anda en yüksek ücretli işlerden biri. Indeed.com'a göre, Ortalama yıllık maaş 130,621 dolar .

Python, 1989 yılında Guido Van Rossum tarafından oluşturuldu. Dinamik semantiğe sahip yorumlanmış bir dildir. Tüm platformlarda kullanmak ücretsizdir. Python:

  • Nesne odaklı
  • Üst düzey dil
  • Öğrenmesi kolay
  • Süreç odaklı
  • Veri Biliminde Python için Jupyter'i Kurun

    Önce Jupyter'i sistemimize kuralım. Lütfen aşağıdaki adımları takip edin:

    • 1. Adım: https://jupyter.org/ adresini ziyaret edin
    • 2. Adım: "Tarayıcınızda deneyin" veya "Dizüstü Bilgisayarı Kur" u tıklayın

    Python ve Jupyter'i kurmak için Anaconda dağıtımını (https://www.anaconda.com/download/) kullanmanızı öneririm. Jupyter'i kurduktan sonra, varsayılan tarayıcıda açmak için komut satırına "Jupyter Notebook" yazabilirsiniz. Şimdi Jupyter üzerine en temel programı yazıyoruz.

    name = input ("Adınızı Girin:") print ("Merhaba", ad)

    Bu kodu çalıştırmak için, çıktıyı görüntülemek için "Shift + Enter" tuşlarına basabilirsiniz. Aşağıdaki ekran görüntüsünde gösterildiği gibi:

    Veri Biliminde Python'un Temelleri

    Şimdi programlamaya başlayabilirsiniz. Programlamak için aşağıdaki temel bilgileri anlamanız gerekir:

    • değişken : "Değişken" terimi, değerleri depolamak için bellekte ayrılmış bir konumu ifade eder. Python'da, değişkenin türünü bildirmek bir yana, değişkeni kullanmadan önce tanımlamaya gerek yoktur.
    • veri türü : Python, çeşitli veri türlerini destekler; bu veri türleri, değişkenler üzerindeki olası işlemleri ve bunların depolama yöntemlerini tanımlar. Veri türleri arasında sayısal değerler, listeler, dizeler, başlıklar, kümeler ve sözlükler bulunur.
    • Şebeke: Operatörler, işlenenlerdeki değerleri değiştirebilir. Python'daki işleçler arasında sayısal işleçler, liste işleçleri, dizi işleçleri, tanımlama grubu işleçleri, küme operatörleri ve sözlük operatörleri bulunur.
    • Koşullu ifadeler : Koşullu ifade, belirli bir koşula bağlı olarak bir grup ifadeyi yürütebilir. Üç koşullu ifade vardır: if, elif ve else.
    • döngü : Döngü, küçük bir kod parçasını tekrar tekrar çalıştırmak için kullanılır. Üç çeşit döngü vardır, while, for ve iç içe döngüler.
    • işlevi : Fonksiyon, kodu daha iyi organize etmek, kodu daha okunaklı hale getirmek, kodu yeniden kullanmak ve zamandan tasarruf etmek için anlamlı fonksiyon bloklarına bölmek için kullanılır.

    Daha fazla bilgi ve Python'un gerçek uygulaması için şu makaleye bakabilirsiniz: Python ile Başlarken (https://www.edureka.co/blog/python-tutorial/).

    Veri biliminde Python kitaplıkları

    Python'un veri biliminde rol oynadığı kısım budur. Python, bilimsel hesaplama, analiz, görselleştirme vb. İçin çok sayıda kütüphaneye sahiptir. Bazı kütüphaneler aşağıdaki gibidir:

    • Numpy-NumPy, Python'un veri bilimindeki temel kütüphanesidir ve adı "Sayısal Hesaplama için Python" anlamına gelir. Bilimsel hesaplama için kullanılabilir, güçlü n boyutlu dizi nesneleri içerir ve C, C ++ ve diğer dillerle entegre olmak için birçok araç sağlar. Çeşitli NumPy işlemleri ve özel işlevler için rastgele verileri depolamak üzere çok boyutlu bir kap olarak da kullanılabilir.
    • Matplotlib-Matplotlib, güçlü bir görselleştirme Python kitaplığıdır. Python komut dosyalarında, kabuklarda, web uygulama sunucularında ve diğer GUI araçlarında kullanılabilir. Bunu çeşitli grafikler çizmek için kullanabilir ve ayrıca birden fazla grafiği birlikte çizebilirsiniz.
    • Scikit-learn-Scikit-learn, Python'da makine öğreniminin uygulanabileceği en ilgi çekici kitaplıklardan biridir. Bu ücretsiz kütüphane, veri analizi ve veri madenciliği için basit ve etkili araçlar içerir. Lojistik regresyon gibi çeşitli algoritmaları uygulamak için kullanılabilir.
    • Seaborn-Seaborn, istatistiksel çizim için bir Python kütüphanesidir. Python'u veri biliminde kullanırken, matplotlib (iki boyutlu görselleştirme için) ve Seaborn'u kullanabilirsiniz.İkincisi, istatistiksel grafikler çizmek için güzel stillere ve gelişmiş arayüzlere sahiptir.
    • Pandas-Pandas, veri biliminde önemli bir Python kitaplığıdır. Verileri işlemek ve verileri analiz etmek için kullanılır. Tablolar, sıralı zaman serileri, sırasız zaman serileri, matrisler gibi farklı veri türleri için çok uygundur. Verileri işlemeden önce veri analizi için Pandaların nasıl kullanılacağını gösteren bir video (https://youtu.be/B42n3Pc-N2A).

    Demo: pratik uygulama

    Sorun Açıklaması: Veri seti verildiğinde, veri seti cezaevi tesislerinin dağılımı ve koşulları, cezaevindeki tıkanıklık derecesi, cezaevindeki mahpus türleri vb. Gibi çeşitli verilerden oluşan kapsamlı bir istatistiksel verilerdir. Lütfen bu veri seti üzerinde açıklayıcı istatistikler yapın ve verilerden faydalı bilgiler bulun. İşte birkaç görev:

  • Veri yükleme: "Prisoners.csv" veri kümesini yüklemek ve veri kümesindeki ilk beş satırı ve son beş satırı görüntülemek için Pandalar'ı kullanın. Ardından, sütun sayısını bulmak için Pandaların açıklama yöntemini kullanın.
  • Veri manipülasyonu: Tüm modlarda yararlanılan mahpusların toplam sayısı olan "toplam yararlanılan" yeni bir sütun oluşturun.
  • Veri görselleştirme: Bir çubuk grafik oluşturun, her bir eyaletin adını X ekseni olarak ve toplam yararlanıcı mahpus sayısını çubuğun yüksekliği olarak kullanın.
  • Aşağıdaki kodu kullanarak verileri yükleyin:

    pandaları pd olarak içe aktar matplotlib.pyplot dosyasını arsa olarak içe aktar % matplotlib satır içi file_name = "prisoners.csv" mahkumlar = pd.read_csv (dosya_adı) mahkumlar

    Ardından Pandaların açıklama yöntemini kullanın, aşağıdaki ifadeyi girin:

    mahkumlar. tanımla ()

    Ardından veri işlemlerini gerçekleştirin:

    mahkumlar = mahkumlar.sum (eksen = 1) mahkumlar kafa ()

    Son olarak, bazı veri görselleştirmeleri yapmak için Python kullanın. kod aşağıdaki gibi gösterilir:

    numpy'yi np olarak içe aktar xlabels = prisoners.values plot.figure (figsize = (20, 3)) plot.xticks (np.arange (xlabels.shape), xlabels, rotation = 'vertical', fontsize = 18) plot.xticks plot.bar (np.arange (prisoners.values.shape), mahkumlar, align = 'kenar')

    Orijinal: https: //dzone.com/articles/learn-python-for-data-science-using-python-librari Yazar: Aayushi Johari Çevirmen: meniscus, Editör: Tu Min
    Pekin'in toplu taşıma ve metrosu yıl boyunca iyileştirilecek, yeni 8 metrelik otobüsler kullanılacak ve sıkışık hatlardaki trenler "ciro alanlarının" sayısını artıracak
    önceki
    Baojun 3601.2T model casus fotoğrafları ortaya çıktı, 2019 sonbaharında dört gözle beklemeye değer amiral gemisi
    Sonraki
    20 yaşındaki Google ile 18 yaşındaki Baidu, yollarını ayırdı mı? Konuşma
    İlk 8'e yüksel! Çin Tayland 2-1, Xiao Zhi ve Gao Lin skorunu tersine çevirdi
    Wang Ou'yu "fabrika ayarlarına" döndürmek için Hawick Lau, Yang Mi'yi mi seçecek?
    "Asya Kupası" ilk 8'e yükseldi! Çin Tayland 2-1, Xiao Zhi ve Gao Lin skorunu tersine çevirdi
    Nokia 9 koruyucu kılıf pozlama: Beş arka Zeiss kamera fotoğraf çekmeye odaklanıyor
    64 yaşındaki Turing Ödülü sahibi, blockchain tarihindeki büyük sorunların üstesinden geldi! Yoğun paylaşım 12 Eylül'de Şangay'da görüşmek üzere!
    Ortalama günlük çizelgeleme hacmi iki milyonu aşan tekrarlanan çizelgeleme sorunları nasıl verimli bir şekilde giderilir? Teknik başlıklar
    Ateşli tek sıralı kahramanların envanteri, annemin artık tek sıralı sıralarım için endişelenmesine gerek yok!
    Spor kıyafetleri giymek aynı değil.BMW 1 Serisi sedan M kit versiyonu 199.99-269.900 yuan'a satılıyor
    Eski şehrin korunmasıyla ilgili olarak, Dongcheng Bölgesi belediye başkanı bunları bu yıl yapacağını söyledi.
    Cennetin gururlu oğlu, Tanrı'nın Timo! Sizin için karanlık tanrı-Timo'nun kapsamlı bir analizi
    BYD Yuan EV kullanma deneyimi nedir? Bir ay arabadan bahsettikten sonra, sahibi gerçek hislerini anlatıyor
    To Top