Tam metin 2653 Kelimeler, tahmini öğrenme süresi 10 dakika
Resim kaynağı: Pexels
Anaconda, veri bilimcileri, BT uzmanları ve iş liderleri için bir veri bilimi platformudur ve Python ve R dilinin bir dağıtımıdır. Veri bilimi için 300'den fazla yazılım paketine sahiptir, bu nedenle hızla en iyi veri platformlarından biri haline geldi. Bu eğitimde, Python programlamaya yardımcı olmak için Anaconda'nın nasıl kullanılacağı anlatılacaktır. Aşağıdakiler, bu makalede incelenecek konulardır:
Python temelleri
Veri analizi
Makine öğrenimi ve yapay zeka
* CDH: Clouderanın Apache Hadoop Dahil Dağıtımı.
Cloudera, Apache Hadoop'un yayın sürümünü içerir.
Anaconda tanıtımı
Anaconda, Python ve R.'nin açık kaynaklı bir dağıtımıdır. Veri bilimi, makine öğrenimi, derin öğrenme ve diğer alanlarda kullanılabilir. Kullanıcıların 300'den fazla veritabanına erişmesine izin verir, bu nedenle herhangi bir programcı için Anaconda, veri bilimi araştırmaları için en iyi seçimdir.
Anaconda, yazılım paketlerinin yönetimini ve dağıtımını basitleştirmeye yardımcı olabilir.Ayrıca, çeşitli araçlarla eşleşir ve çeşitli makine öğrenimi ve yapay zeka algoritmalarını kullanarak farklı kaynaklardan kolayca veri toplayabilir. Anaconda ayrıca, kullanıcıların yönetimi kolay bir ortam ayarına sahip olmalarını sağlar - kullanıcılar herhangi bir projeyi yalnızca bir düğmeye tıklayarak dağıtabilir.
Zaten temel bir Anaconda konseptine sahip olduğunuza inanıyorum.Ardından, nasıl kurulacağını öğrenin ve sistem üzerinde çalışabilecek bir ortam kurun.
Kurulum ve başlatma
Anaconda'yı kurmak için bu web sitesine gidebilirsiniz.
İndirme sayfası
Uygun bir sürüm seçin ve indir düğmesine tıklayın. İndirme işlemi tamamlandıktan sonra başlangıç sayfasını açın.
Anaconda başlar
Başlangıç sayfasındaki talimatları izleyin ve Anaconda'yı yol ortam değişkenine Ekle'yi tıklamayı unutmayın. Kurulum tamamlandıktan sonra, aşağıdakine benzer bir pencere göreceksiniz:
Yükleme tamamlandı
Kurulum tamamlandıktan sonra Anaconda komut istemini açın ve jupyternotebook * girin.
* Jupyter Notebook: Jupyter not defteri belgeleri oluşturmak için web tabanlı etkileşimli bir hesaplama ortamıdır.
Anaconda istemi
Aşağıdakine benzer bir pencere göreceksiniz:
Jupyter Notebook dosya bulucu
Artık anaconda'yı python'a nasıl uygulayacağınızı bildiğinize göre, anaconda'daki farklı projeler için veritabanlarının nasıl içe aktarılacağını incelemeye devam edin.
Python kitaplığını Anaconda'ya aktarın
Anaconda istemini açın ve veritabanının kurulup kurulmadığını kontrol edin.
NumPy * 'nin kurulu olup olmadığını kontrol edin
* NumPy, çok sayıda üst düzey boyutlu dizileri ve matris işlemlerini destekleyen ve ayrıca dizi işlemleri için çok sayıda matematiksel işlev kitaplığı sağlayan Python dilinin bir uzantı kitaplığıdır.
Numpy adında bir modül olmadığından, numpy'yi kurmak için aşağıdaki komutu çalıştırmalıyız.
NumPy'yi yükleyin
Kurulum tamamlandıktan sonra, şöyle bir pencere görünecektir:
NumPy kurulumu tamamlandı
Bir veritabanı kurduktan sonra, kurulumun başarılı olduğunu doğrulamak için modülü tekrar içe aktarmayı deneyin.
NumPy'yi İçe Aktar
Yukarıdaki şekilde gösterildiği gibi, bu adımda herhangi bir hata yoktur. Anaconda'da farklı veritabanları bu şekilde kurulur.
Anaconda Navigator
Anaconda Navigator
Anaconda Navigator, Anaconda dağıtımı ile birlikte gelen bir masaüstü grafik kullanıcı arayüzüdür (GUI) Kullanıcıların komut satırı kullanmadan uygulamaları başlatmasına ve conda paketlerini ve ortamlarını yönetmesine olanak tanır.
Python temelleri
Değişkenler ve veri türleri
Değişkenler ve veri türleri, tüm programlama dillerinin temel bileşenleridir. Farklı verilerin niteliklerine bağlı olarak Python'da altı veri türü vardır. Bunlar arasında liste (liste), sözlük (sözlük), küme (küme) ve tuple (tuple) Python'daki küme veri türleridir.
Aşağıda, Python'da kullanılan değişkenlere ve veri türlerine örnekler verilmiştir:
#variable bildirimi
name = "Edureka"
f = 1991
print ("python bulundu", f)
#veri tipleri
a =
b = {1: 'edureka', 2: 'python'}
c = (1,2,3,4,5)
d = {1,2,3,4,5}
baskı ("liste", a)
yazdır ("sözlüktür", b)
baskı ("tupleis", c)
baskı ("küme", d)
Operatörler
Python'daki operatörler, değerler veya değişkenler arasındaki işlemler için kullanılır. Python'da yedi tür operatör vardır:
Aşağıda, Python'da operatör kullanımına bir örnek verilmiştir:
a = 10
b = 15
# aritmetik operatörü
baskı (a + b)
baskı (a-b)
baskı (a * b)
#atama operatörü
a + = 10
baskı (a)
#karşılaştırma operatörü
#a! = 10
#b == a
# mantıksal operatör
a > b ve a > 10
#this, her iki ifade de doğruysa doğru döndürür.
Kontrol ifadesi
If, else, break ve continue gibi ifadeler, yürütme süreci üzerinde kontrol sağlamak ve en iyi sonuçları elde etmek için kontrol ifadeleri olarak kullanılır. Sonuçları kontrol etmek için bu ifadeleri Python döngülerinde kullanabilirsiniz. Aşağıdaki örnek, kontrol koşullu ifadelerinin nasıl kullanılacağını gösterir.
name = 'edureka'
ismim için:
i == 'a' ise:
kırmak
Başka:
baskı (i)
işlevi
Python işlevleri, kodun yeniden kullanılabilirliğini verimli bir şekilde geliştirir, problem ifadesi için mantık yazar ve en iyi çözümü elde etmek için bazı parametreleri çalıştırır. Aşağıda python'da işlevlerin nasıl kullanılacağına dair bir örnek verilmiştir.
deffunc (a):
a ** a döndür
res = func (10)
baskı (res)
Sınıf ve nesne
Python nesne yönelimli programlamayı desteklediğinden, sınıflar ve nesneler de kullanılabilir. Aşağıda, python'da sınıfların ve nesnelerin nasıl kullanılacağına dair bir örnek verilmiştir.
classParent:
deffunc (öz):
print ('bu ebeveyndir')
classChild (Üst):
deffunc1 (kendi):
print ('bu çocuk')
ob = yeni Çocuk ()
ob.func ()
Yukarıdaki Python ile ilgili bazı temel kavramlar. Sonra, Anaconda'nın daha geniş paket desteğine bir göz atın, birçok kütüphaneden bilgi alabiliriz. Şimdi veri analizi için python anaconda'nın nasıl kullanılacağını keşfedelim.
analiz
Veri madenciliği ve analiz iş akışı
Yukarıdakiler, veri analizinde yer alan adımlardan bazılarıdır. Anaconda'da veri analizinin nasıl yapıldığına ve içinde kullanılabilecek çeşitli kütüphanelere bir göz atalım.
Veri toplama
Veri toplama, programa bir CSV dosyası yüklemek kadar basittir. İlgili veriler, verilerdeki belirli örnekleri veya öğeleri analiz etmek için kullanılabilir. Programa CSV verilerini yüklemek için kod aşağıdadır:
pandaları pd olarak içe aktar
numpy'yi np olarak içe aktar
matplotlib.pyplot dosyasını plt olarak içe aktar
seaborn'u sns olarak ithal etmek
df = pd.read_csv ('dosyaadı.csv')
baskı (df.head (5))
Veri gruplarının ilk beş satırı
Çapraz analiz
Veri setini programa yükledikten sonra, analiz belirsizliğine neden olabilecek boş değerleri ve gereksiz alanları ortadan kaldırmak için verilerde bazı değişiklikler ve filtreleme yapılması gerekmektedir.
Aşağıda, ihtiyaçlara göre verilerin nasıl filtreleneceğine dair bir örnek verilmiştir:
baskı (df.isnull (). sum ())
#bu, veri kümesindeki tüm boş değerlerin toplamını verecektir.
df1 = df.dropna (eksen = 0, nasıl = 'herhangi')
#this, boş değerli satırları kaldırır
Her sütundaki toplam boş değer sayısını bulun
Tabii ki boş değerler de silinebilir.
Boş değerler satırını sil
Kutu grafiği
sns.boxplot (x = df)
sns.boxplot (x = df)
Maaş aralığı kutusu arsa
Maaş aralığı kutusu arsa
Dağılım grafiği
matplotlib.pyplot dosyasını plt olarak içe aktar
incir, balta = plt.subplots (figsize = (16,8))
ax.scatter (df, df)
ax.set_xlabel ('Başlangıç Maaş Aralığı')
ax.set_ylabel ('Maaş Aralığı TO')
plt.show ()
Maaş aralığı dağılım grafiği
Görselleştirme
Veriler ihtiyaçlara göre değiştirildikten sonra, verileri analiz etmek gerekir, bunun bir yolu da sonuçları görselleştirmektir. Veri projeksiyonunun optimum analizi için daha iyi görselleştirme yararlıdır.
İşte bir veri görselleştirme örneği:
Tam zamanlı yarı zamanlı çalışanların histogramı
Tam zamanlı yarı zamanlı çalışanların histogramı ve maaş ödeme yöntemleri
Maaş aralığı histogramı
Maaş aralığı histogramı
matplotlib.pyplot dosyasını plt olarak içe aktar
fig = plt.figure (figsize = (10,10))
ax = fig.gca ()
sns.heatmap (df1.corr (), annot = True, fmt = ". 2f")
plt.title ("Korelasyon", fontsize = 5)
plt.show ()
Matplotlib ile çizilmiş ısı haritası
analiz
Görselleştirme tamamlandıktan sonra, analiz için çeşitli grafikler kullanılabilir. İş verilerini işlediğimizi varsayarsak, belirli bir alandaki belirli bir işin görsel temsiline bakarak, belirli bir alandaki iş sayısını belirleyebiliriz.
Yukarıdaki analize dayanarak, aşağıdaki sonuçlar varsayılabilir:
Başka sorularınız varsa, lütfen yorum alanında konuşun ve Xiaoxin mümkün olan en kısa sürede sizinle iletişime geçecektir.
Yorum Beğen Takip Et
AI öğrenme ve geliştirmenin kuru mallarını paylaşalım
Yeniden yazdırıyorsanız, lütfen arka planda bir mesaj bırakın ve yeniden yazdırma şartnamelerine uyun