Tam metin 2252 Kelimeler, tahmini öğrenme süresi 7 dakika
Kaynak: Pexels
Not: Pandas 1.0.0rc 9 Ocak'ta yayınlandı, önceki sürüm 0.25'ti.
Pandas'ın ilk yeni büyük sürümü birçok önemli özelliği içerir: daha eksiksiz bir veri çerçevesi otomatik özeti, daha kapsamlı bir çıktı formatı, yeni bir veri türü ve bir belge sitesi.
Tam sürüm notları yepyeni dokümantasyon sitesinde bulunabilir, ancak Xiaoxin daha az teknik bir genel bakışın da yardımcı olacağına inanıyor.
Kullanıcılar, yeni sürümünü kullanmak üzere Pandas'ı yükseltmek için pip kullanabilir. Bu makaleyi yazarken, Pandas1.0 hala aday bir sürümdür, bu da Pandas1.0'ı kurmak için sürümünü açıkça belirtmeniz gerektiği anlamına gelir.
pip install --upgradepandas == 1.0.0rc0Elbette, güncelleme bazı kodları bozabilir, çünkü bu büyük bir sürüm sürümüdür, bu yüzden dikkatli olun!
Pandas'ın bu sürümü artık Python 2'yi desteklemiyor. Pandas 1.0+ çalıştırmak için en az Python 3.6+ gereklidir, bu nedenle uygun pip ve python sürümünü kullandığınızdan emin olun.
$ pip --versionpip 19.3.1 /usr/local/lib/python3.7/site-packages/pip (python 3.7) $ python - versionPython 3.7.5'tenKullanıcı, her şeyin normal olduğunu ve Pandaların doğru sürümü kullandığını onaylayabilir.
> > > pandaları pd olarak içe aktar > > > pd .__ version__1.0.0rc0Kaynak: Pexels
En sevdiğim yeni özellik, optimize edilmiş DataFrame.info yöntemidir. Artık daha okunabilir bir format kullanıyor ve bu da veri keşif sürecini kolaylaştırıyor.
> > > df = pd.DataFrame ({...: 'A':, ...: 'B':, ...: 'C': ...:}) > > > df.info () < class'pandas.core.frame.DataFrame ' > RangeIndex: 3 giriş, 0 ila 2 Veri sütunu (toplam 3 sütun): # Sütun Boş Olmayan Sayım Türü - ------ -------------- ----- 0 A 3 boş olmayan int641 B 3 boş olmayan nesne2 C 3 boş olmayan nesne türleri: int64 (1), nesne (2) bellek kullanımı: 200.0+ baytİkinci olarak, en sevdiğim özellik, veri çerçevesini Markdown tablosuna aktarmak için yeni DataFrame.to_markdown yöntemini kullanmaktır.
> > > df.to_markdown () | | A | B | C || ---: | ----: |: -------- |: ------ || 0 | 1 | hoşçakal | Yanlış || 1 | 2 | zalim | Doğru || 2 | 3 | dünya | Yanlış |Bu sayede orta ve diğer yerlerde tabloların github gistleri aracılığıyla görüntülenmesi daha uygundur.
Kaynak: Pexels
Pandas 1.0 ayrıca booleler ve dizeler için deneysel veri türleri sunmuştur.
Bu değişiklikler deneysel olduğundan, veri türünün API'si biraz değişebilir, bu nedenle dikkatli kullanın. Ancak Pandalar, bu veri türlerinin makul yerlerde kullanılmasını önerir ve gelecekteki sürümler, düzenli ifade eşleştirme gibi türe özgü işlemlerin performansını artıracaktır.
Varsayılan olarak Pandalar, verileri bu türlere otomatik olarak zorlamaz. Bununla birlikte, Pandalar açıkça belirtilmişse, yine de kullanılabilirler.
> > > B = pd.Series (, dtype = "string") > > > C = pd.Series (, dtype = "bool") > > > df.B = B, df.C = C > > > df.info () < class'pandas.core.frame.DataFrame ' > RangeIndex: 3 giriş, 0 ila 2 Veri sütunu (toplam 3 sütun): # Sütun Boş Olmayan Sayım Türü - ------ -------------- ----- 0 A 3 boş olmayan int641 B 3 boş olmayan dize 2 C 3 boş olmayan booldtypes: int64 (1), nesne (1), dize (1) bellek kullanımı: 200.0+ baytDtype sütununun artık yeni string ve bool türlerini nasıl yansıttığına dikkat edin.
Yeni dize dtype'ın en pratik avantajı, dize sütununu DataFrame'den seçebilmenizdir. Bu, veri kümesinin yalnızca metin bileşenlerinin daha hızlı analiz edilmesini sağlar.
df.select_dtypes ("dize")Önceden, dize türü sütunu yalnızca adı açıkça kullanılarak seçilebiliyordu.
Bugünden itibaren, Pandas 1.0'ın ana işlevlerinde ustalaşın ve yeni optimizasyonlarla kullanmaya başlayın ~
Yorum Beğen Takip Et
Yapay zeka öğrenme ve geliştirmenin kuru mallarını paylaşalım
Yeniden yazdırıyorsanız, lütfen arka planda bir mesaj bırakın ve yeniden yazdırma şartnamelerine uyun