Pandas1.0'ın temel işlevleri olan envanteri almaya götürür

Tam metin 2252 Kelimeler, tahmini öğrenme süresi 7 dakika

Kaynak: Pexels

Not: Pandas 1.0.0rc 9 Ocak'ta yayınlandı, önceki sürüm 0.25'ti.

Pandas'ın ilk yeni büyük sürümü birçok önemli özelliği içerir: daha eksiksiz bir veri çerçevesi otomatik özeti, daha kapsamlı bir çıktı formatı, yeni bir veri türü ve bir belge sitesi.

Tam sürüm notları yepyeni dokümantasyon sitesinde bulunabilir, ancak Xiaoxin daha az teknik bir genel bakışın da yardımcı olacağına inanıyor.

Kullanıcılar, yeni sürümünü kullanmak üzere Pandas'ı yükseltmek için pip kullanabilir. Bu makaleyi yazarken, Pandas1.0 hala aday bir sürümdür, bu da Pandas1.0'ı kurmak için sürümünü açıkça belirtmeniz gerektiği anlamına gelir.

pip install --upgradepandas == 1.0.0rc0

Elbette, güncelleme bazı kodları bozabilir, çünkü bu büyük bir sürüm sürümüdür, bu yüzden dikkatli olun!

Pandas'ın bu sürümü artık Python 2'yi desteklemiyor. Pandas 1.0+ çalıştırmak için en az Python 3.6+ gereklidir, bu nedenle uygun pip ve python sürümünü kullandığınızdan emin olun.

$ pip --versionpip 19.3.1 /usr/local/lib/python3.7/site-packages/pip (python 3.7) $ python - versionPython 3.7.5'ten

Kullanıcı, her şeyin normal olduğunu ve Pandaların doğru sürümü kullandığını onaylayabilir.

> > > pandaları pd olarak içe aktar > > > pd .__ version__1.0.0rc0

Daha iyi otomatik toplama için DataFrame.info kullanın

Kaynak: Pexels

En sevdiğim yeni özellik, optimize edilmiş DataFrame.info yöntemidir. Artık daha okunabilir bir format kullanıyor ve bu da veri keşif sürecini kolaylaştırıyor.

> > > df = pd.DataFrame ({...: 'A':, ...: 'B':, ...: 'C': ...:}) > > > df.info () < class'pandas.core.frame.DataFrame ' > RangeIndex: 3 giriş, 0 ila 2 Veri sütunu (toplam 3 sütun): # Sütun Boş Olmayan Sayım Türü - ------ -------------- ----- 0 A 3 boş olmayan int641 B 3 boş olmayan nesne2 C 3 boş olmayan nesne türleri: int64 (1), nesne (2) bellek kullanımı: 200.0+ bayt

Markdown tablosu çıktı biçimi

İkinci olarak, en sevdiğim özellik, veri çerçevesini Markdown tablosuna aktarmak için yeni DataFrame.to_markdown yöntemini kullanmaktır.

> > > df.to_markdown () | | A | B | C || ---: | ----: |: -------- |: ------ || 0 | 1 | hoşçakal | Yanlış || 1 | 2 | zalim | Doğru || 2 | 3 | dünya | Yanlış |

Bu sayede orta ve diğer yerlerde tabloların github gistleri aracılığıyla görüntülenmesi daha uygundur.

Boole'lar ve dizeler için yeni veri türleri

Kaynak: Pexels

Pandas 1.0 ayrıca booleler ve dizeler için deneysel veri türleri sunmuştur.

Bu değişiklikler deneysel olduğundan, veri türünün API'si biraz değişebilir, bu nedenle dikkatli kullanın. Ancak Pandalar, bu veri türlerinin makul yerlerde kullanılmasını önerir ve gelecekteki sürümler, düzenli ifade eşleştirme gibi türe özgü işlemlerin performansını artıracaktır.

Varsayılan olarak Pandalar, verileri bu türlere otomatik olarak zorlamaz. Bununla birlikte, Pandalar açıkça belirtilmişse, yine de kullanılabilirler.

> > > B = pd.Series (, dtype = "string") > > > C = pd.Series (, dtype = "bool") > > > df.B = B, df.C = C > > > df.info () < class'pandas.core.frame.DataFrame ' > RangeIndex: 3 giriş, 0 ila 2 Veri sütunu (toplam 3 sütun): # Sütun Boş Olmayan Sayım Türü - ------ -------------- ----- 0 A 3 boş olmayan int641 B 3 boş olmayan dize 2 C 3 boş olmayan booldtypes: int64 (1), nesne (1), dize (1) bellek kullanımı: 200.0+ bayt

Dtype sütununun artık yeni string ve bool türlerini nasıl yansıttığına dikkat edin.

Yeni dize dtype'ın en pratik avantajı, dize sütununu DataFrame'den seçebilmenizdir. Bu, veri kümesinin yalnızca metin bileşenlerinin daha hızlı analiz edilmesini sağlar.

df.select_dtypes ("dize")

Önceden, dize türü sütunu yalnızca adı açıkça kullanılarak seçilebiliyordu.

Bugünden itibaren, Pandas 1.0'ın ana işlevlerinde ustalaşın ve yeni optimizasyonlarla kullanmaya başlayın ~

Yorum Beğen Takip Et

Yapay zeka öğrenme ve geliştirmenin kuru mallarını paylaşalım

Yeniden yazdırıyorsanız, lütfen arka planda bir mesaj bırakın ve yeniden yazdırma şartnamelerine uyun

2020, ilk 5 veri analizi ve tahmini
önceki
Bugün Xinsheng | Tencent işe dönüşünü 24 Şubat'a kadar erteledi, peki ya sen?
Sonraki
On iki yıllık geliştirme, "Mulan" ın Python olduğunu bilmiyorum: Akademik dolandırıcılık ne zaman sona erecek?
Microsoft, sorunu mükemmel bir şekilde çözen bir sinir ağı olan Petridish'i mi önerdi?
Bugün Temel Ses | Kurumsal WeChat Büyük Veri: Beishang Shenzhen toplantıları sever, Qingqiongji özgürlüğü sever
Yapay zeka yeni bir koronavirüs uyarısı veren ilk kişi mi? Yapay zeka sandığınızdan daha güvenilir
Erken dönmek iyi mi?
Xinsheng Bugün | Üretimden Kaldırıldı! On milyonlarca AirPod siparişi koronavirüs tehdidi altında
Yaşamak dünyayı değiştirmektir, yapay zekanın iklim anormalliklerini azaltmasının 4 yolu
İnsanlar nihayet hareketsiz yapay zeka yarattı ...
Bugün Core Voice | 4G / 5G! Raytheon Mountain'ın iletişim ve bilgi hizmetleri etkinleştirme koşullarına sahiptir.
Python'da bir sözlüğün değerini almak için köşeli parantez kullanmayı bırakın, bu yöntemi deneyin
Apache Kafka'da makine öğrenimi ve gerçek zamanlı analiz uygulaması
Core Voice Today | Wuhan Viroloji Enstitüsü, 21 Ocak'ta bir Çin buluş patenti için Remdesivir'i açıkladı
To Top