Günümüz toplumunun büyük veri çağına girdiği söylenebilir ve patlayıcı veri bilgileri, geleneksel bilgi işlem ve bilgi teknolojisine teknik zorluklar getirdi. Büyük veri teknolojisi, kamuya ve kurumlara DT dünyasının kapısını açmada yardımcı oluyor. Büyük veriyi öğrenmek sadece iyi beklentiler değil, aynı zamanda yüksek maaştır. W3cschool, programcıların büyük verileri daha iyi ve derinlemesine anlamalarına yardımcı olmak için referansınız için GitHub Harika Büyük Veri kaynaklarını derledi. Bu kaynak türü temel olarak şunları içerir: büyük veri çerçeveleri ve belgeler gibi pratik kaynaklardan oluşan bir koleksiyon.
1. İlişkisel veritabanı yönetim sistemi (RDBMS)
İlişkisel veritabanı yönetim sistemi, ilişkisel veritabanlarını yöneten ve verileri ilgili satır ve sütunlarda düzenleyen bir sistemdir. mySQL, SQL Server, PostgreSQL 2, Oracle veritabanı vb. ilişkisel bir veritabanı yönetim sistemidir (RDBMS).
2. Dağıtılmış dosya sistemi
Dağıtılmış dosya sistemi, dosya sistemi tarafından yönetilen fiziksel depolama kaynaklarının doğrudan yerel düğüme bağlı olmadığı, ancak çok sayıda düğümü ve PB düzeyinde depolamayı destekleyebilen bir küme dosya sistemi olan bir bilgisayar ağı aracılığıyla düğüme bağlı olduğu anlamına gelir. W3cschool'un deneyimli kullanıcıları tarafından toplanan dağıtılmış dosya sistemi kaynakları, çoğunlukla Apache HDFS, BeeGFS, Ceph Dosya Sistemi, Disco DDFS vb. İçerir.
3. Anahtar-değer veri modeli
Anahtar-değer veritabanları özellikle toplamaya yöneliktir; bu, bu tür veritabanlarının esas olarak birleştirme yoluyla oluşturulduğu anlamına gelir. Her biri veri elde etmek için kullanılan bir anahtara veya kimliğe sahip olan çok sayıda toplama içerir. İçeriğin bu bölümü ağırlıklı olarak Aerospike, Amazon DynamoDB, ElephantDB, EventStore, GridDB vb. İçerir.
4. Dağıtık programlama
Dağıtılmış programlama, dağıtılmış bir bilgisayar sisteminde birkaç bilgisayarda eşzamanlı olarak yürütülebilen bir programlama yöntemidir.Dağıtık programlamanın ana özellikleri dağıtım ve iletişimdir. Bir program dağıtılmış bir programlama yöntemiyle tasarlandığında, bir program bağımsız olarak yürütülebilen birkaç program modülünden oluşur. W3Cschool'un üst düzey kullanıcıları tarafından toplanan dağıtılmış programlama kaynakları, çoğunlukla AddThis Hydra, AMPLab SIMR, Apache Beam, Apache Crunch, Cascalog vb. İçerir.
5. Dosya veri modeli
W3Cschool'un üst düzey kullanıcıları tarafından herkes için toplanan belge veri modeli, içeriği çok fazla olmasa da, esas olarak Actian Versant, Crate Data, Facebook Apollo, jumboDB vb. Dahil olmak üzere çok yararlıdır, bir göz atmak için resmi hesaba gidin.
6. Anahtar-Harita veri modeli ve çerçevesi
İçeriğin bu bölümü temel olarak Apache Accumulo, Apache Cassandra, Apache HBase vb. Hakkında bilgi içerir.
Çerçeve kaynakları arasında, W3Cschool'un kıdemli kullanıcıları hala topluyor.Geçici olarak organize edilmiş kaynaklar arasında Apache Hadoop ve Tigon yer alıyor.
Yukarıdaki W3Cschool'un kıdemli kullanıcıları tarafından toplanan büyük veri öğrenme kaynakları, size yardımcı olmayı umuyorum. İçeriğin bu kısmı hala çözülüyor. Geleceğin toplumu, büyük veri çağının toplumudur ve büyük veri geliştirmenin geleceği sonsuz parlaktır. Ne bekliyorsunuz, acele edin ve öğrenin!