Makine öğrenmesine dayalı olarak elektrik şebekesi ekipmanı arızalarının kapsamlı çalışması ve analizi

Büyük veri, bulut bilişim, Nesnelerin İnterneti ve mobil internet gibi yeni nesil bilgi ve iletişim teknolojilerinin hızla gelişmesiyle birlikte akıllı terminal ürünleri birbiri ardına ortaya çıkmakta, yeni teknolojiler, yeni ürünler ve yeni uygulamalar ortaya çıkmaya devam etmektedir. Mobil akıllı terminal ekipmanı ve uygulamaları, zengin ve çeşitli işlevler aracılığıyla insanların çeşitli ihtiyaçlarını karşılar ve insanların günlük işlerini ve yaşamlarını her yönden değiştirir.

Son yıllarda, Çin Devlet Şebekesi Şirketi, yeni nesil bilgi ve iletişim teknolojilerinin hızlı gelişiminin getirdiği fırsatı akıllı şebeke üretim yöntemlerinin ve yönetim modellerinin dönüşümüne çevirdi, akıllı şebekelerin inşasını aktif olarak teşvik etti, yeni teknolojilerin gelişme eğilimini yakından takip etti ve önemli teknolojik araştırma ve geliştirmeyi gerçekleştirdi. "13. Beş Yıllık Plan" da, akıllı şebekede bilgi ve iletişimin temel teknik rolüne tam anlamıyla yer vereceğiz ve akıllı şebeke teknolojisi dönüşümünün ve inovasyon gelişiminin desteklenmesini koordine edeceğiz.Gelecekte, güçlü bir akıllı şebeke için yenilik yapmaya ve geliştirmeye devam etmek için çok sayıda başarılı uygulama ve önemli teknolojik başarılar oluşturulacak Sağlam bir temel attı.

Ulusal ekonominin sürekli gelişmesi ve insanların yaşam standartlarının her geçen gün artmasıyla birlikte sosyal güç yükü de hızla artmış, aynı zamanda elektrik şebekesi şirketlerinin güç kaynağı güvenilirliği ve elektrik kesintisi süresi gibi önemli göstergelere daha yüksek gereksinimler getirilmiştir. Özellikle dağıtım ağları için acil onarım iş emirlerinin gönderilmesi için zamanında, hızlı ve doğru kararlar gereklidir. Şu anda, iş emirlerinin gönderiminin çoğu manuel gönderime dayalıdır veya sistem tüm onarım ekiplerine sipariş gönderir ve onarım ekipleri siparişleri alır.İş emirlerinin gönderim stratejisi makul değildir ve sevkiyatın zamanında yapılmasını belirli ölçüde etkileyen belirli sübjektif faktörler vardır. Ve takip eden onarım çalışmasının etkisi.

1 Teknik mimari

Büyük veri endüstrisi zincirinin tanımına göre, büyük verinin temel teknolojileri yalnızca veri analizi teknolojisi gibi temel teknolojileri değil, aynı zamanda veri yönetimi, veri işleme ve veri görselleştirme gibi önemli teknolojileri de içerir.Teknik mimari diyagramı Şekil 1'de gösterilmektedir.

Veri çıkarma teknolojisi: Entegre bilgi sistemi veri tabanındaki büyük miktardaki çeşitli veriden verileri çıkarın ve bunları gerçek zamanlı olarak sistem veri ambarında saklayın.Veri esas olarak analiz için kullanılır ve veri tasarımı iş odaklı tasarım ilkelerine göre tasarlanır. Sistem verileri PMS verileri, 95598 iş emri verileri, çevrimiçi izleme verileri, hat inceleme verileri, yardımcı izleme verileri, geçmiş arıza verileri, hat izleme verileri, gerçek zamanlı yük verileri, APP kullanım verileri vb. Veri çıkarma, veri temizleme ve dönüştürme işlemlerinden sonra gelir. , İş emirlerinin otomatik gönderimi için üç veri yükleme işlemi oluşturulur. Veriler, her bir entegre sistemden veri çıkarma araçlarıyla otomatik ve düzenli olarak çıkarılır Çıkarılan veriler farklı iş gereksinimlerine göre filtrelenir ve kirli veriler ve eksik veriler, elektrik tüketim analizi için kullanılabilecek verileri oluşturmak için filtrelenir.

Veri analiz teknolojisi: Kapsamlı hata erken uyarı ve tahmini, veri hazırlama, kural arama ve büyük miktarda talep verisi için kural ifadesi.Madenciliğin ana görevleri, çeşitli hataların tahminini gerçekleştirmek ve elektrik şebekesini iyileştirmek için veri ilişkilendirme, kümeleme, sınıflandırma vb. İşletme ve bakım seviyesi için teknik destek sağlayın.

Veri hizmeti teknolojisi: Ekran istemcileri için veri erişim hizmetleri sağlar Veri hizmetleri, veri erişim performansını iyileştirmek için bir bellek önbellek veritabanı ile gömülüdür. Veri hizmetleri tarafından sağlanan çoklu analiz veri çıktı yöntemlerinin arayüzü aracılığıyla, çeşitli elektrik şebekesi ekipmanı türlerinin mevcut arızalarının gerçek zamanlı görüntülenmesi için destek sağlar.

Veri görüntüleme teknolojisi: Verilerin çok yönlü ve çok açılı görüntülenmesi. Isı haritası şeklinde, CBS'ye göre elektrik şebekesi ekipman arızası riski görüntülenir.

Sistem güvenliği: Sistemin belirli iş özelliklerine göre, güvenlik mimarisi, yönetim bilgilerinin iç ve dış ağlarının ayrılmasına yönelik güvenlik gereksinimlerine uygun olarak güçlü bir bilgi güvenliği önleme sistemi kurar, sistemin bilgi güvenliğini etkin bir şekilde korur ve bilgisayar korsanları ve yasa dışı davetsiz misafirlerin saldırılarını önler.

Sistemin uyguladığı güvenlik sistemi teknik güvenlik ve yönetim güvenliği olmak üzere ikiye ayrılabilir. Teknik seviyedeki güvenlik tasarımı temel olarak uygulama güvenliği, veri güvenliği, sistem güvenliği, ağ güvenliği, fiziksel güvenlik vb. İçerir ve bunlar arasında uygulama güvenliği, iş güvenliği koruma sisteminin özüdür. Yönetim düzeyinde güvenlik temel olarak güvenlik organizasyonu ve personel güvencesini, güvenlik yönetim sistemini, güvenlik teknik şartnamelerini, güvenlik değerlendirmesini ve denetimini vb. İçerir.

2 Veri mimarisi

Büyük veri yapılandırılmış, yarı yapılandırılmış ve yapılandırılmamış, büyük hacimli ve yüksek değere sahip verilerdir. Büyük veri işleme teknolojisi sayesinde bu veriler işletmenin ihtiyaç duyduğu veri modeline dönüştürülmekte, büyük verideki "bilgi" ve bilgi keşfedilmekte, sektör içinde ve dışında çok sayıda katma değerli içerik katma değerli hizmetler verilmektedir.

Büyük veri, verileri veri özellikleri, veri kaynakları, veri toplama yöntemleri ve veri toplama sıklıkları gibi farklı perspektiflerden sınıflandırır, planlar, tasarlar ve dağıtır.Veri yapısı Şekil 2'de gösterilmektedir.

3 Hata erken uyarı tahmin modeli

Geçmişteki arızaların nedenlerinin derinlemesine analizine dayanarak, arızalar ana kategorilere ayrılır ve her bir arıza türü alt kategorilere ayrılır.Her bir arıza alt kategorisi için, destekleyici verilerin farklı türlerine ve boyutlarına göre, olası oluşumlarını hesaplamak için farklı makine öğrenme yöntemleri seçilir. Arıza olasılığı ve ardından erken uyarı ve arıza tahminini gerçekleştirmek için kapsamlı olası arıza olasılığını ve en olası arıza türünü hesaplayın.

3.1 Başarısızlık faktörlerinin analizi

Geçmişteki arıza nedenlerinin analizine dayalı olarak, arızalar kabaca şu beş kategoriye ayrılır: şebeke ekipmanı arızaları, doğal faktörler, dış kuvvetler, uygun olmayan işletim ve bakım ve diğer faktörler. Her bir arıza türü için, başarısızlık aynı anda küçük kategorilere ayrılır:

Elektrik şebekesi ekipmanının arızaları, havai iletken arızaları, kablo arızaları, kolon ekipman arızaları, kutu trafo arızaları, güç dağıtım odası arızaları, şalter kabini arızaları, halka ağ kabini arızaları, JP kabini arızaları, kablo branşman kutusu arızaları, direk kuleleri olarak alt gruplara ayrılabilir. Arıza, izolatör arızası, tutucu arızası, diğer ekipman arızası.

Doğal faktörler için yıldırım çarpmaları, kuvvetli rüzgarlar, seller, depremler, toprak kaymaları, yağmur ve kar olarak alt gruplara ayrılabilir.

Dış faktörler için hırsızlık, inşaat, araçlar, harici yangınlar ve harici yabancı nesneler olarak alt bölümlere ayrılabilir.

Yanlış çalıştırma ve bakım için, ağaç bariyerleri ve kuş hasarı, zamanında ortadan kaldırılmaması, yetersiz denetim, aşırı yük ve aşırı gerilim gibi küçük hayvanlara ayrılabilir.

3.2 Sınıflandırma modellemesi

Her bir ana arıza türü için, karşılık gelen bir veri modeli oluşturulur.

3.2.1 Elektrik şebekesi ekipman faktörlerinin neden olduğu hata tahmin modeli

Ekipman arızaları için, ekipman gerçek zamanlı izleme verileri, çalışma verileri, ekipman üreticileri, ekipman çalışma yılları, ekipman geçmiş arıza süreleri vb. Boyutlarından, geçmiş arıza bilgilerine dayalı olarak, şebeke ekipmanının kendisi için bir hata tahmin modeli oluşturun. Örneğin, halka ağ kabini ekipmanı için gerçek zamanlı izleme verileri; sıcaklık, nem, kısmi deşarj, kablo sıcaklığı, bara yığın başı sıcaklığı, tutucu boşaltma süreleri, duman konsantrasyonu ve diğer boyutlar gibi boyutları içerir. Çalışma verileri, voltaj ve akım gibi boyutları içerir. Ekipman üreticileri şunları içerir Üretici adı ve ekipman grubu gibi boyutlar.

Görsel sınıflandırma kuralları oluşturmak için, doğrusal regresyonun önceden varsaydığı doğrusal ilişkinin gerçek duruma uymaması ve büyük hatalara neden olması durumundan kaçının ve önceden işlev formunun varsayımından kaynaklanan varsayım hatalarından kaçının, böylece oluşturulan model yorumlanabilir, böylece benimsenir. Ağaç modunda modelleme Aynı zamanda, parametreleri ayarlama ihtiyacını azaltmak, sınıflandırma hızını iyileştirmek, büyük örnek verileri verimli bir şekilde işlemek, özellik faktörlerinin önemini anlamak, kategori değişkenlerini iyi idare etmek, gürültü önleme yeteneğini geliştirmek ve genelleme yeteneğini geliştirmek için. Modeli yeni örneklere daha uyumlu hale getirir Karar ağacına göre modelleme için rastgele orman yöntemi seçilir.

Rastgele orman regresyonunun temel fikri şudur: ilk olarak, orijinal verilerden N örnek çıkarmak için self servis örnekleme yöntemini kullanın ve her örnek boyutu orijinal veri setine bağlanır; daha sonra, N örnek için N ders ağacı oluşturulur ve N sonuç elde edilir Ve son olarak, nihai tahmin sonucunu almak için N sonucun ortalamasını alın.

Elektrik şebekesi ekipmanının kendi arızasının rastgele orman modeli, N ağaçtan, {F1 (X), F2 (X), , FN (X)} oluşur; burada X = {x1, x2, , xM}, M arızasıdır Boyutsal özellik vektörü. Sonuç, B tahmin sonuçlarını üretecektir. Regresyon problemleri için tahmin edilen değer, tüm ağaç tahmin sonuçlarının ortalamasıdır. Algoritma akışı aşağıdaki gibidir:

(1) Orijinal veriler, 32859'luk bir örnek boyutu içerir ve 500 karar ağacı oluşturmak için önyükleme örneklemesi kullanılarak 500 örnek seti seçilir. Her örneklemede alınmayan örnek, rastgele ormanın doğrulama örneği olarak bir OOB (torba dışı) örnek oluşturur.

(2) Örnekteki değişken sayısı 15'tir ve Gini indeksini hesaplamak için her karar ağacının her bir düğümü için k değişken rastgele seçilir ve uygun değişkenlerin uygun şekilde bölündüğü belirlenir. Regresyon için rastgele orman kullanırken, genellikle k = P / 3. Bu model, her bölüm için 5 değişken seçer.

(3) Her karar ağacı, budama olmadan maksimuma büyür 500 karar ağacı oluşturulana kadar yukarıdaki adımları tekrarlayın.

Yukarıdaki adımlarla, elektrik şebekesi ekipmanının arızası için rastgele bir orman modeli oluşturulur ve OOB numuneleri, arıza tahmin doğruluğunu elde etmek için rastgele orman modeline girilir.

Rastgele orman, pazarlama başarısızlıklarının önemli öngörücülerine göre değişkenlerin önemi hakkında bir sıralama verebilir. İkinci olarak değişkenlerin önem sıralamasını elde etmek için yordayıcı değişkenler silinerek açıklayıcı varyans farkı hesaplanmıştır. Bir değişkeni sildikten sonra, açıklayıcı farktaki değişiklik ne kadar büyükse, değişken o kadar önemlidir; açıklayıcı farktaki değişiklik ne kadar küçükse, değişken o kadar önemsizdir.

Tahmin ediciler Tablo 1'de gösterilmektedir:

Doğruluğu artırmak için, Tablo 2'de gösterildiği gibi varyansın açıklayıcı varyansını elde etmek için rastgele orman 10 kez çalıştırılır:

Varyansın ortalama yorumlanabilirliği% 85.12'dir.

Değişken varyanslarını tek tek silmenin açıklayıcı niteliği Tablo 3'te gösterilmiştir:

Varyanstaki açıklayıcı değişiklikler Tablo 4'te gösterilmektedir:

Bu nedenle, arızaların meydana gelmesine en çok katkıda bulunan üç değişken sıcaklık, nem ve kısmi deşarjdır.

Bootstrap örnekleme yoluyla, seçilmemiş örnekler, OOB örneklerini oluşturan K poşet dışı verileri oluşturur. Torbadaki numune test seti olarak kullanılır ve torba dışındaki numune, tahmin doğruluğunu ölçmek için doğrulama seti olarak kullanılır. Rastgele ormanın her önyükleme örneklemesi, farklı OOB örnekleri üretecek ve farklı OOB örnekleri, farklı tahmin doğruluğu elde edecektir. Tahmin doğruluğunu sağlamak için 10 önyüklemeden elde edilen torba dışı veriler üzerinden tahmin hatası hesaplanarak ortalaması alınır ve ortalama tahmin doğruluğu% 79.3982 olup gereksinimleri karşılamaktadır.

3.2.2 Doğal faktörler hata tahmin modellerine yol açar

Doğal faktörler arasında şimşek çarpmaları, kuvvetli rüzgarlar, seller, depremler, heyelanlar, yağmur, kar ve donma vb. Çoğu zaman hataların oluşumu ile belirli bir doğrusal ilişki gösterir.Hataları tahmin etmek için lineer regresyon yöntemleri kullanılır. Değeri modellemek ve tahmin etmek için X = {x1, x2, , xn} özelliklerini seçin: yıldırım çarpma sayısı, ortalama rüzgar hızı, maksimum rüzgar hızı, sel seviyesi, deprem seviyesi, heyelan seviyesi, buzlanma kalınlığı vb. y başarısızlık olasılığıdır. Doğal faktör özelliği X, arıza olasılığı y fonksiyonuna şu şekilde eşlenir:

Özellik katsayısı vektörünü eğitmek için eğitim seti olarak 71.982 geçmiş veriyi seçin. Kayıp işlevi:

Küçük toplu stokastik gradyan iniş (MSGD) yöntemi, özellik katsayısı vektörünü elde etmek için kayıp fonksiyonunu en aza indirgemek için kullanılır MSGD yöntemi, gradyan hesaplaması için rasgele bir örnek grubunu örnekleyerek, algoritmanın yakınsamasını sağlarken aynı zamanda yakınsama hızını da geliştirir.

Parti boyutu 10 olan bir eğitim numunesi seçin ve gradyan inişi gerçekleştirmek için her bir yinelemede küçük bir numune grubunun hatasını hesaplayın;

Son olarak iki iterasyon sonucu set değerinden küçük olduğunda çözüm tamamlanır ve model elde edilir.

3.2.3 Dış kuvvetlerin neden olduğu arıza tahmin modeli

Dış faktörler arasında hırsızlık, inşaat, araçlar, harici yangınlar, harici yabancı nesneler vb. Seçilen karakteristik değerler, hırsızlık olup olmadığı, yapım mesafesi, gerilim seviyesi, araç sayısı, harici bir yangın çıkıp çıkmadığı, harici bir yabancı cisim olup olmadığı vb. Hırsızlık, araç sayısı, harici yangın, harici yabancı cisimler vb. Geçmiş verilerdeki ortalama değeri ifade eder ve inşaat mesafesi, ekipmanın yakınındaki izleme cihazının görüntüsü ile elde edilebilir. İlgili özelliklerin çoğu ayrık verilerdir ve modelleme için karar ağacı yöntemi seçilir. Özelliklerin seçimi, hesaplama için bilgi kazanma oranına bağlıdır.

Geçmiş veriler için öncelikle hırsızlık olup olmadığı, inşaat mesafesi, gerilim seviyesi, araç sayısı, harici yangın olup olmadığı, harici yabancı cisim olup olmadığı vb. Bilgi kazancını hesaplayın:

Bilgi kazancı:

Her özelliğin dahili bilgileri şu şekilde hesaplanır:

Geçiş bilgisi kazanç oranını şu şekilde hesaplayın:

En büyük bilgi kazanım oranına sahip özellik karşılaştırma yapılarak elde edilir ve diğer özelliklerin bilgi kazanma oranı bölünme sonrasında tekrar hesaplanır ve daha sonra bilgi kazanma oranı eşiğin altına düşene kadar bölme yapılır ve model eğitimi tamamlanır.

3.2.4 Yanlış çalıştırma ve bakımdan kaynaklanan arıza tahmin modeli

Uygun olmayan işletim ve bakım faktörleri arasında ağaç bariyerleri gibi küçük hayvanlar, kuş hasarı, zamanında yok edilememe, yetersiz denetimler, aşırı yük ve aşırı gerilim yer alır. Seçilen karakteristik değerler; etrafta ağaç bariyerlerinin olup olmadığı, kuş hasarı gibi küçük hayvanların olup olmadığı, kusurun oluşma zamanı, denetimin planlandığı gibi tamamlanıp tamamlanmadığı, yük değeri ve gerilim değeridir. Dış güçlerin neden olduğu arıza tahmin modeline benzer şekilde, modelleme için C4.5 karar ağacı seçilmiştir.

3.3 Kapsamlı modelleme

Yukarıdaki modelin kurulması tamamlandıktan sonra, yukarıdaki dört tür nedenin neden olduğu arıza olasılığı elde edilebilir, bunlar P1, P2, P3 ve P4. Geçmiş başarısızlık verilerine dayanarak, çeşitli faktörlerin ağırlıkları a1, a2, a3 ve a4 olarak hesaplanabilir. , Nihai hata tahmin modeli şudur:

Başarısızlık olasılığı P = a1 × P1 + a2 × P2 + a3 × P3 + a4 × P4

4 Teknik gerçekleştirme yolu

Bu sistemin teknik uygulama rotası şu şekildedir: veri toplama ve depolama, veri analizi, veri madenciliği teknolojisi ve görsel ekran 4 bölüm.

4.1 Veri toplama ve saklama

(1) Güç sistemi verileri

PMS sistemindeki veriler temel olarak elektrik şebekesi ekipman bilgilerini, bakım planlarını vb. İçerir. Acil durum onarım iş emri bilgilerine göre, onarım personeli PMS'deki güç şebekesi ekipmanını ve katı planları vb. Alır. Sistem verileri PMS sisteminde depolamaz, yalnızca gerçek zamanlı olarak arar. .

95598 verileri temel olarak şunları içerir: telefon hizmet kayıtları, multimedya hizmet kayıtları, 95598 hizmet kayıtları, diğer hizmet bilgileri, ses kayıtları, müşteri dosya bilgileri, departman personel bilgileri ve kamuya açık bilgiler. 8 tür veri vardır. Bunlar arasında 95598 hizmet kaydı: temel olarak iş kabul bilgilerini içerir, Bilgilerin işlenmesi, işlem bilgileri vb. Günlük 250 makbuz, yıllık 91250 kayıt artışı ve yaklaşık 870 MB kapasite artışı ile iş kabul bilgilerini örnek olarak alırsak.

Çevrimiçi izleme verileri temel olarak şunları içerir: havai kablolar, kablolar, direk ekipmanı, kutu transformatörleri, güç dağıtım odaları, anahtar dolapları, halka ağ dolapları, JP dolapları, kablo branşman kutuları, direkler, kuleler, izolatörler ve yıldırım siperleri. Bu sistem, çeşitli ekipman türlerinin geçmiş ve gerçek zamanlı verilerini alır. Toplam 57 GB veri depolanır.

Devriye onarım bilgilerinin verileri temel olarak şunları içerir: devriye onarım iş emri bilgileri, resimler, ses ve video bilgileri vb. Sistem, tüm inceleme ve acil onarım iş emri bilgilerini kaydeder. Aylık 1,2 GB olarak hesaplanan yıllık artış 15 GB.

Güç şebekesi GIS platformu verileri temel olarak şunları içerir: harita kesit verileri, yol ağı verileri ve önemli ekipmanın CPS koordinat bilgileri. Bu sistem, verileri grid GIS platformunda depolamaz, sadece gerçek zamanlı geri çağırma yapar.

Yardımcı izleme verileri temel olarak trafo merkezleri ve halka ağ kabinleri gibi ekipmanların sıcaklık ve nem, yağ kromatogram verileri, mikro su, hava basıncı vb. Gibi verileri içerir. Bu sistem, çeşitli ekipman türlerinin geçmiş ve gerçek zamanlı verilerini alır. Toplam 7,5 G bilgisi saklanır.

Geçmiş arıza bilgileri temel olarak temel arıza bilgilerini, metin bilgilerini ve resimler, ses ve video gibi verileri içerir. Sistem tek seferde 400 G arıza bilgisini alır.

Hat izleme verileri, kule üzerindeki izleme cihazı tarafından alınan görüntü bilgileridir. Bu sistem, çeşitli ekipman türlerinin geçmiş ve gerçek zamanlı verilerini alır. Toplam 189 G bilgi depolanır.

Gerçek zamanlı yük verileri, anahtarın voltajı ve akımıdır. Bu sistem, çeşitli ekipman türlerinin geçmiş ve gerçek zamanlı verilerini alır. Toplam 3,4 G bilgi depolanır.

APP kullanım verileri temel olarak, ayda 500 M'de hesaplanan APP kullanım günlüğü bilgilerini içerir ve yıllık artış 6 G'dır.

(2) Dış veriler

Meteorolojik veriler temel olarak sıcaklık, nem, rüzgar, maksimum sıcaklık, minimum sıcaklık, tayfun uyarısı, orman yangını uyarısı vb. Dahil olmak üzere ızgaralı meteorolojik verilerdir. Izgara boyutu yaklaşık 16 kilometrekaredir. Bu sistem meteorolojik verileri saklamaz, sadece gerçek zamanlı geri çağırma yapar.

Yol durumu bilgileri esas olarak rota navigasyon verilerini, yol tıkanıklığı verilerini, geçici tıkanma ve kontrol bilgilerini vb. İçerir. Bu sistem yol durumu bilgilerini saklamaz, yalnızca gerçek zamanlı geri çağırma yapar.

İnternet kamuoyu verileri, temelde ana akım sosyal medyadaki elektrikle ilgili kamuoyu bilgileridir. Bu sistem ağdaki kamuoyu verilerini depolamaz, sadece gerçek zamanlı geri çağırma yapar.

(3) Veri toplama

Veri toplama yöntemleri arasında veri replikasyonu, ETL, OGG, ESB, vb. Bulunur. Toplama yöntemi, analiz edilecek veri setini toplamak için fiili işletmeye göre seçilebilir. Veri depolama için depolama yöntemleri, dağıtılmış ilişkisel veritabanları, dağıtılmış dosya depolama sistemleri, dağıtılmış bellek veritabanları, dağıtılmış NoSql veritabanları, vb. Gibi farklı okuma ve yazma verimliliği, depolama maliyetleri ve depolama yönetimi uygulamalarına göre seçilebilir.

4.2 Veri analizi

Büyük veri analizi, ilk verileri analiz etmek için analiz modelleriyle birlikte büyük veri dağıtılmış hesaplama yöntemlerinin kullanılmasıdır. Büyük veri işleme yöntemleri, gerçek zamanlı hesaplama, bellek hesaplama, CEP karmaşık olay işleme hesaplama ve gerçek zamanlı olmayan hesaplama Harita / Azaltma işleme yöntemlerine dayalı akış hesaplamasını içerir Hesaplama yöntemi, gerçek iş ihtiyaçlarına göre seçilebilir. Veri analizi sürecinde, ilk olarak analitik verileri oluşturmak için ilk verileri hafifçe işleyin ve ardından analiz modelinin uygulanmasıyla analiz sonuç verileri elde edilir ve Şekil 4'te gösterildiği gibi değer hizmet verisi oluşturulur.

4.3 Veri Madenciliği Teknolojisi

(1) Karar ağacı

Karar Ağacı (Karar Ağacı), çok olgun ve yaygın olarak kullanılan bir veri madenciliği teknolojisidir. Ağaç olarak adlandırılır çünkü modelleme süreci bir ağacın büyüme sürecine benzer, yani kökten başlayıp gövdeye, dallara ve ardından dalların dallanmasına ve sonunda yaprak parçalarını büyütür. Bir karar ağacında, analiz edilen veri örnekleri önce bir ağaç köküne entegre edilir ve ardından katman katman dallara ayrılır ve son olarak birkaç düğüm oluşturur, her düğüm bir sonucu temsil eder. Karar ağacı algoritmalarının veri analizi ve madencilik uygulamalarında bu kadar popüler olmasının ana nedeni, karar ağaçlarının inşasının herhangi bir alan bilgisi gerektirmemesi, keşifsel bilgi madenciliği için çok uygun olması ve yüksek boyutlu verileri işleyebilmesidir. Birçok veri madenciliği ve istatistiksel analiz algoritması arasında, karar ağaçlarının en büyük avantajı, ağaç köklerinden, kendisi tarafından üretilen dallara (veya yapraklara) kadar olan bir dizi kuralın, analistler ve iş personeli tarafından kolayca anlaşılabilmesidir. Kuralların sıralanmasına (veya biraz sıralanmasına) bile gerek yoktur, bu, uygulanabilecek hazır bir iş optimizasyon stratejisi ve iş optimizasyon yoludur. Ek olarak, karar ağacı teknolojisi verilerin dağıtımına ve hatta eksikliğine çok toleranslıdır ve aşırı değerlerden kolayca etkilenmez.

(2) Küme analizi

Kümeleme analizi için popüler bir açıklama ve metafor vardır, yani "şeyler bir arada kümelenir ve insanlar gruplara ayrılır". Birkaç özel iş göstergesi için, gözlem nesnesi grupları benzerlik ve farklılığa göre farklı gruplara ayrılabilir. Bölünme sonrasında her gruptaki nesneler arasındaki benzerlik çok yüksek olacak ve farklı gruplardaki nesneler birbirleriyle yüksek derecede benzerlik gösterecektir.

(3) İlişkilendirme kuralları

İlişkilendirme Kuralı (İlişkilendirme Kuralı), veritabanı ve veri madenciliği alanında icat edilen ve geniş çapta incelenen önemli bir modeldir.İlişki kuralı veri madenciliğinin temel amacı, veri setinde (Sık Model) sık görülen örüntüyü, yani çoklu tekrarları bulmaktır. Örüntülerin ve birlikte meydana gelme ilişkilerinin (Coocurrence Relationships) ortaya çıkması, yani aynı anda ortaya çıkan ilişkiler, sık ve eşzamanlı ilişkiler de dernekler (İlişkilendirme) olarak adlandırılır.

(4) Regresyon analizi

Regresyon analizi, esas olarak çoklu doğrusal regresyon ve Lojistik Regresyona atıfta bulunan Doğrusal Regresyonu içerir. Bunlar arasında, lojistik regresyon daha çok müşteri kapsamlı algı veri analizinde kullanılır ve bu da yanıt tahmini, sınıflandırma ve bölümlemeyi içerir.

Çoklu doğrusal regresyon temel olarak bir bağımlı değişkenin bir grup bağımsız değişkenle nasıl değiştiğini açıklar Regresyon formülü (regresyon denklemi), bağımlı değişken ile bağımsız değişken arasındaki ilişkinin veri yansımasıdır. Bağımlı değişkenin değişimi iki kısımdan oluşur: sistematik değişim ve rastgele değişim Bunlar arasında sistematik değişikliğe bağımsız değişken neden olur (bağımsız değişken açıklanabilir) ve rastgele değişim bağımsız değişken tarafından açıklanamaz.Genellikle artık değer olarak adlandırılır. .

4.4 Görsel ekran

Büyük veri uygulamaları, verilerin hazırlanmasına ve analiz modellerine göre sonuçların analiz edilmesine ve dışa aktarılmasına dayanır Analiz sonuçlarının görselleştirilmesi ve doğrulanması gerekir.

Veri görselleştirme ekranı, müşteriler, servis personeli, yöneticiler ve karar vericiler için büyük veri sonuçlarının görselleştirilmesini gerçekleştirir. İş veri setinin özelliklerine ve potansiyel yapısına göre makul bir görselleştirme modeli seçin.Ana modeller, çok boyutlu görselleştirme modellerini (dağılım grafikleri, çizgi grafikleri, sütun grafikleri, pasta grafikleri), özel arazi ve hiyerarşik görselleştirme modellerini (haritalar ve ağaç türleri) içerir. Şekiller) ve karışık modeller (grafik resimler, dinamik görüntüler) vb. Görselleştirme teknolojileri arasında güçlü etkileşimli çoklu veri ekranı için Flex, güçlü etkileşimli çoklu animasyon ekranı için Flash, güçlü etkileşimli dinamik görüntü için Gümüş Işık, güçlü etkileşimli çoklu metin ekranı için Html5 vb. Bulunur.

Veri görselleştirme doğrulaması, iş veri setlerinin mantıksal dönüşümünün doğrulanması ve iş varsayımlarının doğrulanması, analiz sonuçlarının beklentileri karşılayıp karşılamadığının veya analiz sonuçlarına dayalı tahminler yapıp yapamayacaklarının doğrulanmasıyla doğrulanabilir. Doğrulama sonuçlarına göre büyük veri uygulamasındaki her işletmenin analiz modeli de sürekli ayarlanıp geliştirilebilir.

Referanslar

Shi Wenbo, Yu Junjie, Li Xiaoxiao ve diğerleri.Elektrik Güç GIS Sisteminin Tasarımı ve Uygulaması. Modern Elektronik Teknolojisi, 2015, 38 (21): 155-158.

Zhang Ting.Güç tedarik bürosunun dağıtım ağında GIS sisteminin uygulanması üzerine tartışma.Kentsel inşaat üzerine teorik araştırma (elektronik versiyon), 2014, (7).

Xu Jian. GIS tabanlı güç dağıtım ağı sistemi üzerine tartışma. Low Carbon World, 2015, (26): 90-91.

Xie Jiong, Erdun, Li Xin, et al.Elektrik enerjisi üretimi için GIS hizmet platformunun araştırılması ve tasarımı.Elektrik Gücü Bilgi ve İletişim Teknolojisi, 2013, 11 (9): 85-89.

Jiang Jinxia, Zhuang Xiaodan, Mei Feng, vd.Dağıtım ağı üretimi acil onarımı için bir komuta platformunun tasarımı ve uygulaması Elektrik Gücü Bilgileri, 2013, 11 (5): 57-61.

Yao Nan, Chen Zhe, Liu Yulin, ve diğerleri GIS tabanlı bir elektrik şebekesi hava afet izleme ve erken uyarı sisteminin geliştirilmesi.Elektrik Gücü Bilgileri, 2013, 11 (3): 41-45.

Cui Wei, Wang Bende.Elektrik gücü acil onarım izleme ve gönderme sisteminin geliştirilmesi ve uygulaması Elektrik Güç Sistemi Otomasyonu, 2002,26 (19): 64-67.

Guo Jiancheng, Qian Jing, Chen Guang, vd.Akıllı dağıtım ağı için kontrol sisteminin sevkıyatının teknik şeması.Elektrik Güç Sisteminin Otomasyonu, 2015, (1): 206-212.

Weng Yingjun, Zhu Zhongying.Güç Sistemi Otomasyonunda Coğrafi Bilgi Sistemi Teknolojisinin Uygulanması Güç Sistemi Otomasyonu, 2003, 27 (18): 74-78.

Liu Youbo, Liu Yang, Liu Junyong, vb. Güç sistemi basamaklı arızası, Hadoop mimarisine dayalı dağıtılmış hesaplama teknolojisi.Otomasyon Elektrik Güç Sistemleri, 2016, 40 (7): 90-97.

Xia Keqing, Chen Genjun, Li Li ve diğerleri.Çoklu veri kaynağı füzyonuna dayalı gerçek zamanlı şebeke hatası analizi ve gerçekleştirme.Elektrik Güç Sistemleri Otomasyonu, 2013, (24): 81-88.

Chen Chun, Wang Yeping, Cui Yimin ve diğerleri.Güç şebekesi arıza bilgi sisteminde arıza analizi ve yargılama.Elektrik Güç Sistemleri Otomasyonu, 2011, 35 (19): 97-100.

Lin Ying, Guo Zhihong, Chen Yufeng ve diğerleri Evrişimli tekrarlayan ağlara dayanan akım trafolarının kızılötesi arızalarının görüntü teşhisi.Güç Sistemi Koruma ve Kontrolü, 2015, (16): 87-94.

Li Yushu, Li Mingzhen Gözetimsiz trafo merkezlerinin uzaktan kontrolündeki yaygın arızaların analizi ve tedavisi Güç Sistemi Koruma ve Kontrolü, 2009, 37 (18): 145-146.

Li Tao, Wu Bing, Pan Lei, et al.Acil Durum Komuta Merkezinin Bilgi Erişim Yöntemine İlişkin Araştırma.Elektrik Gücü Bilgileri, 2012, 10 (11): 38-42.

Zhang Shangmo, Wang Yonghong, Hua Kan, vd.Acil durum komuta merkezinde çok seviyeli ses ve video ara bağlantısının araştırılması ve uygulanması.Elektrik Gücü Bilgisi, 2012, 10 (5): 33-36.

Li Xiaodong, Qu Yi, Hao Xiaolong, ve diğerleri.Elektrik şebekesi panoramik ekranı ve çalıştırma komut sistemi uygulaması.Elektrik Gücü Bilgileri, 2012,10 (1): 90-94.

Zeng Dong, Wang Fa, Xu Jinming, vd.Şanzıman durumu izleme platformuna dayalı denetim sisteminin araştırılması ve uygulaması.Elektrik Gücü Bilgileri, 2011,09 (11): 96-99.

yazar bilgileri:

Liu Zhoubin1, He Ting2, Li Qinyuan1, Hu Xiaozhe2, Xiang Xiang2, Yuan Yongjun2, Wang Haifeng2

(1. State Grid Zhejiang Electric Power Co., Ltd. Elektrik Enerjisi Araştırma Enstitüsü, Hangzhou 310007, Zhejiang; 2. Eyalet Şebekesi Zhejiang Hangzhou Fuyang District Power Supply Co., Ltd., Hangzhou, Zhejiang 311400)

"Gu Qu · Zhou Lang" - Zhou Xiaomeng'den Peking Operası Özel Performansı
önceki
2019 DMP Greater Bay Area Endüstri Fuarı'nın açılışı, 100'den fazla yeni ürün ve teknolojinin görücüye çıkarılması
Sonraki
11 sayı, 24 üye, bu üçlü örgüt 5 gündür yargılandı
İlk yarı-Barcelona 0-1 Leganes, Enesri World Wave
2. Haisi Somut Olmayan Miras Sergisi, somut olmayan miras becerilerini ve kültürünü sergilemek için Quanzhou'da açıldı
Polis arka arkaya çok sayıda hırsızlığı bozdu, polis hırsızlığa dikkatsiz olmamasını hatırlattı
Deney: PN bağlantı kapasitansı ve voltaj arasındaki ilişki
İlk yarı-Evergrande 1-0 SIPG, Talisca gol attı, Yan Junling koştu
"Azrail" girişimciliğiyle yüzleşmek: Bu Afrikalı genç kadın 4 yılda 6000 kişiyi kurtardı
Bugünün sıcak araması ağlamak için çok güzel
NetEase, şiddetli işten çıkarmalar için özür diler: bu gerçekten kaba ve takipte yardım sağlayacaktır
Cao Yu, filme sihir katmak için ışık ve gölge kullanarak En İyi Fotoğrafçılık dalında Altın Horoz Ödülü'nü kazandı.
"Maskeli Şarkıcı Tahmin Et ve Tahmin Et" Yan Renzhong'un üçüncü sayısında ortaya çıkan "soğuk ses" sesi büyük ilgi gördü
"Blog Sonrası Seçimi" Sinyal Bütünlüğü Analizi-Empedans Eşleştirme ve Sinyal Yansıması
To Top