Akıllı operasyon ve bakım, operasyon ve bakım personelinin yapay zeka ile değiştirilmesidir?

Yapay zeka operasyonu ve bakımı hakkında bir şeyler duyduktan sonra, birçok kişi daha endişeli hissediyor. Yaptığım operasyon ve bakım ya da geliştirme, gelecekte yapay zeka ile değiştirilecek mi?

Artık yeni teknolojiler çok hızlı gelişiyor, her türden dil, teknoloji ve kavram herkesin bunalmış hissetmesine ve yetişememesine neden oluyor.Ama bir nokta var, burada tekrarlamak istiyorum ki, AI hala bu aşamada herkese yargılarda bulunma konusunda yardımcı olmanın bir yolu. Ve öğrenmek, bulmak ve sorunları çözmek için kullanılan araçlar, tıpkı sürücüsüz gibi, artık tamamen kimse tarafından kullanılamıyor mu? Kesinlikle hayır.Gelecekte, insansız sürüş tamamen insanların yerini alabilir, ancak daha alması gereken uzun bir yol var. Yapay zeka operasyonu ve bakımı sürücüsüz sürüş gibidir.Gelecek parlak, ancak daha önümüzde uzun bir yol var.

Akıllı işletim ve bakımın çoğu henüz tam olarak uygulanmadı ve benim şirketim de keşif aşamasında. Geleneksel bir işletmede operasyonu ve bakımı nasıl yapılmalıdır? Önceki komut dosyalarından araçlara ve otomasyona, mevcut akıllı çalıştırma ve bakıma, bu adım ortada nasıl atılmalıdır? Bugün sizinle aşağıdaki beş yönden paylaşacağım:

1. Kapsamlı ve bilimsel bir BT operasyon ve bakım yönetim sistemi oluşturun

  • İlk BT departmanının genel olarak tanınması yetersizdir. BT artık herhangi bir organizasyonda nispeten önemli bir departman olmasına rağmen, birçok lider hala bunun bir kar merkezi değil, bir maliyet merkezi olduğuna ve bu departmanın iş değeri yaratmak yerine para harcadığına ve Kar elde etme.

  • İkincisi, işletme ve bakım personeli için nispeten ağır bir yüktür ve çalışma modu çalışanlar tarafından tanınmaz. Otomatik bir operasyon ve bakım platformu olmadan önce, tüm operasyon ve bakım ekibinin sadece sekiz çalışanı vardı.Her bir kişi günde altı ila on arızayı ele alsaydı, temelde başka şeyler üzerinde çalışmak için zaman kalmazdı. Geleneksel operasyon ve bakımlar büyük baskı altındadır ve yangınları yürütmekten ve bunlarla mücadele etmekten yorulurlar. Değişim peşinde koşmalı ve otomasyona, platformlaşmaya ve zekaya doğru ilerlemelidirler.

  • Üçüncü operasyonun durumu hakkında yetersiz bilgi. İzleme çok boyutludur ve farklı işletmelerin farklı göstergeleri vardır.Hepsi on binlerce göstergeye sahiptir, ancak genel bir durum değişim çizelgesi yoktur, bir sistem oluşturmak zordur ve akıllı algılama ve durum tahmini gerçekleştirilemez.Tüm işletme ve bakım durumu İstikrarı korumak zordur.

  • Dördüncüsü, iş ihtiyaçlarına göre hizmetleri ayarlama ve kaynakları belirleme yeteneği yetersizdir. İşle ilgili birçok teknik departmanı içeren ve iş tarafı ile etkileşime giren iş hatalarının üstesinden gelmek uzun bir süreç gerektirir ki bu daha az insan gücüyle pek mümkün değildir.

Mevcut iş sisteminde operasyon ve bakım departmanının böyle bir operasyon ve bakım hedefine ulaşmasını umuyoruz?

  • İlk kapsamlı performans yönetimi. Mevcut tüm ekipman ve hizmet kalitesinin gerçek zamanlı izlenmesini sağlayabilir ve dinamik eşik alarmları sağlayabilir.

  • İkinci birleşik kaynak yönetimi. Pek çok kurumsal işletme buluta geçti ve tüm işletmelerin ilgili kaynak görünümlerini yakalamak için birleşik bir izleme platformuna ihtiyaç var, böylece makul bir tahmin ve genel kaynak tahsisine sahip olabilir ve her bir işletme departmanının kaynaklarını genel bir bakış açısıyla değerlendirebiliriz Kullanım.

  • Üçüncü zamanlı arıza alarmı yönetimi. Pek çok ürünün tam ve zamanında alarm sağlayamadığını tespit ettik.Bir alarm oluştuktan sonra, yalnızca bir gecikmeden sonra bilinir.Gecikmeleri ve yanlış alarmları azaltmak için gerçek zamanlı ve doğru alarmlar gereklidir.

  • Dördüncü merkezi ekran yönetimi. Birçok farklı izleme alt sisteminin entegre edilmesi mevcut işletmelerde büyük bir taleptir.Çeşitli araçların yardımıyla veriler toplanır ve daha sonra yönetim için uygun olan birleşik görüntüleme için otomatik olarak bir rapor halinde sentezlenir.

Endişelendiğimiz temel konular şunlardır:

  • Birincisi, bölgeler arası bir platformuz ve birden fazla veri merkeziyiz.Birleşik yönetim için BT ile entegre bir işletim ve bakım platformuna sahip olmayı umuyoruz.

  • İkincisi, verimliliği artırmak için derinlemesine izleme ve merkezi ve birleşik görsel yönetimdir.

  • Üçüncüsü, sorunları etkin bir şekilde önlemek ve işletme ve bakım maliyetlerini azaltmaktır. Ek olarak, bir sorun meydana geldikten sonra, işçilik maliyetlerini hızlı bir şekilde takip edip bulabilir ve azaltabilir.

  • Dördüncü boyut raporu, karar verme için güçlü destek sağlar ve eğilimleri bilimsel olarak tahmin eder.

  • Beşincisi, küresel iş hizmeti perspektifinin entegrasyonu ile platform genişletme ve büyük veri analizi, işletmelerin iş verimliliği ve hızlı yineleme ihtiyaçlarını karşılar.

  • Altıncı olarak, BT varlıklarını koruyun ve optimize edin. Geçmişte, her işletme, kendi geliştirme, işletme ve bakım personeli ve izleme sistemi ile kendi sistemleri setiydi.Bu, işletmeler için tekrarlayan bir çarktır. Şimdi, buluta gittikten sonra, orijinal sistem, birleşik izleme ve kaynak yönetimi aracılığıyla varlıkları en iyi şekilde korumak ve optimize etmek için buluta entegre edilecek.

Akıllı işletim ve bakım yapmadan önce derinlemesine bir analiz yaptık ve dört gereksinim ortaya koyduk:

  • Birincisi normalleşmedir. Standardizasyon, şablonda hangi temel yapılandırma ve güvenlik temelinin olduğu gibi operasyonu mümkün olduğunca standartlaştırmak ve standartlaştırılmış bir standarda sahip olmaktır.

  • İkincisi kontrol edilebilirliktir. Kaynak darboğazları ve performans darboğazları dahil olmak üzere bulut izleme platformu aracılığıyla her bir işletmedeki darboğazları bulabilmek ve olası sorunları kontrol edip analiz edebilmek.

  • Üçüncüsü dijitalleşmedir. Büyük verilere dayalı karar analizi, doğru yargıları ve bilimsel kararları kolaylaştırabilir.

  • Dördüncüsü girişimdir. Pasif bir tepkiden aktif bir hizmete geçme, sorunları proaktif olarak keşfetme, en baştan ortadan kaldırma ve iş sorunları ortaya çıkmadan önce zamanında bilgilendirme duygusu farklıdır.

Aşağıdaki şekilde gösterildiği gibi, esas olarak aşağıdaki 5 açıdan modern ve akıllı bir operasyon ve bakım yönetimi modeli oluşturmayı umuyoruz:

2. Panorama işletme hizmeti yönetimi

İnternet patlaması çağında, İnternet +, dijital dönüşüm ve istihbarat da ulusal düzeyde teşvik ediliyor. Sistemimiz hızlı yanıt verip işe eşlik edebiliyor mu?

İş odaklı BT hizmet yönetimi temel olarak aşağıdaki özelliklere sahiptir:

  • 1. İzleme ayrıntı düzeyi iyi olmalıdır ve anormal noktalar bir eğri boyunca yakalanabilir.

  • 2. İşletme yönetimi ve kullanıcı odaklı yönetim için. Bu ayırt edilmelidir.İşletmede kullanıcı yetkisi görece ayrıntılıdır Kim ne tür bir iş yürütebilir ve yöneticinin ne tür işleri yönetebileceği net bir konuma sahiptir.

  • 3. Verilerin kapsamlılığı ve ölçeklenebilirliği. Bilimsel karar verme, yalnızca veriler kapsamlıysa yapılabilir.Çoğu durumda, eksik günlükler görürseniz veya yanlış izleme verileri alırsanız, karar verirken kesinlikle daha fazla aceleci davranacaksınız. Örneğin, veri merkezindeki belirli bir hizmet bağlantısında bir sorun varsa, değiştirilmeli mi? Veriler tutarlı kalabilir mi? Şu anda, kararınızı destekleyecek kesin bir veri olmadan önce, karar verirken daha gergin ve tereddütlü hissedeceksiniz.

İş odaklı entegre bir izleme platformu oluşturmanın temel amacı, birleşik bir şekilde görüntülemek, yönetmek ve dağıtmaktır. Tam bağlantı izleme, amaç, erişim girişinin geldiği ve verilerin çıktığı andan itibaren her süreci izlemek ve algılamaktır.

BT temel kaynaklarını iş perspektifinden yönetin ve sürdürün. Bir kaynak arızalandığında veya bir sorun olduğunda, bu kaynağın başarısızlığından hangi işin hangi hizmetlerin etkileneceğini sezgisel olarak anlayabilir ve ardından hangi kullanıcıların etkileneceğini anlayabilirsiniz. .

Veritabanı yavaş ve CPU aniden yükseliyor Bu kaynaklar bu yerlerde aniden değiştikten sonra, hangi işler etkilenecek? Şu anda, hangi işletmenin etkilendiğini doğru bir şekilde tespit edebilmek için izleme kaynağı görünümünü işletmeyle ilişkilendirmeniz gerekir.

Bu, sorunun genel teşhisi ve analizidir.

Herhangi bir sorunun bilimsel ve kapsamlı bir şekilde analiz edilebilmesi için ilgili günlükleri ve verileri toplaması gerekir.

Toplama katmanının farklı veri kaynaklarından veri toplaması gerekir ve orta katman bazı performans analizleri, konfigürasyon yönetimi, erken uyarı analizi ve alarm işleme yapar. Görüntü katmanı, analiz sonuçlarını, yani çeşitli grafikleri görüntüler ve temel neden konumlandırmayı ve problem çözmeyi kolaylaştırmak için kapsamlı bir iş göstergesi analizi oluşturur.

3. Büyük veri platformuna dayalı log analizi ve çok boyutlu raporlar

Büyük veri platformuna dayalı olarak, verimliliği ve memnuniyeti doğru ve kapsamlı bir şekilde bulmaya ve iyileştirmeye, akıllı tahmin ve erken uyarıya yardımcı olmak için günlük korelasyon analizi aracılığıyla günlük toplama ve toplama işleme sağlar ve bilimsel karar verme için nicel bir temel sağlar.

Toplanan ağ izleme verilerini, bilgisayar odası verilerini, sunucu ve bulut ortam izleme verilerini ve kamera alarm verilerini toplayın Veriler toplandıktan sonra PMDB performans yönetimi kitaplığı oluşturulur.İş uygulamalarının özelliklerine göre ilgili algoritma analizi için farklı modeller oluşturulur.

KPI göstergeleri, farklı kaynak türlerine göre tanımlanır.Modellemenin amacı, hızlı analizi kolaylaştırmak ve kaynak yönetimi, alarm yönetimi ve merkezi ekran gibi diğer modüller için veri analizi modeli desteği sağlamaktır.

İki tür veri toplama vardır, biri pasif diğeri aktiftir.

İşle ilgili göstergeleri toplayın, verileri önceden işleyebilir, bu bilgilerin ve göstergelerin sizi ilgilendirip ilgilendirmediği gibi bazı etkili etiket tanımlamaları yapabilir ve dostça olmayan günlükleri biçimlendirebilirsiniz.

Performans göstergelerinin hesaplanması iş ile koordine edilmeli ve iş perspektifinden tanımlanmalıdır. Ayarlamak Eşik, bazı sahneler sabittir ve bazı sahneler dinamiktir. Sabit eşik, kaynak kullanım oranına eşittir ve bir üst sınır olmalıdır. Dinamik eşikler, bazı performans eğrileri gibidir. CPU kullanımı, sayfa tepkisi, görüntü yükleme vb. İçin dinamik eşikler kullanılabilir. Bu dinamik eşik, geçmiş verilere dayalı olarak hesaplanır ve belirli bir zamandaki geçmiş tepe değeri, bunlara dayalı olarak makul şekilde hesaplanır. Her zaman kaç kaynağa ihtiyaç vardır.

Yukarıdaki eşiğe göre, bir alarm olayı olacaktır.Her türlü olay oluşumu zamana dayanır.Arıza konumu, ilgili günlükleri ve olayları bulmak için zamana da bağlı olmalıdır.

Olay teşhisi, operasyon ve bakım alanında her zaman çok önemli bir iş olmuştur.Olaylar ve zamanlama arasındaki korelasyon, olay teşhisi için iyi bir ilham kaynağı olmanın yanı sıra, kök neden analizi yapmamıza yardımcı olurken iyi ipuçları da sağlar. Belli bir zaman diliminde meydana gelen arızalar, ilgili bazı olayları ortaya çıkaracaktır. Bunları filtrelemek ve filtrelemek, arızayı ayrıntılı olarak yakalayabilir ve temel nedeni bulabilir.

Teşhis ve işlemede, algoritmaların tanıtılması gerekip gerekmediği, bence gerekli, eğer verimliliği artırabilir ve problem çözme yeteneğini geliştirebilirse, tüm keşiflere değer.

Operasyon ve bakım endüstrisinde algoritmaları öğrenmek ve araştırmak için çok fazla zaman ve enerji harcayan bazı arkadaşlar da var. Algoritmalarla fazla uğraşmanız gerektiğini düşünmüyorum. Basitçe bu açık kaynaklı algoritmaları anlayın ve bu algoritmaların girdi ve çıktılarının ne olduğunu öğrenin, bu da işletim ve bakımı çözebilir. Asıl problemler nelerdir ve bunları birleştirerek hangi problemler çözülebilir, böylece onları makul bir şekilde uygulayabiliriz, bu da akıllı operasyon ve bakımın daha hızlı bir şekilde uygulanmasını sağlayacaktır.

Veri toplama işlemi, toplanan verileri organik olarak ilişkilendirmek, standartlaştırılmış bilgileri oluşturmak için sıkıştırmak ve filtrelemektir. Veri içe aktarımı, tam HDFS ve artımlı Kafka aracılığıyla gerçekleştirilebilir.

Büyük veri platformunun çok boyutlu raporundan yola çıkarak kendi ihtiyaçlarına göre gün, hafta ve aya göre işletme ve bakım raporları oluşturup yönetimin liderlerine gönderin.Bu veriler onlar hakkında daha fazla endişe duyuyor ve bu dönemlerde neler olduğunu daha net bir resim gösteriyor Sorunlar ve etkinin boyutu nelerdir ve ardından ilgili kaynakların genişletilip genişletilmeyeceğini ve ilgili iş dağıtımının ayarlanması gerekip gerekmediğini belirleyin.

Kapsamlı ekran, performans analizi, kapasite analizi ve otomatik yapılandırmaya odaklanır. Örneğin, bu yıl 500 TB depolama alanı satın aldım, ne kadar kullandım, gelecek yıl ne kadar kapasite genişletmem gerekecek ve ne kadar iş büyümesi olacak ki bunların hepsi şirketin satın alma planını etkiliyor. İşletmenin gerçek değerlendirmesine göre, gelecek yıl kaç terabayt depolama alanı satın almanız gerektiği tahmin ediliyor.

4. BT izleme ve yönetim platformunun geliştirilmesi

Yaklaşık üç nesil BT izleme ve yönetimi vardır. 1990'lardan günümüze, ilk nesil ağ merkezlidir.Bu dönemde, daha fazla ağ tabanlı izleme ve arıza tespiti, bant genişliği yönetimi ve hizmet seviyesi anlaşmaları sağlıyoruz. .

İkinci nesil izleme, BT altyapısının izlenmesine odaklanır ve daha çok gördüğümüz şey, ana bilgisayarlar, depolama, işletim sistemleri, ara yazılımlar ve veritabanları gibi çeşitli temel kaynakların izlenmesidir.

Üçüncü nesil izleme, BT uygulamalarına odaklanmıştır. Daha karmaşık işlemler için, kullanıcı deneyimi ve uygulama odaklı yüksek kullanılabilirlik için gerçek zamanlı izleme ve hataya yönelik akıllı teşhis gerçekleştirilmelidir.İşletme ve bakım personeli üst düzey bir plana, kapsamlı bir planlamaya ve genel bir durumu sağlama becerisine sahip olmalıdır. Esnek, verimli, sağlam, standartlaştırılmış ve otomatikleştirilmiş izleme çözümlerini uygulayın.

Beş, hata yönetimi ve otonom kendi kendini iyileştirme

Bu her gün aldığımız alarmların istatistikleri ... Otomasyon ve istihbarattan önce ben de herkes gibi endişeliydim ve çökmüştüm.

Karmaşık operasyon ve bakım izleme verilerinden ihtiyacımız olan bilgileri ve sonuçları nasıl elde edeceğimiz tek kelimeyle ayırt etmek ve iyileştirmek, gerçekten dikkat edilmesi gereken bilgileri çıkarmak ve böylece günlük alarm bilgisinin miktarını azaltmaktır.

Amaç basitlik, bilgelik ve derinliktir.

Basitlik, iş ve SLA hizmet düzeyini sağlamak, sorunlara anında yanıt vermek, bunları otomatik olarak analiz etmek ve optimize etmek, işleme sürecini kolaylaştırmak ve verimli bir şekilde birleştirmek, sorunu doğru sahneyle eşleştirmek, doğru kişiyi bulmak ve bununla ilk seferde doğru şekilde ilgilenmektir.

Makine öğrenimi esas olarak zekayı vurgulamak içindir. Bu, eğitmek için çok fazla veri gerektirir. Arıza biçimleri tuhaf ve tuhaftır. Arızaların geçmiş verileri sınıflandırılır ve etiketlenir ve model tanıma ve veriler, makine tanıma ve analizini eğitmek için kullanılır ve ardından makineye otomatik olarak izin verilir Doğru yargılayın.

Elbette, etiketlemeye tamamen insanlar tarafından güvenilemez. Aynı zamanda makineler tarafından otomatik anahtar kelime etiketleme gerektirir. Etiketlemenin rasyonalitesi insan yargısını gerektirir ve ardından makine öğrenimi, bazı kararlar vermemize gerçekten yardımcı olmak için kullanılabilir.

Yakınsama alarm olayları mimariye, mühendisin deneyimine ve olasılığına göre elde edilir, alarm olayları teknik özelliklere ve iş bölümüne göre oluşturulur ve doğru kişiye gönderilir ve olay işleme yetenekleri veri ve modellere göre geliştirilir. Bir çok olay, bazı mühendisler tarafından çok hızlı bir şekilde halledilir, aksine, arızaya aşina olmayan kişiler için uzun zaman alabilir. Bu, başkalarının başvurması ve benzer senaryolarda olayları ele alma becerisini geliştirmeyi öğrenmesi için stratejik bir bilgi tabanının oluşturulmasını gerektirir.

Akıllı işletim ve bakımın nihai amacı, insanlara olan bağımlılığı azaltmak, makineye kademeli olarak güvenmek ve makinenin kendi kendini yargılama, kendi kaderini tayin etme ve kendi kaderini tayinini gerçekleştirmektir.

Teknoloji sürekli gelişiyor. AI teknolojisi, gelecekte çözmek için çok fazla insan gücü ve zaman gerektiren birçok şeyi çözecektir, ancak AI saf bir teknoloji değildir.Aynı zamanda belirli kurumsal senaryolar ve işletmelerle birleştirilmesi ve bilgi işlem tarafından yönlendirilmesi gerekir. Ve veri odaklı, gerçekten kullanılabilir bir ürün üretebilir.

İşletmede akıllı işletme ve bakım teknolojisinin uygulanması bir gecede tamamlanmamakta, kademeli ve değerin yaygınlaştırılması sürecidir.

Akıllı işletim ve bakım teknolojisinin yeni işletme ve bakım evriminin bir başlangıcı haline geldiğini görebiliriz.Daha verimli ve daha fazla platform uygulamasından sonra, akıllı işletim ve bakımın tüm BT alanına daha fazla tazelik ve canlılık katacağı öngörülebilir. Trende öncülük eden önemli bir güç olmak için geliştirin ve büyüyün!

Sao Nan'ın köpeğine bir araba çarptı ve öldü, ancak Lao Sao, Weibo'dan şikayet etti ancak netizenler tarafından püskürtüldü
önceki
Google Cloud CEO'sunun ayrılışının iç hikayesi
Sonraki
Fiyat 40 milyon RMB'yi aşıyor mu? ! Bu son resmi LaFerrari Aperta üstü açılır süper otomobil ...
Cumhuriyetin anısı Çin'in petrol endüstrisinin temelinin atılmasından Chongqing Üniversitesi'nin geçmişi ve şimdiki aya "sebze ekmeye" kadar
Milli Eğitim Bakanlığı 2017 Üniversite Bilimsel Araştırma Üstün Başarı Ödülü açıklandı
InfluxDB + Grafana'ya dayalı bir büyük veri izleme aracı oluşturun
Yerli üretim yeni Mercedes-Benz GLA özel baskı beyanname haritası Panda renk eşleştirme
Air Force 1, NBA ile karşılaştığında, aynı anda 8 rengi kim sevmez?
Noon Star News | "Captain Marvel" ilk gününde anakarada 227 milyon gişe ile Marvel'ın anakaradaki gişe rekorunu kırdı; Wu Lei kek besliyor! Espanyol 1: 1'e yakın 6 rauntta yenilmedi
Eğitim Bakanlığı'nın okullara girişteki kaosu düzeltmesi gerçekten etkileyici! Olimpiyatların en iyi yarışmasını aniden askıya aldı!
Zorluktan harikaya, Linux işletim ve bakım mühendislerinin yükseltme yolunu açıklayın
Mi 7 kararlı! Serbest bırakma süresinin resmi teşhisi: Mayıs sonunda buluşmak
FIFA futbol dünyasının en çok oy alan futbolcuları, aynı zamanda gerçekte de en iyiler
"Kuzeydoğu'nun Yirmi Yılı" sabit dosya posterleri ve fragmanları 1 Mayıs'ta, geçmişe bakılarak yayınlanacak
To Top