5 yıllık çalışma ve bakımdan sonra, bu izleme bilgi sistemine güvenerek 3K'dan 40K'ya geçtim | The Force Project

Yazar | CSDN blogger

Sorumlu Editör | Yu Yan

Üretildi | CSDN (ID: CSDNnews)

İşletme ve bakımdan hiç bahsetmedim çünkü işletme ve bakımın çok fazla bilgi gerektirmediğini düşünüyorum.Sonra işletme ve bakım yapan bir arkadaşım bana bunun büyük bir hata olduğunu söyledi, 3K işletme ve bakımdan adım adım 40K'ya geçti. Hatta gülümsedi ve şöyle dedi: Artık her şeyi yapabileceğimi hissediyorum.

Söylendiği için en önemli şeyden bahsedelim.

İzleme, tüm operasyon ve bakımın ve hatta tüm ürün yaşam döngüsünün en önemli kısmıdır.Arızalar önceden zamanında tespit edilir ve daha sonra sorunların izlenmesi ve yerinin belirlenmesi için ayrıntılı veriler sağlanır. Sektörde aralarından seçim yapabileceğiniz birçok iyi açık kaynaklı ürün var. Açık kaynaklı bir izleme sistemi seçmek, zaman kazandıran ve verimli bir çözümdür. Elbette, izlemeyi çok iyi anlamayan arkadaşlar, aşağıdaki makaleleri okuduktan sonra tüm izleme sistemi hakkında daha derin bir anlayışa sahip olabilirler.

İzleme hedefi

Herkesin farklı sektörler, şirketler, işletmeler ve pozisyonlar nedeniyle farklı izleme anlayışları vardır.Ancak, izlemenin belirli bir izleme teknolojisinin kullanımı için değil, şirketin iş perspektifinden değerlendirilmesi gerektiğini unutmamalıyız.

  • Sistemin kesintisiz gerçek zamanlı izlenmesi : Aslında, sistemin sürekli gerçek zamanlı izlenmesidir (bu izlemedir);

  • Sistemin mevcut durumu hakkında gerçek zamanlı geri bildirim : Belirli bir donanımı veya belirli bir sistemi izlediğimizde, mevcut sistem durumunu gerçek zamanlı olarak normal, anormal veya arızalı olarak görebilmemiz gerekir.

  • Servis güvenilirliğini ve güvenliğini sağlayın: İzlememizin amacı, sistemlerin, hizmetlerin ve işletmelerin normal çalışmasını sağlamaktır.

  • Sürekli ve istikrarlı iş operasyonunu sağlayın: İzlememiz mükemmel ise, bir arıza olsa bile, işletmenin sürekli ve istikrarlı çalışmasını sağlamak için arıza alarmını ilk seferde alıp ilk seferde halledebiliriz.

  • İzleme yöntemi

    1. İzleme nesnesini anlayın: Neyi izlemek istediğimizi biliyor musun? Örneğin, CPU nasıl çalışır?

    2. Performans karşılaştırma göstergeleri: Bu şeyin hangi özelliklerini izliyoruz? CPU kullanımı, yük, kullanıcı modu, çekirdek modu ve bağlam değiştirme gibi.

    3. Alarm eşiğinin tanımı: Nasıl bir hata olarak değerlendirilip polisi arayabilir? Örneğin, CPU yükü ne kadar yüksek Kullanıcı modu ve çekirdek modu ne kadar yüksek?

    4. Arıza işleme süreci: Bir arıza alarmı aldım, bununla nasıl başa çıkacağız? Daha verimli bir süreç var mı?

    İzleme çekirdeği

    • sorun bulundu: Sistemde bir arıza alarmı oluştuğunda, bir arıza alarm mesajı alacağız.

    • Konum sorunu: Arıza e-postası genellikle belirli bir ana bilgisayar arızasının içeriğini ve belirli arızayı yazar.Alarm içeriğini analiz etmemiz gerekir. Örneğin, bir sunucu bağlanamıyorsa, bunun bir ağ sorunu olup olmadığını veya yükün uzun süre bağlanmak için çok yüksek olup olmadığını veya belirli bir geliştirme bir güvenlik duvarı yasaklama stratejisini tetiklediğini vb. Değerlendirmemiz gerekir, arızanın belirli nedenini analiz etmemiz gerekir.

    • Problemi çöz: Elbette arızanın sebebini anladıktan sonra, arızayı çözme önceliği üzerinden çözmemiz gerekiyor.

    • Sorunu özetlemek gerekirse: Büyük arızaları çözdükten sonra, gelecekte tekrar oluşmasını önlemek için başarısızlıkların nedenlerini ve önlenmelerini özetlememiz gerekir.

    İzleme araçları

    Aşağıda, şirketin işinin izlemesi için uygun bir izleme aracı seçmemiz gerekiyor. Burada, izleme araçlarının basit bir sınıflandırmasını yaptım.

    1. Yerleşik izleme

    • MRTG (Çok Yönlü Trffic Grapher) Olten, İsviçre'den Tobias Oetiker ve Dave Rand tarafından geliştirilen ve GPL lisanslı ağ trafik grafiklerini çizmek için kullanılabilen bir yazılım setidir. MRTG'nin en iyi versiyonu 1995 yılında piyasaya sürüldü. Perl'de yazılmıştır ve çeşitli platformlarda kullanılabilir.Veri toplama SNMP protokolünü kullanır.MRTG, bir Web sayfası aracılığıyla cep telefonundan GIF veya PNG formatında veri çeker.

    • Ganglia Kümeler ve ızgaralar gibi platformlar arası, ölçeklenebilir, yüksek performanslı dağıtılmış bir izleme sistemidir. Hiyerarşik bir tasarıma dayanır, çok çeşitli teknolojiler kullanır ve verileri depolamak için RRDtool kullanır. Görsel bir arayüz ile küme sistemlerinin otomatik olarak izlenmesi için uygundur. Dikkatlice tasarlanmış veri yapısı ve algoritması, izleme terminalinden izlenen terminale bağlantı ek yükünü çok düşük hale getirir. Şu anda binlerce küme, 2000 düğümlü bir küme ortamını kolayca idare edebilen bu izleme sistemini kullanıyor.

    • Kaktüsler (İngilizce anlamı kaktüs), PHP, MySQL, SNMP ve RRDtool'a dayalı olarak geliştirilmiş bir ağ trafiği izleme grafik analiz araçları kümesidir. Veri elde etmek ve çizim yapmak için RRDtool'u kullanmak için snmpget kullanır, ancak kullanıcıların RRDtool'un karmaşık parametrelerini anlamasına gerek yoktur. Çok güçlü veri ve kullanıcı yönetimi işlevleri sağlar.Her kullanıcının ağaç yapısını, ana cihazı ve herhangi bir resmi görüntüleyebileceğini belirtebilirsiniz.Ayrıca, kullanıcı kimlik doğrulaması için LDAP ile birleştirilebilir ve ayrıca şablonu özelleştirebilir. Tarihsel veri görüntüleme ve izleme açısından, işlevi oldukça iyidir. Cacti, şablonlar ekleyerek farklı cihazların izlenmesini yeniden kullanılabilir hale getirir ve özelleştirilebilir çizim işlevine sahiptir ve güçlü hesaplama yeteneklerine (veri birleştirme işlevi) sahiptir.

    • Nagios Hizmetlerin ve ağ bilgilerinin çalışma durumunu izleyebilen, belirlenen yerel veya uzak ana bilgisayarların durumunu ve hizmetlerini izleyebilen ve anormal alarm bildirim işlevleri sağlayan kurumsal düzeyde bir izleme sistemidir. Nagios, Linux ve UNIX platformlarında çalışabilir. Aynı zamanda, sistem yöneticilerinin ağ durumunu, çeşitli sistem sorunlarını ve sistemle ilgili günlükleri görüntülemesini kolaylaştırmak için bir web arayüzü sağlanmıştır. Nagios'un işlevi, izleme hizmetlerinin kullanılabilirliğine odaklanır ve izleme göstergelerinin durumuna göre alarmları tetikleyebilir. Şu anda, Nagios da belirli bir pazar payına sahip, ancak Nagios zamana ayak uyduramadı ve artık değişen izleme ihtiyaçlarını karşılayamıyor.Mimarinin ölçeklenebilirliği ve kullanım kolaylığı iyileştirilmelidir.Gelişmiş işlevleri Nagios XI'in ticari sürümüne entegre edilmiştir. içinde.

    • Sigara içen Genelde geleneksel ping, www sunucusu performansı, DNS sorgu performansı, SSH performansı vb. Dahil olmak üzere ağ performansını izlemek için kullanılır. Alt katman da RRDtool tarafından desteklenmektedir.Özelliği çizimin çok güzel olmasıdır.Ağ paket kaybı ve gecikmesi renkler ve gölgelerle işaretlenmiştir.Birden fazla resmin üst üste dizilmesini destekler.Yazar ayrıca MRTG ve RRDtll gibi araçlar geliştirmiştir. Sigara içme sitesi:

    • Açık kaynak izleme sistemi OpenTSDB Dağıtılmış ve ölçeklenebilir bir zaman serisi veritabanı oluşturmak için tüm zaman serileri (örnekleme yok) verilerini depolamak için HBase kullanın. İkinci seviye veri toplamayı, kalıcı depolamayı, kapasite planlamasını ve mevcut alarm sistemlerine kolay erişimi destekler. OpenTSDB, büyük ölçekli kümelerden (ağ ekipmanı, işletim sistemleri ve kümedeki uygulamalar dahil) ilgili toplama göstergelerini elde edebilir ve bunları depolayabilir, dizine ekleyebilir ve sunabilir, böylece bu verilerin Web gibi daha kolay anlaşılması, Grafik vb.

    2. Ace izleme

    • Zabbix Birden fazla toplama yöntemini ve toplama istemcisini destekleyen dağıtılmış bir izleme sistemidir.Özel bir Ajan aracısına sahiptir.Ayrıca SNMP, IPMI, JMX, Telnet, SSH ve diğer protokolleri destekler.Toplanan verileri veritabanında depolar ve ardından Bunları analiz edin ve sıralayın ve koşullar karşılandığında alarmları tetikleyin. Esnek ölçeklenebilirliği ve zengin işlevleri, diğer izleme sistemleri ile eşsizdir. Nispeten konuşursak, genel işlevi çok iyidir. Yukarıdaki çeşitli izleme sistemlerinin karşılaştırmasından Zabbix'in avantajları vardır: Zabbix'in zengin işlevleri, genişletilebilir yetenekleri, ikincil geliştirme yetenekleri ve kullanımı kolay özellikleri ile okuyucular biraz öğrenerek kendilerini inşa edebilirler. İzleme sistemi.

    • Xiaomi'nin izleme sistemi: Açık Falcon. Open-Falcon'un amacı, kurumsal düzeyde en açık ve en kullanışlı İnternet izleme ürününü yapmaktır.

    3. Üç taraflı izleme

    Piyasada Surveillance Bao, Surveillance Easy, Tingyun ve birçok bulut satıcısının kendi izlemesi var gibi pek çok iyi üçüncü taraf izleme var, ancak buradaki girişe odaklanmayacağım.Üçüncü taraf izleme hakkında bilgi edinmek istiyorsanız, danışma için resmi web sitesine gidebilirsiniz. . (Reklam yerleşiminden kaçının)

    İzleme süreci

    Yukarıda o kadar çok şey anlatıldı, en uygun izleme aracı hangisidir? Birkaç açık kaynak izleme aracı öneriyorum: Zabbix, Open-Falcon, LEPUS Tiantu (izleme veritabanına adanmış). Ancak bu makale, izleme sistemi ekosisteminin tamamını oluşturmak için hala Zabbix'e dayanmaktadır. Zabbix'in tüm süreci hakkında konuşalım:

  • Veri toplama: Zabbix, SNMP, Agent, ICMP, SSH, IPMI vb. Aracılığıyla sistemden veri toplar;

  • veri depolama : Zabbix, MySQL'de depolanır ve diğer veritabanı hizmetlerinde de depolanabilir;

  • veri analizi : Daha sonra arızayı incelememiz ve analiz etmemiz gerektiğinde, Zabbix bize grafikler ve zaman gibi ilgili bilgileri sağlayabilir, böylece arızayı belirleyebiliriz;

  • veri gösterimi : Web arayüzü ekranı, (mobil APP, java_php ayrıca bir Web arayüzü geliştirebilir);

  • İzleme alarmı : Telefon alarmı, e-posta alarmı, WeChat alarmı, SMS alarmı, alarm yükseltme mekanizması vb. (Hangi alarm mevcut olursa olsun);

  • Alarm yönetimi : Bir alarm alındığında, bununla arızanın seviyesine göre ilgilenmemiz gerekir, örneğin: önemli acil, önemli değil acil, vb. Arızanın seviyesine göre, hızlı işlem için ilgili personel ile işbirliği yapın.

  • İzleme göstergeleri

    Yukarıda izleme yöntemlerini, hedeflerini, süreçlerini ve araçlarını öğrendim. Bazı insanlar tam olarak neyi izlemek istediğimizi merak ediyor olabilir. Burada, donanım izleme, sistem izleme, uygulama izleme ve ağ dahil olmak üzere bunları sıraladım İzleme, trafik analizi, günlük izleme, güvenlik izleme, API izleme, performans izleme, iş izleme.

    1. Donanım izleme

    İlk günlerde, donanım ekipmanının titremesini kontrol etmek için bilgisayar odası teftişlerini kullanıyorduk, bu bir insan gücü israfıydı ve tekrarlayan ve teknik olmayan bir çalışmaydı, herkes biliyordu.

    Elbette artık donanımın ayrıntılarını IPMI üzerinden izleyebilir ve CPU, bellek, disk, sıcaklık, fan, voltaj vb. İçin alarm eşikleri belirleyebiliriz (alarm içeriğini izlemek için kendiniz makul bir alarm aralığı yazabilirsiniz).

    IPMI izleme donanım hizmeti referansı: Zabbix IPMI Arayüzü

    2. Sistem izleme

    Küçük ve orta ölçekli işletmeler temelde tüm Linux sunuculardır, bu nedenle sistem kaynaklarının kullanımını izlemeliyiz Sistem izleme, izleme sisteminin temelidir.

    Ana izleme nesneleri:

    CPU'nun birkaç önemli kavramı vardır: bağlam değiştirme, çalıştırma sırası ve kullanım oranı. Bunlar ayrıca CPU izlememizin birkaç temel göstergesidir.

    Normalde, her işlemcinin çalışma kuyruğu 3'ten büyük olmamalı, CPU kullanımındaki "kullanıcı durumu / çekirdek durumu" oranı 70 / 30'da tutulur, boşta durumu% 50'de tutulur ve bağlam anahtarlama, sistemin iş yoğunluğuna göre entegre edilmelidir. Düşünmek.

    CPU için yaygın olarak kullanılan araçlar şunlardır: htop, top, vmstat, mpstat, dstat, glances. Zabbix, bir sistem izleme şablonu sağlar: Zabbix Ajan Arayüzü.

    CPU genel durumu

    Bağlam anahtarı

    Yükleme durumu

    Bellek: Genellikle bellek kullanımını, SWAP kullanımını izlememiz gerekir ve aynı zamanda, Zabbix'i bir hizmet belleği taşmasını vb. Keşfetmek için bellek kullanımının bir eğri grafiğini çizmek için kullanabiliriz.

    Bellek için yaygın olarak kullanılan araçlar şunlardır: free, top, vmstat, glances.

    Hafıza kullanımı

    IO, disk IO ve ağ IO'ya bölünmüştür. Performans ayarlamasına ek olarak, daha ayrıntılı verileri izlememiz gerekir. Günlük izleme yalnızca disk kullanımına, disk verimine ve disk yazma meşgullüğüne odaklanır. Ağ ayrıca ağ kartı trafiğini de izleyebilir. Yaygın araçlar şunlardır: iostat, iotop, df, iftop, sar, glances.

    Disk kullanımı

    Disk okuma / yazma verimi

    Ağ kartı içe ve dışa aktarma trafiği

    TCP11 durum bilgisi

    Diğer sistem izleme, çalışan işlem bağlantı noktasını, işlem numarasını, oturum açan kullanıcıyı, Dosya Açma vb.

    Diğer ilgili izleme

    3. Uygulama izleme

    Donanım izleme ve sistem izlemeyi anladıktan sonra, sonraki işlemimiz sunucuda hangi hizmetlerin çalıştığını ve hangilerinin izlenmesi gerektiğini görmek için sunucuya giriş yapmaktır.

    Uygulama hizmeti izleme ayrıca izleme sisteminin önemli bir parçasıdır, örneğin: LVS, HAProxy, Docker, Nginx, PHP, Memcached, Redis, MySQL, RabbitMQ, vb. İlgili tüm hizmetlerin zabbix tarafından izlenmesi gerekir.

    nginx_status

    PHP-FPM_status

    Redis_status

    JVM izleme

    Daha önce hizmet izlemenin ayrıntılı işlem süreci hakkında yazmıştım, bu yüzden onları burada tek tek göstermeyeceğim. Ayrıntılar için şu adresi ziyaret edin: Zabbix çeşitli uygulama hizmetlerini izler.

    • Zabbix, uygulama hizmeti izleme sağlar: Zabbix Agent UserParameter

    • Zabbix tarafından sağlanan Java izleme: Zabbix JMX Arayüzü

    • Percona, MySQL veritabanı izleme sağlar: percona-monitoring-plulgins

    4. Ağ izleme

    Ülke çapındaki kullanıcılar için bir e-ticaret sitesi olarak, çeşitli yerlerden bilgisayar odasına kadar ağ durumunu takip etmek de gereklidir.

    Ağ izleme, özellikle birden fazla bilgisayar odası içeren senaryolar için bir izleme platformu oluştururken göz önünde bulundurmamız gereken şeydir, her bilgisayar odası arasındaki ağ durumu, bilgisayar odasının ağ durumu ve tüm ülke, odaklanmamız gereken nesnelerdir. Bu durum bilgisi ne olacak? Smokeping ağ izleme aracına güvenmemiz gerekiyor.

    Smokeping, rrdtool'un yazarı Tobi Oetiker'in çalışmasıdır ve Perl'de yazılmıştır, esas olarak ağ performansını, www sunucu performansını, DNS sorgu performansını vb. İzler. Çizim için rrdtool kullanır ve doğrudan birden fazla aracıdan dağıtılmış veri toplamayı destekler.

    Aynı zamanda, daha az izleme noktası olduğundan, Surveillance Bao, Keynote ve Borui gibi birçok ticari izleme aracını da kullanabilirsiniz. Bu hizmet sağlayıcılar aynı zamanda CDN'nin durumunu izlemenize de yardımcı olabilir.

    Hazine izleme

    5. Akış analizi

    Web sitesi trafik analizi, işletim ve bakım personeli için hakim olunması gereken bir bilgi parçasıdır. Örneğin, bir e-ticaret şirketi için: siparişlerin kaynağının istatistikleri ve analizi yoluyla, belirli bir web sitesindeki reklam yatırımımızın beklenen etkiyi alıp almadığını anlayabiliriz. Farklı bölgelerdeki ziyaretçi sayısını ve hatta emtia işlemlerinin miktarını ayırt edebilir. Baidu istatistikleri, Google analizi, web yöneticisi araçları vb. Yalnızca sayfaya bir js yerleştirmelidir.

    Bununla birlikte, veriler her zaman karşı tarafın elindedir ve kişiselleştirme uygun değildir, bu nedenle Google, Piwik adlı açık kaynaklı bir analiz aracı yayınladı.

    piwik

    Baidu İstatistikleri

    6. Günlük izleme

    Normalde, sistem çalışırken, işletim sistemi sistem günlükleri oluşturacaktır ve uygulamalar uygulama erişim günlükleri, hata günlükleri, çalıştırma günlükleri ve ağ günlükleri oluşturacaktır. Günlükleri izlemek için ELK kullanabiliriz.

    Günlük izleme için en görünür ihtiyaçlar toplama, depolama, sorgulama ve görüntülemedir Açık kaynak topluluğunun karşılık gelen açık kaynak projeleri vardır: Logstash (koleksiyon) + ElasticSearch (depolama + arama) + Kibana (görüntüleme).

    Bu üç birleşik teknolojiye ELK Stack diyoruz, bu nedenle ELK Stack, Elasticsearch, Logstash ve Kibana teknoloji yığınlarının kombinasyonunu ifade eder.

    Günlük bilgileri toplanırsa, dağıtım güncellemesi sırasında bir istisna olursa, bunu Kibana'da hemen görebilirsiniz.

    ELK günlük ekranı

    Elbette, uyarılar için hata günlüğünü filtrelemek için Zabbix'i de kullanabilirsiniz.

    Zabbix günlük ekranı

    7. Güvenlik izleme

    Linux için dört katmanlı iptables, WAF uygulamak için yedi katmanlı WEB koruması Nginx + Lua gibi birçok açık kaynaklı güvenlik ürünü olmasına rağmen, son olarak tüm ilgili günlükler ELkstack'e toplanır ve farklı saldırı türleri grafikler aracılığıyla görüntülenir. Ancak her zaman zaman alıcıdır ve kişisel etki çok iyi değildir. Şu anda üçüncü taraf hizmet satıcılarına erişmeyi seçebiliriz.

    Üç partili güvenlik

    Üçüncü taraf satıcılar, birden çok hizmet türünü, arka kapıları, veritabanları, yapılandırma algılama, CGI, SMTP vb. Kapsayan kapsamlı bir güvenlik açığı kitaplığı sağlar.

    Kapsamlı ana bilgisayar tespiti, web uygulaması güvenlik açıkları, bağımsız madencilik ve endüstri paylaşımı, 0 günlük güvenlik açıklarını mümkün olan en kısa sürede güncelleyin ve en son güvenlik risklerini ortadan kaldırın.

    8. API izleme

    API'ler gittikçe daha önemli hale geldikçe, sağladığımız API'lerin normal çalışıp çalışamayacağını ayırt etmek için bu tür verilere de ihtiyacımız olduğu açıktır.

    API arayüzü GET, POST, PUT, DELETE, HEAD, OPTIONS isteklerini izleyin. Kullanılabilirlik, doğruluk ve yanıt süresi üç ana performans göstergesidir.

    API izleme

    Tepki Süresi

    9. Performans izleme

    Web sayfası performansı, DNS yanıt süresi, HTTP bağlantı süresi, sayfa performans indeksi, yanıt süresi, kullanılabilirlik, öğe boyutu vb. İçin kapsamlı izleme. Zabbix, URL izleme sağlar: Zabbix Web izleme.

    Zabbix site izleme

    Terminal yanıt süresi

    Üçüncü taraf izleme, piyasayı izler. Web sayfası performansının sağlık durumunu tam olarak yansıtan her türlü grafik bir bakışta nettir.

    10. İş izleme

    İş göstergesi izlemesiz bir izleme platformu tam bir izleme platformu değildir.Genellikle izleme sistemimizde, önemli iş göstergelerimizi izlemeli ve alarm bildirimi için eşikler belirlemeliyiz. Örneğin, e-ticaret sektörü:

    Dakikada kaç sipariş üretiliyor, dakikada kaç kullanıcı kaydediliyor, her gün kaç aktif kullanıcı var, her gün kaç promosyon faaliyeti var, promosyon tarafından kaç kullanıcı tanıtılıyor, promosyon tarafından ne kadar trafik tanıtılıyor, promosyon tarafından ne kadar kâr sağlanıyor vb. Zabbix'e önemli göstergeler eklenebilir. , Ve sonra Ekranda göster.

    Not: İşletme izleme tablosu nedeniyle, gizlilikle ilgili çok fazla veri olduğundan hiçbir ekran görüntüsü alınmayacaktır.

    İzleme alarmı

    Arıza alarmını bildirmenin birçok yolu vardır, elbette en yaygın kullanılanları SMS ve e-postadır.

    SMS alarmı

    E-posta alarmı

    Alarm yönetimi

    Genel olarak, alarmdan sonra arızayla nasıl başa çıkılır, önce alarm yükseltme mekanizması aracılığıyla otomatik olarak halledebiliriz, örneğin, Nginx hizmeti çalışmıyorsa, alarm yükseltmesini Nginx'i otomatik olarak başlatacak şekilde ayarlayabilirsiniz.

    Bununla birlikte, genel işte ciddi bir arıza varsa, genellikle arızanın seviyesine ve işine göre bununla ilgilenmek için farklı işletme ve bakım personeli görevlendiririz.

    Elbette farklı iş biçimleri, farklı mimariler ve farklı hizmetler farklı yöntemler benimseyebilir, bunun için sabit bir model yok.

    Görüşme izleme

    İşletme ve bakım görüşmesinde sık sık izleme ile ilgili sorular vardır.Bu soruya nasıl cevap verilir? Bu makaleye basit bir cevap vereceğim.

    1. Donanım izleme

    Yönlendirici anahtarını izlemek için SNMP aracılığıyla (bunlar nasıl yapılacağını anlamak için bazı üreticilerle iletilebilir), sunucunun ve diğerlerinin sıcaklığı IPMI aracılığıyla gerçekleştirilebilir. Tabii ki, donanım yoksa ve tüm bulut varsa, bu adımı doğrudan atlayın.

    2. Sistem izleme

    CPU yükü, bağlam değiştirme, bellek kullanımı, disk okuma ve yazma, disk kullanımı, disk inode kullanımı gibi. Elbette bunlar yapılandırılması gereken tetikleyicilerdir çünkü varsayılan değer çok düşüktür ve sık sık alarm verecektir.

    3. Hizmet izleme

    Örneğin, şirket LNMP mimarisini kullanıyor, Nginx bir Durum modülüyle birlikte geliyor, PHP'de ilgili Durum da var ve MySQL resmi Percona aracıyla izlenebilir. Redis, filtreleme için bilgi elde etmek için kendi bilgilerini kullanır. Yöntemler benzer. Ya hizmet onunla birlikte gelir. Ya izlemek istediğinizi gerçekleştirmek için komut dosyaları aracılığıyla, alarm ve grafik işlevleri.

    4. Ağ izleme

    Bu bir bulut ana bilgisayarıysa ve bilgisayar odaları arasında değilse, ağı izlememeyi seçebilirsiniz. Tabii ki, bilgisayar odaları arasında olduğumuzu ve bunu nasıl yapacağımızı söylediniz. Ağla ilgili izleme için sigara içmeyi kullanmanız veya doğrudan ağ mühendisinize teslim etmeniz önerilir, çünkü teknik sektörün uzmanlığı vardır.

    5. Güvenlik izleme

    Bulut ana bilgisayar ise, kendi güvenlik korumasını kullanmayı düşünün. Elbette iptables da kullanılabilir. Donanım ise, donanım güvenlik duvarı kullanılması önerilir. Bir gün boyunca arızaları ve kesintileri önlemek için bulutu kullanarak anti-DDOS satın alabilirsiniz. Bu bir sistemse, izinler, şifreler, yedeklemeler ve kurtarma gibi temel şemalar iyi yapılmalıdır. Web, Web düzeyinde bir güvenlik duvarı uygulamak için Nginx + Lua'yı da kullanabilir. Elbette entegre OpenResty'yi de kullanabilirsiniz.

    6. Web izleme

    Aslında Web izlemenin pek çok konusu var. Örneğin, sayfayla ilgili gecikmeleri, js yanıt süresini, indirme süresini vb. İzlemek için yerleşik Web izlemeyi kullanabilirsiniz. Burada, elde etmek için profesyonel ticari yazılım izleme hazinesi veya dinleme bulutu kullanmanızı öneririm. Sonuçta, insanların ülkenin her yerinde bilgisayar odaları var (eğer bu bir çoklu bilgisayar odasıysa, bunun hakkında ayrıca konuşmama izin verin).

    7. Günlük izleme

    Web ise, Nginx'in 50x, 40x hata günlüğünü ve PHP'nin ERROR günlüğünü izlemek için kullanabilirsiniz. Aslında, bu gereksinimler toplama, depolama, sorgulama ve görüntülemeden başka bir şey değildir.Başarmak için aslında açık kaynak ELKStack'i kullanabiliriz. Logstash (koleksiyon), Elasticsearch (depolama + arama), Kibana (ekran).

    8. İş izleme

    Yukarıda çok şey yapıldı, aslında işin işleyişi sonunda garanti altına alındı. Bu şekilde yaptığımız izleme anlamlı. Bu nedenle, iş seviyesinin izlenmesi, daha önemli iş göstergelerini izlemek için geliştirme ve yöneticilerle tartışılmalıdır (onay gereklidir) ve daha sonra basit bir komut dosyasıyla gerçekleştirilebilir ve sonunda tetikleyici kurulabilir.

    9. Akış analizi

    Günlük analizi yapmak için genellikle awk sed xxx araçlarını kullanırız. Bu bizim için IP, PV ve UV'yi saymak için pek uygun değil. Daha sonra gömülü kodlar geliştirmek için Baidu istatistiklerini, Google istatistiklerini ve işletmeyi kullanabilirsiniz. Gizlilikten kaçınmak için, ilgili trafik analizi yapmak için Piwik'i de kullanabilirsiniz.

    10. Görselleştirme

    Arayüzü güzelleştirmek için Screen ve bazı üçüncü taraf kitaplıkların tanıtılması sayesinde, sipariş hacminin aniden arttığını ve azaldığını da bilmemiz gerekiyor. Yani aniden büyük bir trafik dalgası geldi, bu trafik nereden geldi? Terfi mi, saldırı mı yapıldı? Çeşitli sistemler arasındaki iş ilişkisini çözmek için izleme düzeyini birleştirebilirsiniz.

    11. Otomatik izleme

    Yukarıda çok çalıştığımız için elbette anahtarları tek tek ekleyemiyoruz. Zabbix'in aktif modu ve pasif modu ile elde edilebilir. Tabii ki, API aracılığıyla uygulamak en iyisidir.

    sonuç olarak

    Gerçekten daha eksiksiz bir izleme sistemi elde etmek istiyorsanız, mevcut açık kaynaklı yazılım gerçekten tatmin edilemez, nitelikli şirketler Xiaomi'nin açık kaynaklı Open-Falcon gibi kendi izleme sistemlerini geliştirmeye başladılar.

    Sensu gibi daha iyi açık kaynak izleme çerçeveleri de vardır, ayrıca InfluxDB ve Grafana, kendi kuruluşunuza uyan izleme platformunu özelleştirmek için kullanılabilir.

    Orijinal bağlantı:

    https://blog.csdn.net/yuanziok/article/details/104424369

    Wenling Konut ve Kentsel-Kırsal Kalkınma Bürosu, kurumsal modele yardımcı olan "özel plan hizmeti + özel sınıf rehberliği" ni yeniledi
    önceki
    Başkan yardımcısı teşhisi doğruladı ve halk endişeli İran'daki salgın neden ciddi?
    Sonraki
    5G ağlarının ortaya çıkışı geleneksel ağ paradigmasını bozuyor. Yapay zeka destekli + blok zinciri hangi yeni numaralar yaratabilir?
    Başkan yardımcısı teşhisi doğruladı ve halk endişeli İran'daki salgın neden ciddi?
    Mobil yapay zeka uygulamaları çok popüler, Qualcomm geliştiricilere bu sefer 200.000'den fazla SUV verecek
    Bir makine öğrenimi modeli oluşturmak için Google'ın açık kaynaklı TFCO'su nasıl kullanılır?
    Ne adam ama! Huangxuan Oasis, yan yüz profilinin açıkça sert ve yakışıklı olduğunu paylaşıyor
    Weimob kurucusu Sun Taoyong, çalışanların kütüphaneyi silme işlemine yanıt verdi; Bytedance "Başlık Arama" bağımsız uygulamasını başlattı; C ++ 20 spesifikasyonu tamamlandı | Geek Manşetleri
    Lan Yingying, uzun bacakları ve göz alıcı bacakları olan siyah dekolteli bir elbise giyiyor, klasik güzelliği yorumlamak için piyano çalıyor
    Programcıların yazılı test görüşmeleri için en sevdikleri algoritma, nasıl yapılır?
    En güzel şef! Liya Tong, balkabağı çorbasını canlı yayınlıyor ve ağırlığı hayranların kıskançlığını çekiyor
    Veri bilimcileri için beş yaygın SQL mülakat sorusu
    Ishihara Rimi, içten bir gülümseme ve mükemmel iyileştirme gücüyle bira reklamını üstleniyor
    Komik: KMP algoritması nedir?
    To Top