İşletim ve bakım hakkında bilmesi ve bilmesi gereken izleme bilgi sistemini tamamen düzenleyin

İzleme, tüm işletme ve bakımın ve hatta tüm ürün yaşam döngüsünün en önemli kısmıdır Arızalar önceden tespit edilir ve daha sonra sorunların izlenmesi ve yerlerinin belirlenmesi için ayrıntılı veriler sağlanır. Sektörde aralarından seçim yapabileceğiniz birçok iyi açık kaynaklı ürün var. Açık kaynaklı bir izleme sistemi seçmek, zaman kazandıran ve verimli bir çözümdür. Elbette, izlemeyi çok iyi anlamayan arkadaşlar, aşağıdaki makaleleri okuduktan sonra tüm izleme sistemi hakkında daha derin bir anlayışa sahip olabilirler.

1. İzleme hedefi

Herkesin farklı sektörler, şirketler, işletmeler ve pozisyonlar nedeniyle farklı izleme anlayışları vardır.Ancak, bu izlemenin belirli bir izleme teknolojisinin kullanımı değil, şirketin iş açısından değerlendirilmesi gerektiğine dikkat etmemiz gerekir.

  • Sistemin kesintisiz gerçek zamanlı izlenmesi: Aslında, sistemin sürekli gerçek zamanlı izlenmesidir (bu izlemedir);

  • Sistemin mevcut durumu hakkında gerçek zamanlı geri bildirim: Belirli bir donanımı veya belirli bir sistemi izlediğimizde, mevcut sistem durumunu gerçek zamanlı olarak normal, anormal veya arızalı olarak görebilmemiz gerekir.

  • Servis güvenilirliğini ve güvenliğini sağlayın: İzlememizin amacı, sistemlerin, hizmetlerin ve işletmelerin normal çalışmasını sağlamaktır.

  • Sürekli ve istikrarlı iş operasyonunu sağlayın: İzlememiz mükemmelse, bir arıza olsa bile, arıza alarmını mümkün olan en kısa sürede alabilir ve işin sürekli ve istikrarlı çalışmasını sağlamak için en kısa sürede bununla ilgilenebiliriz.

  • 2. İzleme yöntemi

    1. İzleme nesnesini anlayın: Neyi izlemek istediğimizi biliyor musun? Örneğin, CPU nasıl çalışır?

    2. Performans karşılaştırma göstergeleri: Bu şeyin hangi özelliklerini izliyoruz? CPU kullanımı, yük, kullanıcı modu, çekirdek modu ve bağlam değiştirme gibi.

    3. Alarm eşiğinin tanımı: Hata olarak kabul edilen ve polise çağrılması gereken nedir? Örneğin, CPU yükü ne kadar yüksek Kullanıcı modu ve çekirdek modu ne kadar yüksek?

    4. Arıza işleme süreci: Bir arıza alarmı aldım, bununla nasıl başa çıkacağız? Daha verimli bir süreç var mı?

    Üç, izleme çekirdeği

    • sorun bulundu: Sistemde bir arıza alarmı olduğunda, arıza alarmının bilgisini alacağız.

    • Konumlandırma sorunu: Arıza e-postası genellikle belirli bir ana bilgisayar arızasının içeriğini ve belirli bir arızayı yazar.Alarm içeriğini analiz etmemiz gerekir. Örneğin, bir sunucu bağlanamıyorsa, bunun bir ağ sorunu olup olmadığını veya yükün uzun süre bağlanmak için çok yüksek olup olmadığını veya belirli bir geliştirme bir güvenlik duvarı yasaklama stratejisini tetiklediğini vb. Değerlendirmemiz gerekir, arızanın belirli nedenini analiz etmemiz gerekir.

    • Problemi çöz: Elbette, başarısızlığın nedenini anladıktan sonra, başarısızlığı çözme önceliği ile çözmemiz gerekir.

    • Sorunu özetlemek gerekirse: Büyük arızaları çözdükten sonra, gelecekte tekrar oluşmasını önlemek için başarısızlıkların nedenlerini ve önlemelerini özetlememiz gerekir.

    Dört, izleme araçları

    Aşağıda, şirketin işinin izlemesi için uygun bir izleme aracı seçmemiz gerekiyor. Burada izleme araçlarının basit bir sınıflandırmasını yaptım.

    1. Yerleşik izleme

    • MRTG (Çok Yönlü Trffic Grapher) Olten, İsviçre'den Tobias Oetiker ve Dave Rand tarafından geliştirilen ve GPL lisansı altında ağ trafik grafikleri çizmek için kullanılabilen bir yazılım setidir.

      MRTG'nin en iyi versiyonu 1995 yılında piyasaya sürüldü. Perl'de yazılmıştır ve çeşitli platformlarda kullanılabilir.Veri toplama SNMP protokolünü kullanır.MRTG, cep telefonundaki verileri GIF veya PNG formatında Web sayfası üzerinden çeker.

    • Ganglia Kümeler ve ızgaralar gibi platformlar arası, ölçeklenebilir, yüksek performanslı dağıtılmış bir izleme sistemidir. Hiyerarşik bir tasarıma dayanır, çok çeşitli teknolojiler kullanır ve verileri depolamak için RRDtool kullanır. Görsel bir arayüz ile küme sistemlerinin otomatik olarak izlenmesi için uygundur. Dikkatlice tasarlanmış veri yapısı ve algoritması, izleme terminalinden izlenen terminale bağlantı ek yükünü çok düşük hale getirir. Şu anda binlerce küme, 2000 düğümlü bir küme ortamını kolayca idare edebilen bu izleme sistemini kullanıyor.

    • Cacti (İngilizce'de kaktüs anlamına gelir) PHP, MySQL, SNMP ve RRDtool'a dayalı olarak geliştirilmiş bir ağ trafiği izleme grafik analiz araçları kümesidir.Veri elde etmek için snmpget kullanır ve çizim yapmak için RRDtool kullanır, ancak kullanıcıların RRDtool'un karmaşık parametrelerini anlamasına gerek yoktur. Çok güçlü bir veri ve kullanıcı yönetimi işlevi sağlar, her kullanıcının ağaç yapısını, ana cihazı ve herhangi bir resmi görüntüleyebileceğini belirtebilirsiniz.Ayrıca kullanıcı kimlik doğrulaması için LDAP ile birleştirilebilir ve şablonu özelleştirebilir. Tarihsel veri görüntüleme ve izleme açısından, işlevi oldukça iyidir.

      Cacti, şablonlar ekleyerek farklı cihazların izlenmesini yeniden kullanılabilir hale getirir ve özelleştirilebilir çizim işlevine sahiptir ve güçlü hesaplama yeteneklerine (veri birleştirme işlevi) sahiptir.

    • Nagios Hizmetlerin ve ağ bilgilerinin çalışma durumunu izleyebilen, belirlenen yerel veya uzak ana bilgisayarların durumunu ve hizmetlerini izleyebilen ve anormal alarm bildirim işlevleri sağlayan kurumsal düzeyde bir izleme sistemidir.

      Nagios, Linux ve UNIX platformlarında çalışabilir. Aynı zamanda, sistem yöneticilerinin ağ durumunu, çeşitli sistem sorunlarını ve sistemle ilgili günlükleri görüntülemesini kolaylaştırmak için bir web arayüzü sağlanmıştır.

      Nagios'un işlevi, izleme hizmetlerinin kullanılabilirliğine odaklanır ve izleme göstergelerinin durumuna göre alarmları tetikleyebilir.

      Şu anda, Nagios da belirli bir pazar payına sahip, ancak Nagios zamana ayak uyduramadı ve artık değişen izleme ihtiyaçlarını karşılayamıyor.Mimarinin ölçeklenebilirliği ve kullanım kolaylığı iyileştirilmelidir.Gelişmiş işlevleri Nagios XI'in ticari sürümüne entegre edilmiştir. içinde.

    • Sigara içen Genelde geleneksel ping, www sunucusu performansı, DNS sorgu performansı, SSH performansı vb. Dahil ağ performansını izlemek için kullanılır. Alt katman da RRDtool tarafından desteklenmektedir.Özelliği çizimin çok güzel olmasıdır.Ağ paket kaybı ve gecikmesi renkler ve gölgelerle işaretlenmiştir.Birden fazla resmin üst üste dizilmesini destekler.Yazar ayrıca MRTG ve RRDtll gibi araçlar geliştirmiştir. Sigara içme sitesi:

    • Açık kaynak izleme sistemi OpenTSDB Dağıtılmış ve ölçeklenebilir bir zaman serisi veritabanı oluşturmak için tüm zaman serileri (örnekleme yok) verilerini depolamak için HBase kullanın. İkinci seviye veri toplamayı, kalıcı depolamayı, kapasite planlamasını ve mevcut alarm sistemlerine kolay erişimi destekler. OpenTSDB, büyük ölçekli kümelerden (kümedeki ağ cihazları, işletim sistemleri ve uygulamalar dahil) ilgili toplama göstergelerini elde edebilir ve bunları depolayabilir, dizine ekleyebilir ve sunabilir, böylece bu verilerin Web, Grafik vb.

    2. Ace izleme

    • Zabbix Birden fazla toplama yöntemini ve toplama istemcisini destekleyen dağıtılmış bir izleme sistemidir.Özel bir Ajan aracısına sahiptir.Ayrıca SNMP, IPMI, JMX, Telnet, SSH ve diğer protokolleri destekler.Toplanan verileri veritabanında depolar ve ardından Bunları analiz edin ve sıralayın ve koşullar karşılandığında bir alarmı tetikleyin. Esnek genişletilebilirliği ve zengin işlevleri, diğer izleme sistemleri ile eşsizdir. Nispeten konuşursak, genel işlevi çok iyidir.

      Yukarıdaki çeşitli izleme sistemlerinin karşılaştırmasından Zabbix'in avantajları vardır.Zengin işlevleri, genişletilebilir yetenekleri, ikincil geliştirme yetenekleri ve kullanımı kolay özellikleri ile okuyucular biraz öğrenerek kendilerini inşa edebilirler. İzleme sistemi.

    • Xiaomi'nin izleme sistemi: Open-Falcon. Open-Falcon'un amacı, kurumsal düzeyde en açık ve en kullanışlı İnternet izleme ürününü yapmaktır.

    3. Üç taraflı izleme

    Piyasada Surveillance Bao, Surveillance Easy, Tingyun ve birçok bulut satıcısının kendi izlemesi var gibi birçok iyi üçüncü taraf izleme var, ancak buradaki girişe odaklanmayı düşünmüyorum.Üçüncü taraf izleme hakkında bilgi almak istiyorsanız, resmi web sitesine danışabilirsiniz. . (Reklam yerleşiminden kaçının)

    Beş, izleme süreci

    Yukarıda çok şey tanıtıldı, en uygun izleme aracı hangisidir? Birkaç açık kaynak izleme aracı öneriyorum: Zabbix, Open-Falcon, LEPUS Tiantu (izleme veritabanına adanmış). Ancak bu makale, izleme sistemi ekosisteminin tamamını oluşturmak için hala Zabbix'e dayanmaktadır. Zabbix'in tüm süreci hakkında konuşalım:

  • Veri toplama: Zabbix, SNMP, Agent, ICMP, SSH, IPMI vb. Aracılığıyla sistemden veri toplar;

  • veri depolama: Zabbix, MySQL'de depolanır ve diğer veritabanı hizmetlerinde de depolanabilir;

  • Veri analizi: Daha sonra arızayı incelememiz ve analiz etmemiz gerektiğinde, Zabbix bize grafikler ve zaman gibi ilgili bilgileri sağlayabilir, böylece arızayı belirleyebiliriz;

  • veri gösterimi: Web arayüzü ekranı (mobil APP, java_php ayrıca bir Web arayüzü geliştirebilir);

  • İzleme alarmı: Telefon alarmı, e-posta alarmı, WeChat alarmı, SMS alarmı, alarm yükseltme mekanizması vb. (Hangi alarm mevcut olursa olsun);

  • Alarm yönetimi: Bir alarm alındığında, bununla arıza düzeyine göre ilgilenmemiz gerekir, örneğin: önemli acil, önemli değil acil, vb. Arızanın seviyesine göre, hızlı işlem için ilgili personel ile işbirliği yapın.

  • Altı, izleme göstergeleri

    Yukarıda izleme yöntemlerini, hedeflerini, süreçlerini ve araçlarını öğrendim.Bazı insanlar tam olarak neyi izlemek istediğimizi merak edebilir. Burada donanım izleme, sistem izleme, uygulama izleme ve ağ izleme dahil kategorileri sıraladım. İzleme, trafik analizi, günlük izleme, güvenlik izleme, API izleme, performans izleme, iş izleme.

    1. Donanım izleme

    İlk günlerde, bilgisayar odası teftişlerini kullanarak donanım ekipmanının yanıp sönen ışıklarını kontrol ederek arızalı olup olmadığını belirledik.Bu bir insan gücü israfıydı, tekrarlayan ve teknik olmayan bir çalışmaydı herkes biliyor.

    Elbette artık donanımın ayrıntılarını IPMI üzerinden izleyebilir ve CPU, bellek, disk, sıcaklık, fan, voltaj vb. İçin alarm eşiklerini ayarlayabiliriz (alarm içeriğini izlemek için kendiniz makul bir alarm aralığı yazabilirsiniz).

    IPMI izleme donanım hizmeti referansı: Zabbix IPMI Arayüzü

    2. Sistem izleme

    Küçük ve orta ölçekli işletmeler temelde Linux sunucularıdır, bu nedenle sistem kaynaklarının kullanımını izlemeliyiz Sistem izleme, izleme sisteminin temelidir.

    Ana izleme nesneleri:

    CPU'nun birkaç önemli kavramı vardır: bağlam değiştirme, çalıştırma kuyruğu ve kullanım oranı. Bunlar aynı zamanda CPU izlememizin birkaç temel göstergesidir.

    Normalde, her işlemcinin çalıştırma kuyruğu 3'ten yüksek olmamalı, CPU kullanımındaki "kullanıcı durumu / çekirdek durumu" oranı 70 / 30'da tutulur, boşta durumu% 50'de tutulur ve bağlam değiştirme, sistemin iş yoğunluğuna göre entegre edilmelidir. Düşünmek.

    CPU için yaygın olarak kullanılan araçlar şunlardır: htop, top, vmstat, mpstat, dstat, glances. Zabbix, bir sistem izleme şablonu sağlar: Zabbix Ajan Arayüzü.

    CPU genel durumu

    Bağlam anahtarı

    Yükleme durumu

    Bellek: Genellikle bellek kullanımını, SWAP kullanımını izlememiz gerekir ve aynı zamanda, Zabbix'i bir hizmet belleği taşmasını vb. Keşfetmek için bellek kullanımının bir eğri grafiğini çizmek için kullanabiliriz.

    Bellek için yaygın olarak kullanılan araçlar şunlardır: free, top, vmstat, glances.

    Hafıza kullanımı

    IO, disk IO ve ağ IO'ya bölünmüştür. Performans ayarlamasına ek olarak, daha ayrıntılı verileri izlememiz gerekir. Günlük izleme yalnızca disk kullanımına, disk verimine ve disk yazma meşgullüğüne odaklanır. Ağ ayrıca ağ kartı trafiğini de izleyebilir. Yaygın araçlar şunlardır: iostat, iotop, df, iftop, sar, glances.

    Disk kullanımı

    Disk okuma / yazma verimi

    Ağ kartı içe ve dışa aktarma trafiği

    TCP 11 durum bilgisi

    Diğer sistem izleme işlemleri arasında işlem portu, işlem numarası, oturum açma kullanıcısı, Dosya Aç, vb. Bulunur (ayrıntılar için Zabbix'in kendi OS Linux şablonuna bakın).

    Diğer ilgili izleme

    3. Uygulama izleme

    Donanım izleme ve sistem izlemeyi anladıktan sonra, sonraki işlemimiz sunucuda hangi hizmetlerin çalıştığını ve hangilerinin izlenmesi gerektiğini görmek için sunucuya giriş yapmaktır.

    Uygulama hizmeti izleme, izleme sisteminin aşağıdaki gibi önemli bir parçasıdır: LVS, HAProxy, Docker, Nginx, PHP, Memcached, Redis, MySQL, RabbitMQ, vb. İlgili tüm hizmetlerin zabbix kullanılarak izlenmesi gerekir.

    nginx_status

    PHP-FPM_status

    Redis_status

    JVM izleme

    Daha önce hizmet izlemenin ayrıntılı işlem süreci hakkında yazmıştım, bu yüzden onları burada tek tek göstermeyeceğim. Ayrıntılar için şu adresi ziyaret edin: Zabbix çeşitli uygulama hizmetlerini izler.

    • Zabbix, uygulama hizmeti izleme sağlar: Zabbix Agent UserParameter

    • Zabbix tarafından sağlanan Java izleme: Zabbix JMX Arayüzü

    • Percona, MySQL veritabanı izleme sağlar: percona-monitoring-plulgins

    4. Ağ izleme

    Ülke çapındaki kullanıcılar için bir e-ticaret sitesi olarak, ağ durumunu çeşitli yerlerden bilgisayar odasına kadar her zaman takip etmek gerekir.

    Ağ izleme, özellikle birden fazla bilgisayar odası içeren senaryolar için bir izleme platformu oluştururken göz önünde bulundurmamız gereken bir şeydir, her bilgisayar odası arasındaki ağ durumu, bilgisayar odası ve ülkenin tüm bölümlerinin ağ durumu odaklanmamız gereken nesnelerdir, bu yüzden nasıl ustalaşılır Bu durum bilgisi ne olacak? Smokeping ağ izleme aracına güvenmemiz gerekiyor.

    Smokeping, rrdtool'un yazarı Tobi Oetiker'in eseridir.Perl'de yazılmıştır, esas olarak ağ performansını, www sunucu performansını, DNS sorgu performansını vb. İzler. Çizim için rrdtool kullanır ve doğrudan birden fazla aracıdan dağıtılmış veri toplamayı destekler.

    Aynı zamanda, daha az izleme noktası olduğundan, Surveillance Bao, Keynote ve Borui gibi birçok ticari izleme aracını da kullanabilirsiniz. Bu hizmet sağlayıcılar aynı zamanda CDN'nin durumunu izlemenize de yardımcı olabilir.

    sigara içme

    Hazine izleme

    5. Akış analizi

    Web sitesi trafik analizi, işletim ve bakım personeli için hakim olunması gereken bir bilgi parçasıdır. Örneğin, bir e-ticaret şirketi için: siparişlerin kaynağının istatistikleri ve analizi yoluyla, belirli bir web sitesindeki reklam yatırımımızın beklenen etkiyi alıp almadığını anlayabiliriz. Farklı bölgelerdeki ziyaretçi sayısını ve hatta emtia işlemlerinin miktarını ayırt edebilir. Baidu istatistikleri, Google analizi, web yöneticisi araçları vb. Yalnızca sayfaya bir js yerleştirmelidir.

    Bununla birlikte, veriler her zaman diğer tarafın elindedir ve kişiselleştirilmiş özelleştirme uygun değildir, bu nedenle Google, Piwik adlı açık kaynaklı bir analiz aracı yayınladı.

    piwik

    Baidu İstatistikleri

    6. Günlük izleme

    Normal koşullar altında, sistem çalışırken, işletim sistemi sistem günlükleri oluşturacak ve uygulamalar uygulama erişim günlükleri, hata günlükleri, çalıştırma günlükleri ve ağ günlükleri oluşturacaktır.Günlük izleme için ELK kullanabiliriz.

    Günlük izleme için en görünür ihtiyaçlar toplama, depolama, sorgulama ve görüntülemedir Açık kaynak topluluğunun karşılık gelen bir açık kaynak projesi vardır: Logstash (koleksiyon) + ElasticSearch (depolama + arama) + Kibana (görüntüleme).

    Bu üç birleşik teknolojiye ELK Stack diyoruz, bu nedenle ELK Stack, Elasticsearch, Logstash ve Kibana teknoloji yığınlarının kombinasyonunu ifade eder.

    Günlük bilgileri toplanırsa, dağıtım güncellemesi sırasında bir istisna oluşursa, bunu Kibana'da hemen görebilirsiniz.

    ELK günlük ekranı

    Elbette, sizi uyarmak için hata günlüğünü filtrelemek için Zabbix'i de kullanabilirsiniz.

    Zabbix günlük ekranı

    7. Güvenlik izleme

    Dört katmanlı iptables, yedi katmanlı WEB koruması Nginx + Lua gibi birçok açık kaynaklı Linux güvenlik ürünü olmasına rağmen, WAF'ı uygular ve son olarak tüm ilgili günlükler ELkstack'te alınır ve farklı saldırı türleri grafikler aracılığıyla görüntülenir. Ancak her zaman zaman alıcıdır ve kişisel etki çok iyi değildir. Şu anda üçüncü taraf hizmet satıcılarına erişmeyi seçebiliriz.

    Üç partili güvenlik

    Üçüncü taraf satıcılar, hizmetleri, arka kapıları, veritabanları, konfigürasyon algılama, CGI, SMTP ve diğer türleri kapsayan kapsamlı bir güvenlik açığı kitaplığı sağlar.

    Kapsamlı ana bilgisayar tespiti, web uygulaması güvenlik açıkları, bağımsız madencilik ve endüstri paylaşımı, en son güvenlik risklerini ortadan kaldırmak için 0 günlük güvenlik açıklarını mümkün olan en kısa sürede güncelleyin.

    8. API izleme

    API'ler gittikçe daha önemli hale geldikçe, sağladığımız API'lerin normal çalışıp çalışamayacağını ayırt etmek için bu tür verilere de ihtiyacımız olduğu açıktır.

    API arayüzü GET, POST, PUT, DELETE, HEAD, OPTIONS isteklerini izleyin. Kullanılabilirlik, doğruluk ve yanıt süresi üç ana performans göstergesidir.

    API izleme

    Üç taraf API izleme

    Tepki Süresi

    9. Performans izleme

    Web sayfası performansının, DNS yanıt süresinin, HTTP bağlantı süresinin, sayfa performans dizininin, yanıt süresinin, kullanılabilirliğin, öğe boyutunun vb. Kapsamlı izlenmesi. Zabbix, URL izleme sağlar: Zabbix Web izleme.

    Zabbix site izleme

    Terminal yanıt süresi

    Üçüncü taraf izleme, piyasayı izler. Web sayfası performansının sağlık durumunu tam olarak yansıtan her tür grafik bir bakışta nettir.

    10. İş izleme

    İş göstergesi izlemesiz bir izleme platformu tam bir izleme platformu değildir.Genellikle izleme sistemimizde önemli iş göstergelerimizi izlemeli ve alarm bildirimi için eşikler belirlemeliyiz. Örneğin, e-ticaret sektörü:

    Dakikada kaç sipariş üretiliyor, dakikada kaç kullanıcı kaydediliyor, her gün kaç aktif kullanıcı var, her gün kaç promosyon faaliyeti var, promosyon tarafından kaç kullanıcı tanıtılıyor, promosyon tarafından ne kadar trafik tanıtılıyor, promosyon tarafından ne kadar kâr sağlanıyor vb. Zabbix'e önemli göstergeler eklenebilir. , Ve sonra Ekranda göster.

    Not: İşletme izleme tablosu nedeniyle, gizlilikle ilgili çok fazla veri olduğundan hiçbir ekran görüntüsü alınmayacaktır.

    Yedi, izleme alarmı

    Arıza alarmını bildirmenin birçok yolu vardır, elbette en yaygın kullanılanlar SMS ve e-postadır.

    SMS alarmı

    E-posta alarmı

    8. Alarm işleme

    Genel olarak, alarmdan sonra arızayla nasıl başa çıkılır, önce alarm yükseltme mekanizması aracılığıyla otomatik olarak halledebiliriz, örneğin, Nginx hizmeti çalışmıyorsa, alarm yükseltmesini Nginx'i otomatik olarak başlatacak şekilde ayarlayabilirsiniz.

    Ancak genel bir işte ciddi bir arıza meydana gelirse, genellikle arızanın seviyesine ve işletmeye göre bunu ele almak için farklı operasyon ve bakım personeli görevlendiririz.

    Elbette farklı iş biçimleri, farklı mimariler ve farklı hizmetler farklı yöntemler benimseyebilir, bunun için sabit bir model yok.

    Dokuz, mülakat izleme

    İşletme ve bakım görüşmesinde sık sık izleme ile ilgili sorular vardır Bu soruya nasıl cevap verilir? Bu makaleye basit bir cevap vereceğim.

    1. Donanım izleme

    Yönlendirici anahtarını izlemek için SNMP aracılığıyla (bunlar nasıl yapılacağını anlamak için bazı üreticilerle iletişim kurabilir), sunucunun ve diğerlerinin sıcaklığı IPMI aracılığıyla elde edilebilir. Elbette, donanım yoksa ve tüm bulut varsa, bu adımı doğrudan atlayın.

    2. Sistem izleme

    CPU yükü, bağlam değiştirme, bellek kullanımı, disk okuma ve yazma, disk kullanımı, disk inode kullanımı gibi. Elbette bunlar yapılandırılması gereken tetikleyicilerdir çünkü varsayılan değer çok düşüktür ve sık sık alarm verecektir.

    3. Hizmet izleme

    Örneğin, şirket LNMP mimarisini kullanıyor, Nginx bir Durum modülüyle birlikte geliyor, PHP'de ilgili Durum da var ve MySQL resmi Percona aracıyla izlenebilir. Redis, filtreleme için bilgi elde etmek için kendi bilgilerini kullanır. Yöntemler benzer. Ya hizmet onunla birlikte gelir. Ya izlemek istediğinizi gerçekleştirmek için komut dosyaları aracılığıyla, alarm ve grafik işlevleri.

    4. Ağ izleme

    Bu bir bulut ana bilgisayarıysa ve bilgisayar odaları arasında değilse, ağı izlememeyi seçebilirsiniz. Tabii ki, bilgisayar odaları arasında olduğumuzu ve bunu nasıl yapacağımızı söylediniz.Ağ ile ilgili izleme için sigara içmeyi kullanmanız veya bunu yapması için doğrudan ağ mühendisinize vermeniz tavsiye edilir, çünkü teknik sektörün uzmanlığı vardır.

    5. Güvenlik izleme

    Bulut ana bilgisayar ise, kendi güvenlik korumasını kullanmayı düşünün. Elbette iptables'ı da kullanabilirsiniz. Donanım ise, donanım güvenlik duvarı kullanılması önerilir. Bir gün boyunca arızaları ve kesintileri önlemek için bulutu kullanarak anti-DDOS satın alabilirsiniz. Bu bir sistem ise, izinler, şifreler, yedeklemeler ve kurtarma gibi temel şemalar iyi yapılmalıdır. Web, Web düzeyinde bir güvenlik duvarı uygulamak için Nginx + Lua'yı da kullanabilir. Elbette entegre OpenResty'yi de kullanabilirsiniz.

    6. Web izleme

    Aslında web izlemenin birçok konusu var. Örneğin, sayfayla ilgili gecikmeleri, js yanıt süresini, indirme süresini vb. İzlemek için yerleşik Web izlemeyi kullanabilirsiniz. Burada, elde etmek için profesyonel ticari yazılım izleme hazinesi veya dinleme bulutu kullanmanızı öneririm. Sonuçta, ülkenin her yerindeki insanların bilgisayar odaları var (eğer bu bir çoklu bilgisayar odasıysa, bunun hakkında ayrıca konuşmama izin verin).

    7. Günlük izleme

    Web ise, Nginx'in 50x ve 40x hata günlüklerini ve PHP'nin ERROR günlüğünü izlemek için kullanabilirsiniz. Aslında, bu gereksinimler toplama, depolama, sorgulama ve görüntülemeden başka bir şey değildir.Başarmak için aslında açık kaynak ELKStack'i kullanabiliriz. Logstash (koleksiyon), Elasticsearch (depolama + arama), Kibana (ekran).

    8. İş izleme

    Yukarıda çok şey yapıldı, aslında işin işleyişi sonunda hala garantilidir. Bu şekilde, yaptığımız izleme mantıklı. Bu nedenle, daha önemli iş göstergelerini izlemek için iş seviyesinin izlenmesi geliştirme ve yöneticilerle görüşülmeli (onay gereklidir) ve daha sonra basit bir komut dosyasıyla gerçekleştirilebilir ve sonunda tetikleyici kurulabilir.

    9. Akış analizi

    Günlük analizi yapmak için genellikle awk sed xxx araçlarını kullanırız. Bu bizim için IP, PV ve UV'yi saymak için pek uygun değil. Daha sonra gömülü kodlar geliştirmek için Baidu istatistiklerini, Google istatistiklerini ve işletmeyi kullanabilirsiniz. Gizlilikten kaçınmak için, ilgili trafik analizi yapmak için Piwik'i de kullanabilirsiniz.

    10. Görselleştirme

    Arayüzü güzelleştirmek için Screen ve bazı üçüncü taraf kitaplıkların tanıtılması aracılığıyla, sipariş hacminin aniden arttığını ve azaldığını bilmemiz gerekiyor. Başka bir deyişle, aniden büyük bir trafik dalgası geldi, bu trafik nereden geldi, terfi mi, saldırı mı? Çeşitli sistemler arasındaki iş ilişkisini çözmek için izleme düzeyini birleştirebilirsiniz.

    11. Otomatik izleme

    Yukarıda çok çalıştığımız için elbette anahtarları tek tek ekleyemiyoruz. Zabbix'in aktif modu ve pasif modu ile elde edilebilir. Tabii ki, API aracılığıyla uygulamak en iyisidir.

    sonuç olarak

    Gerçekten daha eksiksiz bir izleme sistemi elde etmek istiyorsanız, mevcut açık kaynaklı yazılım gerçekten tatmin edilemez, nitelikli şirketler Xiaomi'nin açık kaynaklı Open-Falcon gibi kendi izleme sistemlerini geliştirmeye başladılar.

    Sensu gibi daha iyi açık kaynak izleme çerçeveleri de vardır, ayrıca InfluxDB ve Grafana, şirketinize uygun izleme platformunu özelleştirmek için kullanılabilir.

    Changan Ruicheng CC raporu ifşa edildi, Lexus'un yüzüne çarptı
    önceki
    Samsung A serisinin en gelişmiş ürünü? Galaxy A8 Star resmi olarak piyasaya sürüldü
    Sonraki
    Canlı aksiyon fantezi devi "Dumbo" ülke çapında piyasaya sürüldü, süper sevimli şeyler bahar ekranını aydınlatıyor, yürekleri ısıtan ilham verici bir efsane sahneliyor
    Gel! Önden çekişli Yeni Kuzey arabalarının kinlerini ve kinlerini geri alalım
    Wu Yifanın en sevdiği yuvarlak çerçeveli güneş gözlükleri geliyor, MYKITA x 424 satışta olacak
    Xiaobai için 10 dakikalık Nginx başlangıç kılavuzu
    Roewe RX5 en yüksek manuel şanzıman modeline nasıl sahip?
    "Ping" yaptığınızda, arkasındaki mantığı biliyor musunuz?
    Rötuş kesin değil ve birbirine yapıştırmak mı? ! PALACE "sadık" Thames'in en son LOOKBOOK kreatif tam notları!
    Lin Feng ve Tan Yaowen havadan Foshan "Yolsuzlukla Mücadele Fırtınası 4" ile hapishane sahnesi "çok gerçek" olarak övüldü
    Öne Çıkan Li Feifei: Yapay zekanın gelişimine ilham verdi ve daha da önemlisi, yapay zekaya insan değeri vermeli
    250.000 orta boy SUV sadece Japon değil, ama bunlar fena değil!
    Onu hiç görmemiş olmalısın! Gizemli Air Jordan 1 "Wings" Örnek üçlü pozlama
    Chongqing Jiaotong Üniversitesi ilk kez "Luban Ödülü" nü kazandı. Bu laboratuvar dünyanın ilk 10 köprü ve tünel projesini doğurdu
    To Top