30 dakikada teslimat yapabilmek için Hema mühendislerinin hangi "bilge operasyonları" var?

Ali Mei's Guide: Hema Fresh'e gelince, taze ıstakozların yanı sıra en etkileyici şey hızlı teslimat: mağazaya 3 kilometre içinde 30 dakika içinde teslim edilecek.

Hema, BT'den DT'ye, başlangıçtan tüketicilere ölçek ve iş karmaşıklığının iç içe geçmesine dayanan uçtan uca bir platformdur ve Hema dağıtımı, IOT, zeka, otomasyon ve diğer çevrimdışı işlemleri entegre eder. Aynı zamanda, yağmur, kar, buz ve sis, karayolu trafiği, topluluk tesisleri vb. Mücbir sebep faktörleri nedeniyle dağıtım sisteminin istikrarı daha da kötüdür. Çevrimdışı dağıtım işlemlerinin istikrarının nasıl sağlanacağı, binicileri nasıl mutlu edeceği ve kullanıcıları nasıl mutlu edeceği Hema dağıtımının ebedi bir konusudur. .

Üç ana norm

Tüm Hema Teknoloji Departmanının çevrimiçi / çevrimdışı üretime, yüksek kod kalitesine ve sıkı hata işlemeye olan ilgisi, mühendislerimizin sürekli olarak kendimizi reddederken kendimizi tekrar tekrar onaylamasına ve geliştirme sırasında yeniden düzenleme sistemleri tasarlamasına olanak tanır. , Üretim sırasında sistemi inceleyin. Çevrimiçi / çevrimdışı buz ve ateş deneyiminden sonra, 12 kelimeyle özetlenebilecek bir dizi kararlı metodoloji geliştirdik: Ar-Ge özellikleri, mimari özellikleri ve kararlılık özellikleri.

Kural yok, daire yapmanın yolu yok

Birincisi, araştırma ve geliştirme şartnameleridir ve aşağıdaki resme bakın:

Bu resme 7 katmanlı huni modeli adı verilir (huniyi çizmeye çalışmak, çizim becerileri iyi değildir, açık renkli ok huniyi gösterir), 7 katmanlı PRD incelemesi, teknik plan incelemesi, TC incelemesi, kodlama, test kodu incelemesi, gri tonlamalı sürüm , Operasyon ve bakım. Huni modeli neden? Bu 7 katmandan geçip tarama katmanlarından geçtiğimiz için, çevrimdışı süreci engelleyen tüm büyük hatalar bu 7 katmanda yakalanacaktır.

PRD incelemesi: Bir talep havuzumuz var ve tüm talepler önce bu havuza atılıyor İki haftada bir, yüksek öncelikli ve yüksek aciliyet ihtiyaçlarının PRD incelemesi için tarandığı (tersine çevrilmiş projeler hariç) iki haftada bir operasyon toplantısı var. Tüm PRD incelemelerinin, projenin veya talebin değeri üzerinde anlaşmaya varmak için bir PD organizasyonu vardır.İnceleme süreci sırasında, Ar-Ge öğrencileri alan modelleme ve soyutlama için PRD'deki terimleri ararlar. Tüm gereksinim ve proje, teknik riskleri tanımlamalı, "başkaları tarafından öldürülmemek, başkalarını öldürmemek" ilkesini takip etmeli, çekirdek bağlantıları ve çekirdek olmayan bağlantıları tanımlamalı; test öğrencileri, ikinci TC için risk noktalarını belirlemeli ve bunlardan işlev noktalarını test etmelidir. İnceleme için hazırlıklı olun.

Teknik plan incelemesi: PM, toplamda yer almak için Ar-Ge, test ve PD düzenler.Ar-Ge öğrencileri, önceden tahsis edilen Ar-Ge modüllerine göre teknik görüşmeler yapar ve aynı zamanda ürün ve iş çözümlerine ulaşmak için PD ve hatta işletme öğrencileriyle çalışır. İnsanlar hata yapar, insanlar tarafından yazılan koddan bahsetmeye bile gerek yok.Böcekleri kucaklamalıyız, ancak potansiyel riskleri de belirlemeli ve araştırmayı yürütmeliyiz.

TC incelemesi: Genel olarak, TC incelemesi, teknik inceleme tamamlandıktan sonra iki gün içinde yapılacaktır.Ana işlev kapsama noktaları, teknik çözümün potansiyel çukurları, işlevsel olmayan perspektiften iş bozulma planı, performans QPS \ RT, arayüzün test edilebilirliğinin değerlendirilmesi ve test ortamı , Test verileri vb. Ve son olarak güvenilir bir çevrimiçi zaman verin.

kodlama: Önce grubun kodlama kurallarını ve ardından savunma programlamasını izleyin. İş sistemi kodunun belki de% 80'i anormal koşullar altında yüksek kullanılabilirliği nasıl sağlayacağını düşünüyor. Sistem ve iş istisnalarının ele alınması, çevrimiçi olurken gri şemaların depolanması (bir mağazadaki bir sorun Tüm Hema mağazasını etkilemez), önbelleğe alma mekanizması, esnek kullanılabilirlik, yeniden deneme mekanizması, işlem işleme, seri paralellik, günlük kaydı vb.

Test kodu İncelemesi: İlk olarak, kendi kendine test araştırma ve geliştirme yoluyla tamamlanır ve içilir ve test resmi olarak önerilir.Elbette kodlama süreci sırasında kod incelemesi yapılacaktır.O zamanki kod incelemesi bunu çevrimiçi bir inceleme olarak adlandırdı ve Aone işlevi aracılığıyla incelemeleri için ilgili öğrencilere sundu; Test bittikten sonra, çevrimiçi olmadan önce kodu gözden geçirmek için bir araya geleceğiz.Bu aşamada, sistem bağımlılık sırasını, yayın sırasını, geri alma sırasını ve herkesin konumunu da tamamlayacağız.

Gri tonlamalı yayın: Her şeyden önce, Hema Ar-Ge kırmızı çizgisine sıkı sıkıya bağlı kalıyoruz ve sürüm penceresine göre yayınlıyoruz.Aynı zamanda riski en aza indirmek için farklı işletmeler için farklı çıkış zaman noktaları oluşturuyoruz.Örneğin, O2O sahnesi saat 14: 00'da ve B2C sahnesi saat 20: 30'da vizyona girecek. Ignite; farklı mağazalar için gri tonlama gerçekleştirin, sürüm tamamlandıktan hemen sonra, SLS aracılığıyla orijinal hata günlüğünü kontrol edin, A3 hata istatistik günlüğünü kontrol edin, EagleEye QPS / RT'yi kontrol edin, CloudDBA DB performansını kontrol edin / yavaş SQL vb. 30 dakikadan fazla ekrana bakın. Genel olarak riskin nispeten yüksek olduğunu düşünüyoruz.Yayınlanma anında sadece iki makine çıkacak.Ertesi gün herhangi bir sorun olmadığını görüyoruz ve sonra hepsi çevrimiçi oluyor.Eğer sorun varsa, doğrudan bu iki makineyi öldür'e gidin.

Operasyon ve bakım: Her sürümün ardından erken kalkıp ertesi gün ekrana bakmak çok önemlidir, özellikle de farklı kapasite sağlayıcıları ve kapasite türlerini içeren işlemler için doğrulama yöntemleri farklı olduğunda, sabahları zengin kapasite türleri sorunlara en yatkın ve sorun bulması en kolay olanlardır. Bir problem olduğunda, problemi ilk kim bulursa hemen gruptaki herkesi sabitleyecektir.Eğer ekipler arası bir grupsa, küçük bir grup telefon sahibini ayrı ayrı çekecektir.Sorun yeri için özel sınıf arkadaşları oluşturacağız. Bazı insanlar SLS izliyor. Bazıları EagleEye'ı, bazıları A3'ü, bazıları Xflush'u, bazıları da CloudDBA'yı izliyor, bazıları sürücüyü yatıştırmak için konuşuyor, bir kişi birime komuta ediyor, herkesin net bir iş bölümü var ve tüm sorun bir kişi gibi ele alınıyor.

Bir sepete yumurta koymayın

Hema dağıtımında şu anda 50'den fazla sistem var, bunlardan 20'den fazla çekirdek uygulama, bu kadar çok sistem nasıl kararlı ve koordineli olabilir? Aşağıdaki resme bakın:

Projelendirme: En başından itibaren, Hema Dağıtım tüm sistemi proje boyutlarına göre inşa etmiş, Hema kullanıcılarının bireysel ihtiyaçlarını karşılayabilecek bu tür bir geliştirme hızlıdır ve birkaç kişinin koşulu altında hızlı bir şekilde yinelenebilir.

Ticarileşmiş: Giderek daha fazla iş ihtiyacı ile birlikte bu geliştirme yöntemi, başta esnek ve değişken ihtiyaçlar olmak üzere tüm projenin hızını yavaşlatıyor.Bu aşamada ürünleştirme yöntemi takip edecek.NBF'yi geçen yıl Mayıs ayında tanıtmıştık. Kural merkezi, çeşitli Kurulumlar ve operasyonel mantık ile iş mantığı arasındaki ayrım gibi çeşitli yapılandırmalar, talepteki değişiklikleri hızlı bir şekilde destekleyebilir.

Servis: Geçen yılın Ağustos ayında Dianwoda, Linqu, Hummingbird ve diğer üç tarafla yanaştık. Yerleştirme süreci sancılıydı. İş mantığının esas olarak Hema senaryosunda olduğunu gördük. Üç tarafın bazı özelleştirme yapması gerekiyordu. Şu anda, düşünmeye başladık Tüm çevrimdışı operasyonlar için değişmez iş kuralları ve senaryo tabanlı iş kuralları, arka uç olarak değişmeyen iş kurallarını ortadan kaldırın ve senaryo tabanlı iş kurallarını, iş kavramlarını, iş durumunu ve iş kurallarını açıklayan bir arka uç oluşturmak için orta ofisimize yerleştirin Orta istasyon, birleşik izin doğrulaması yapar, senaryo tabanlı iş mantığı, veri ağ geçitleri ve tüm düşürülmüş akım limiti orta istasyona çıkabilir, her bir taşıyıcının akış kontrolünü tamamlayabilir ve yukarıdaki mimari spesifikasyonları yavaşça inkübe edebilir. Bu süreç daha zahmetli. İş mantığını, arayüz parametrelerinin rasyonalitesini ve harici bağımlılıkları çözmek için işle başa çıkmalı ve 34 çekirdek L0 hizmetlerini yeniden yükseltmeliyiz. Yeni ve eski hizmetlerin sorunsuz geçişinin hiçbir iş anlayışı yoktur ve sonunda NBF'de, gerekli alan yetenekleri, hizmetleri ifade etmek için NBF aracılığıyla bağlanır.

Sayısallaştırma: En alt katman istihdam yönetimi platformumuzdur.Yeni perakendenin kurumsal açıdan iki temel seviyesi vardır: Biri teknik düzeyde "insan ve mal piyasası" nın dijitalleşmesi, diğeri ise perakende düzeyinde "insan ve mal pazarı" dönüşümü veya devrimi; Perakende değişikliklerini yönlendirmek için teknolojiyi kullanarak, hangi mağazaların iyi olduğunu, hangi mağazaların zayıf olduğunu, nedenlerin nerede olduğunu, nasıl optimize edileceğini ve teknik temelin ve desteğin sağlanacağını, tüm veri modeli aşağıdaki gibidir:

Kağıt üzerinde çok sığ

Aşağıda gösterildiği gibi, herhangi bir teori ve yapı sürekli olarak pratikle test edilmeli, hatalardan ders alınmalı ve hatalardan geliştirilmeli ve çevrimdışı teslimata uygun bir dizi 7 yollu 23 vuruş önermelidir:

İlk yol: çekirdek ve çekirdek olmayan yalıtım

İlk olarak, çekirdek ve çekirdek olmayan hizmetleri uygulama boyutundan ayırıyoruz ve çekirdek hizmetleri çekirdek olmayan hizmetlerden ayırıyoruz. Veritabanı düzeyinden, çekirdek ve çekirdek olmayan kitaplıkları ayırıyor, okuma ve yazmayı ayırıyor ve temel işlem senaryoları gibi her depolama katmanının avantajlarından tam anlamıyla yararlanıyoruz. ADS kullandığımız gerçek zamanlı toplama analizi senaryoları, OpenSearch'ü sunduğumuz çekirdek olmayan çok boyutlu birleşik sorgu senaryoları ve yalnızca saptırmada rol oynayan değil, aynı zamanda temel operasyon senaryolarını da koruyan çevrimdışı senaryolar ODPS olan Mysql kullanıyoruz. Mimarinin bu şekilde yükseltilmesi, Shangjia öğrencilerimizin bazı çekirdek olmayan senaryolarda tek başlarına gelip kendi potansiyellerini tam anlamıyla oynamalarına olanak tanır.

Sistem etkileşimi için İstek / Yanıt moduna dayalı HSF yatay çağrısını kullanırız; diğeri ise Olay güdümlü moda dayalı dikey çağrıdır.

Temel hizmetlere bağımlılık açısından, herhangi bir dış hizmete güvenmeme ilkesine bağlı kalıyoruz.Dış hizmetlerde sorun olsa bile, aşağıda gösterildiği gibi arama yöntemini oluşturarak çalışmaya devam edebiliriz:

Bağlantı ek yükü yüksektir ve ağ titremesinin sorunlara neden olması kolaydır. Bunu aşağıdaki gibi "taşıyıcı düzeyinde" bir hizmet olarak adlandıracağız:

Örneğin: Kartezyen bir ürün oluşturmak için insanların ve malların dağıtımı eşleştirildikten sonra, dağıtılmış hesaplamalar gerçekleştirmek için harita azaltmaya benzer.Kartal göz bağlantısının gözlemlenmesi sayesinde, zaman alıcı, zaman alıcı hesaplamayı değil, azaltmak için esas olarak ağ zaman alıcı haritada olduğu bulunmuştur. İnsanların ve malların eşleştirilmesi, ağ ek yükünü ve dağıtılmış hesaplamayı dengelemek için bir matris oluşturur. Son olarak, aşağıdaki matriste gösterildiği gibi, 108 çağrı 9 kat olarak değiştirilir ve performans temelde 12 kat iyileştirilir:

İkinci yol: sorunların zamanında tespiti, istikrarın yarısıdır

Servis seviyesi-idempotence, parametre doğrulama, sigorta veya zaman içindeki statik ve dinamik kontrol, servis seviyesinin yüksek kullanılabilirliğini sağlamak için yeniden deneme sayısı;

Sistem düzeyinde trafik planlaması, Ar-Ge kırmızı çizgileri, kod Reivew kültürü, Guangmingding'deki ana sürüm kolektifleri, trafik planlaması, A3 \ EagleEye \ SLS \ Xflush, vb. QPS \ RT yıldan yıla hizmet izleme veya alt düzey makine performansı izleme garanti edilebilir Problemi ilk seferde bulun. Guangmingding'de toplu olarak büyük bir sürüm yayınlamak kültürümüzün bir kültürüdür. Double 12'den iki hafta önce tüm sistem mimarisini yükselttiğimizi, 13 sistemi içerdiğini ve büyük promosyondan önce baskı altında ve son olarak da Double 12 sırasında sistemi piyasaya sürdüğümüzü unutmayın. Genel stabilite sabittir ve çeşitli göstergelerin çapakları çifte 11'e kıyasla azalır, özellikle 12 günlük yağmur ve kar havası istasyonda ciddi şekilde tıkandığında, insanlara ve mallara yönelik ek hizmetlerimiz, çift 11 QPS'ye kıyasla neredeyse iki katına çıktı, ancak RT'miz% 50 düştü.

Diğer püf noktaları, örneğin, Çin Yeni Yılı sırasında, sistemin normal çalışmasını sağlamak için her gün çekirdek sistemin rutin incelemelerini gerçekleştirecek özel bir kişimiz var; kararlılık bilgisi açısından, dahili ve harici olarak paylaşıyoruz ve aynı zamanda diğer ekip başarısızlıklarını analiz için kendi başarısızlıklarımız olarak ele alıyoruz. Sistemimizin nedenlerini ve eksikliklerini öğrenin.

Üçüncü yol: hata önleme

Sistem karmaşıklığı ve iş gereksinimleri kod bozulmasına neden olmaya devam ettikçe, tüm sistemi düzenli olarak yeniden düzenleriz ve tüm yeniden düzenleme planı üzerinde bir anlaşmaya varırız; bu yılki sistemin karma ortamı da bizim için bir zorluktur, bu nedenle zaman aşımları ve yeniden denemeler yaptık Mekanizma, özellikle çalışma süresi boyunca zaman aşımı süresinin değiştirilmesi çığları önler.Her yeni işlev başlatıldığında, olası riskleri belirlemek için hata enjeksiyonu ve arıza tatbikatları yapılır.

Dördüncü yol: hata azaltma

Makinemizde büyük promosyon ve tam iş parçacığı havuzu gibi acil durum genişlemesi durumunda bazı tamponlar bulunmaktadır.Aynı zamanda, anormal durumlarda acil kanamayı önlemek için yüksek QPS için bir düşürme planı vardır. Yukarıda bahsettiğimiz iş sistemi ürün ve iş çözümlerine sahip olmalıdır.Örneğin sinekkuşu ile kenetlendiğimizde sinekkuşu sisteminde bir sorun olursa sunucumuz bu durum için savunma amaçlı programlama yapmış ve sinekkuşu sürücüsüne izin vermek için anahtarı açmıştır. Kullanıcılar üzerindeki etkiyi azaltmak için işlemler gerçekleştirmek için Feiyu uygulamasını kullanın. İstikrar açısından, sadece kendi başımıza kazanmamalıyız, aynı zamanda ortaklarımızın kazanmasına da izin vermeliyiz.

Beşinci yol: hızlı iyileşme

Geri alma, sistem piyasaya sürüldükten sonra anormallikler için en etkili hemostatik çözümdür. Zayıf güven için, atlamasına ve düşmeye devam etmesine izin vermek için esnek kullanılabilirlik kullanırız. Yerine getirme ve tahsis durumunun tutarsızlığı gibi anormal bir durum olduğunda, Apollo arka ucunu kullanırız. Tek tıklamayla onarım, istisnalar için acil durum düzeltme planı ve hızlı bir şekilde kurtarmak için Diamond komut verme.

Altıncı yol: hızlı tazminat

Sistemimiz vatansız ve düz olacak şekilde tasarlanmıştır ve tek bir nokta yoktur.Makine genişlemesi bazı anormal durumlar için hızlı bir hemostaz çözümüdür.

Yedinci yol: salım tedavisi

Yukarıda bahsedilen hilelerin kanamayı hızlı bir şekilde durduramaması durumunda, sadece bırakma işlemini kullanabiliriz.Bir zamanlar makine yükü birden yükseldi.Alarm aldıktan sonra ilk tepki bir makine problemiydi, ancak bazı makinelerin iplik havuzunun neredeyse dolu olduğunu gördük. , Makineyi hemen genişletmeye ve yeniden başlatmaya başladık. Bazı öğrenciler hızla genişletiyor, bazıları makineyi durmadan yeniden başlatıyor ve diğerleri sorunun temel nedenini hızla buluyordu. Son olarak, DUMP aracılığıyla, bir Jar'dan alıntı yapıldığı ve bu Jar paketinin Java kullanan normal ifade, özel bir ürün adı ayrıştırılırken sonsuz bir döngüye girdi. Nedeni bulduktan sonra, bu durum ancak yayınlayarak çözülebilir. Acil bir çözüm üretmek için hızlı bir anlaşmaya vardık. Bu, önceki öğrencilerin genişletilmesi ve durmasıdır. Yeniden başlatma, böylece bir arızayı önler.

Denizde yelken açmak dümenciye bağlıdır

Hemanın dağıtımının istikrarı, iş tarafına, ürünlere, Ar-Ge'ye, testlere, Web, Uygulama, RF, GOC, yukarı ve aşağı akış, algoritmalar, IOT, NBF, Hema güvenlik üretimi, ara katman yazılımı, ağ, hava durumu istasyonuna, Yağmur, kar, buz ve sis, yol trafiği, trafik ışıkları, topluluk tesisleri, sürücü ekipmanı ve diğer faktörler, her bir bileşen çok önemlidir. İstikrar keşfi hala yolda ve sürekli olarak nihai amacın peşinde.

Bu çarşamba gecesi Ali Technology Live sizi bekliyor!

20 Mart (Çarşamba) 19: 30'da "AI ve Güvenlik: Dijital Çağda Fırsatlar ve Zorluklar!" Hakkında konuşalım, izlemeye hoş geldiniz.

Canlı katılım yöntemi:

  • Doğrudan izleyin: Yukarıdaki resmin QR kodunu tarayın veya canlı bağlantıyı tarayıcıda açın (unutmayın! Tarayıcı, cep telefonu veya PC ile açılmalıdır): https://alivideolive.taobao.com/h5/liveDetail/ 22c3dd6d-8855-4575-b347-adacb4867ac8, onu kaldırın, çalar saati ayarlayın ve 20 Mart'ta (Çarşamba) zamanında izleyin
  • Dingding grubu görüntüleme: Değişim grup numarasını aramak için "Dingding" i kullanın 21933455 , AI ve güvenlik teknolojisi değişim grubuna katılın, o anda canlı yayını izleyebilir ve ayrıca konuklar ve sektördeki meslektaşlarınızla etkileşim kurabilir ve tartışabilirsiniz.

Canlı vurgular:

Bu canlı yayında, multimodal füzyon, küçük örnek öğrenme, alan geçişi ve video grafik modelleme gibi en yeni AI güvenlik teknolojilerini tanıtmaya odaklanacağız. Ali, genel risk önleme ve kontrol yeteneklerini geliştirmek için bu teknolojileri nasıl kullanıyor? Bu Çarşamba gecesi, ayrılık olmayacak!

Manchester United aşağılanmıştı ve Manchester City'nin topunu yarım dakikada alamadı! Gülümseyen Mata yardım edemedi ama delirdi
önceki
Avrupa futbolundaki en büyük sakatlık emekli olduğunu açıkladı! Kariyerinde 35 kez yaralandı, 1935 günü kayıp
Sonraki
"Galaksiye Cesur" para kazanma stratejisi
Great Wall / Geely gibi sekiz bağımsız otomobil şirketi, yurtdışında çok sayıda Ar-Ge merkezi inşa etti! Yardım edemem ama beğeniyorum
Spurs'u yendikten sonra, Tyronnlue potu atmakla meşguldü ve James'in başı gerçekten belada gibiydi!
Çin futbolu amatör sahnede yeniden ortaya çıkıyor 1: Lippi'nin halefi Zheng Zhi, topu 5 metre kadar uzakta durduruyor
Ağaç dikmeye uygun bu günde, Ali Chuancheng yetkilileri 1000 kişi oldu
110,000 yuan'dan! Güçlü güce, konfigürasyona ve görünüme sahip spor otomobil envanteri
Tek nefeste 5 yeni yardım resmen duyuruldu! Evergrande yeniden yelken açtı, Bison yeni sezonda takımı geride bıraktı
"NBA2K17" hava alma ve havayı kesme taktikleri kılavuzu
Satışlarda çok önde olan Magotan, neden bu kadar zor?
Zaza'nın yaralanmasına kıyasla, masum numarası yapmak daha sessizdir! Lillard çok doğrudan cevap verdi!
Süper oolong! U23 milli futbol takımı 3-0'dan 3-2'ye gitti ve savunma oyuncusu kaleciyi geri geçti ve ıskaladı: top kalesine gitti
Öğrenme ve Okuma Kulübü'ne Odaklanın: Çin Hikayesini Dünyaya Anlatın
To Top