TensorFlow'a dayalı, büyük ölçüde ölçeklenebilir bir makine öğrenimi platformu "Google TFX'i Yorumlama"

8 Kasım 2017'de Pekin Ulusal Kongre Merkezi'nde AI WORLD 2017 Dünya Yapay Zeka Konferansı Bilet satışları başladı! Erken kuş biletlerinde% 50 indirim, bilet almak için geri sayım 4 gün kapmak için . Bulması zor geçen yılki AI WORLD 2016'yı hatırlıyor musunuz? Bu yıl "Lengpu Master" ın babası Tuomas'ı olay yerine davet ettik ve Google, Microsoft, Amazon, BAT, Xunfei, JD.com ve Huawei'den ağır siklet konuklar katılımlarını doğruladılar.

KDD2017'de Google, TensorFlow'u temel alan, büyük ölçüde ölçeklenebilir ürün düzeyinde makine öğrenimi platformu TFX'i piyasaya sürdü. (Kağıt adresi:

Makine öğrenimi modellerini oluşturmak ve dağıtmak için bir platform oluşturmak ve sürdürmek, eğitim verilerine dayalı modeller oluşturan bir öğrenci, verileri ve modelleri analiz etmek ve doğrulamak için modüller ve aşağıdakiler için modeller sağlamak dahil olmak üzere birden çok bileşen arasında dikkatli bir koordinasyon gerektirir. Hizmet tesisleri.

Veriler zamanla değiştiğinde ve sürekli olarak yeni modellerin üretilmesi gerektiğinde bu özellikle zor hale gelir. Ne yazık ki, bu düzenleme genellikle özel amaçlı yapıştırıcı kodlar ve bireysel ekipler tarafından geliştirilen özel komut dosyaları kullanılarak yapılır, bu da tekrarlayan çalışmalara ve kırılgan yüksek teknoloji borç sistemlerine yol açar.

Yazar, Google genel makine öğrenimi platformunu ve uygulama sürecini ayrıntılı olarak analiz etti. Yukarıdaki bileşenleri tek bir platforma entegre ederek, bileşenler standartlaştırılabilir, platform konfigürasyonu basitleştirilebilir ve üretim süresi aylardan haftalara kısaltılabilirken, platform stabilitesi sağlar ve hizmet kesintisi en aza indirilir.

Makalede yazar, Google Play uygulama mağazasında platform dağıtımının bir örnek olay incelemesini sundu. Yeni veri akışı geldikçe, makine öğrenimi modeli sürekli olarak güncellenecektir. Dağıtım platformu, verileri ve model analizini optimize ederek, özel kodlarda azalma, daha hızlı bir deneme döngüsü ve uygulama kurulumunda% 2'lik bir artış sağlar.

Aşağıda, blog yardımcısında daha ayrıntılı bir giriş yer almaktadır:

TFX: Seri üretim için TensorFlow tabanlı makine öğrenimi platformu

Dünya standartlarında çevrimiçi ürün ve hizmetlerin geliştirilmesi, son birkaç yılda muazzam değişikliklere uğradı. Son zamanlarda takip ettiğimiz bir dizi makale, üst sınırın nerede olduğunu anlamanıza yardımcı olabilir.

* Yeni temel: Şimdiye kadar, otomatikleştirilmiş testi, sürekli entegrasyonu, sürekli teslimatı ve belki de sürekli dağıtımı kabul ettiniz ve aşamalı olarak yenilerini sunma, davranışları izleme ve sorunlar keşfedildiğinde durma konusunda yetkin oldunuz.

* Ek olarak, karmaşık bir gösterge sistemi ve sürekli bir deney platformu kurdunuz.

* Sistem karmaşıklığındaki artış nedeniyle, bunu evrensel bir kara kutu optimizasyon platformuna genişletmeniz gerekebilir.

* Ama henüz bitirmedin! Optimize ettiğiniz tüm makine öğrenimi modellerinin eğitilmesi, doğrulanması ve sunulması gerekir. Bir makine öğrenimi platformuna ihtiyacınız var. Bugünkü makalenin konusu bu, Google TFX'teki makine öğrenimi platformunu tanıtıyor.

Neden bir makine öğrenimi platformuna ihtiyacım var?

Bir makine öğrenimi modelini uygulamaya yönelik kod, bir üretim sisteminde makine öğrenimi kullanmanın yalnızca küçük bir parçasıdır. "Makine Öğrenimi: Teknik Borçlar için Yüksek Faizli Kredi Kartları" başlıklı makalede makine öğreniminin uygulanmasında öğrenilen pek çok ders gördük. Verilerin dönüştürülmesi ve doğrulanması gerekir ve kötü (doğrulanmamış) modellerin üretime girmesini önlemek için model doğrulamasının veri doğrulaması ile birleştirilmesi gerekir. Ayrıca ölçeklenebilir bir hizmet altyapısına da ihtiyacınız var. Makine öğrenimi platformunun (TFX) temel bileşenleri aşağıda gösterilmiştir:

Şekil 1: Makine öğrenimi platformunun üst düzey bileşenlerine genel bakış

Platformumuz bu bileşenleri uygulayabilir ve üretimdeki en iyi uygulamaları kodlayabilir ... Yukarıdaki bileşenleri tek bir platforma entegre ederek, bileşenleri standartlaştırabilir, platform yapılandırmasını basitleştirebilir ve üretim süresini aylardan birkaç aya indirebiliriz Haftalık, platform kararlılığı sağlarken kesintiyi en aza indirir.

Veri analizi, dönüştürme ve doğrulama

Verilerinizle aynısınız. Durum kötüleşmeden önce, çok zaman kazandıracak veri anormalliklerini keşfedin.

Verilerdeki küçük hatalar, modelin kalitesini belirli bir süre boyunca tespit edilmesi zor bir şekilde önemli ölçüde düşürebilir (bazı yıkıcı hatalar bariz arızalara neden olabilir ve bu nedenle izlemesi kolaydır), bu nedenle uzun vadeli düşünceler için, herhangi bir makine öğrenimi platformu Her zaman verilere karşı tetikte olun.

Karşılaştırma ölçütleri oluşturmak ve değişiklikleri izlemek için TFX, her veri kümesi için bir dizi açıklayıcı istatistik üretir. Bunlar, özellik varlığı ve değerini, işlevler arası istatistikleri ve yapılandırılabilir dilimleri içerir. Bu istatistikler, büyük ölçekli ve verimli hesaplamalar gerektirir ve büyük ölçekli eğitim verilerinde doğru hesaplamalar pahalı olabilir. Bu durumda, yaklaşık sonuçlar sağlayan dağıtılmış bir akış algoritması kullanılabilir.

TFX ayrıca, işlevsel çakışmaları destekleyen bir dizi veri dönüştürme içerir. Örneğin, TFX tamsayılara "sözcükler" adı verilen bir özellik eşlemesi oluşturabilir. Veri dönüşümü eğitim ve hizmet arasında ayrılmaz olduğunda, işleri karıştırmak kolaydır. TFX, bu sorunları önlemek için eğitim modelinin bir parçası olarak herhangi bir veri dönüşümünü otomatik olarak dışa aktarır.

TFX, doğrulama gerçekleştirmek için beklenen verileri açıklayan şablonlar sağlamaya dayanır. Model, işlevi ve beklenen türünü, fiyatını ve etki alanını açıklar. TFX, kullanıcıların kalıplarının ilk sürümünü otomatik olarak oluşturmalarına yardımcı olabilir.

Şekil 2: Örnek doğrulama durumu

TFX, kullanıcılara faydalı istisna bilgileri uyarıları sağlar.

Kullanıcıların veri hatalarını ve kod hatalarını eşit derecede titizlikle işleyebileceğini umuyoruz. Yukarıdaki uygulamaları kolaylaştırmak için, kullanıcıların kaydedilebilen, izlenebilen ve çözülebilen herhangi bir yazılım hatası gibi anormal veriler göndermesine izin veriyoruz.

Eğitim

Modelinizdeki kod (tabii ki TensorFlow'da yazılmıştır) TFX'e dahil edildikten sonra, öğrenme algoritmasını kolayca dönüştürebilirsiniz. Makine öğrenimi modellerinin sürekli eğitimi ve geliştirilmesi yaygın bir üretim kullanım durumudur, ancak birçok senaryoda, modeli her seferinde sıfırdan yeniden eğitmek büyük bir zaman ve kaynak tüketimi demektir.

Pek çok üretim kullanım durumu için, makine öğrenimi modellerinin güncelliği kritik öneme sahiptir ... Bu kullanım senaryolarının çoğu, birkaç saat (veya gün) eğitim gerektirebilecek devasa eğitim setlerine (O (100B) veri noktaları) sahiptir ... Model kalitesi ile model tazeliği arasında bir denge vardır. Sıcak başlangıç, bu ödünleşime karşı koymak için pratik bir tekniktir.Doğru kullanılırsa, daha kısa sürede ve daha az kaynak tüketimiyle birkaç saat eğitim gerektiren önceki modelle aynı kalitede bir model elde edebilir.

Sıcak başlatma TFX'te yerleşiktir ve ağdaki sıcak başlatma özelliklerini seçme işlevi de sağlanmıştır ve TensorFlow'da açık kaynaklı olmuştur. Ağın yeni bir sürümünü eğitmek için sıcak bir başlatma kullanıldığında, sıcak başlatma özelliğine karşılık gelen parametreler, modelin önceden eğitilmiş sürümünden başlatılır ve buradan ince ayar yapılır.

Değerlendirme ve doğrulama

TFX, kullanıcılara hizmet sunmadan önce modelin "iyi" olduğundan emin olmak için bir model değerlendirme ve doğrulama bileşeni içerir.

Makine öğrenimi modelleri genellikle çok sayıda veri kaynağı ve genellikle birbirine karışan etkileşimli bileşenler içeren karmaşık bir sistemin parçasıdır. Bu, hataların uzatılabileceği ve beklenmedik etkileşimlerin gelişebileceği büyük bir düzlem yaratacaktır.Sonunda, makine öğrenimi modelinin boyutunun küçültülmesi gerekecek ve bu da terminal kullanıcı deneyimine zarar verecektir.

Yeni model üretime nasıl teşvik edilir? Elbette A / B testini geçin! Modeller, gerçek zamanlı teste başlamak için yeterli beklentilere sahip olup olmadıklarını belirlemek için ilk olarak sürekli veriler aracılığıyla değerlendirilir.TFX, iş göstergelerine yaklaşan vekil göstergeler sağlar. Ekip, bu testi geçen modeller için, modelin gerçek zamanlı trafik ve ilgili iş göstergeleri üzerindeki gerçek etkisini belirlemek için ürüne özel A / B deneyleri gerçekleştirir.

Model ürüne sunulduğunda ve sürekli olarak güncellendiğinde, güncellenmiş modelin iyi olduğundan emin olmak için otomatik doğrulamayı kullanın. Bir modelin güvenli olduğunu doğrulamak için basit bir kanarya süreci kullanıyoruz. Model kalitesini sabit eşikler ve temel modeller (mevcut üretim modelleri gibi) ile karşılaştırarak tahminlerin kalitesini değerlendiririz.

Model güncelleme doğrulaması başarısız olursa, hizmete gönderilmez ve ürün ekibi için bir uyarı oluşturulur.

hizmet

TensorFlow Hizmeti, üretim ortamına dağıtılacak makine öğrenimi modelleri için eksiksiz bir hizmet çözümü sağlar. Üretim, düşük gecikme ve yüksek verimlilik içeren talebe hizmet eder. Çoğu model için ortak TensorFlow veri biçimi kullanılır, ancak doğrusal modeller gibi veri yoğun (CPU yoğun) ağlar için, tembel ayrıştırmayla özel bir protokol arabellek ayrıştırıcısı oluşturulur.

Bu sistemi uygularken, veri tekrarını en aza indirmeye özel dikkat gösterilmelidir. Bu, özellikle seyrek veri yapılandırmaları için zordur. Özel bir protokol tampon ayrıştırıcısının uygulanması, kıyaslama veri setinin 2-5 kat hızlanmasına neden oldu.

TFX ve Google Play

Google'ın TFX platformunu başlattığı ilk ekiplerden biri Google Play idi ve öneri sistemi için kullandılar. Sistem, mağaza ana sayfasını ziyaret ederken uygulama kullanıcılarını oynatmak için ilgili Android uygulamalarını önerir. Eğitim veri setinde on milyarlarca örnek vardır Üretim sürecinde, sistem saniyede binlerce sorguyu katı gecikme gereksinimleriyle (on milisaniye) işlemelidir.

Google Play sıralama sistemini önceki sürümden TFX'e aktardığımızda, yeni deneylerin yinelemeli hızında bir artış, azalan teknik borç ve geliştirilmiş model kalitesi gördük.

Sonraki adım

Açıklayıcı?

Makine öğrenimi gittikçe daha yaygın hale geldikçe, anlaşılabilirliğe güçlü bir ihtiyaç vardır ve modeller kararlarını ve davranışlarını kullanıcılara açıklayabilir (ve çoğu durumda GDPR-AC gibi yeni mevzuatın yasal gerekliliklerini kullanır). TFX dağıtımından öğrendiğimiz derslerin, kullanıcılara daha derin içgörüler sağlayabilecek etkileşimli bir platform oluşturmak için bir temel oluşturduğuna inanıyoruz.

[Satın almak üzere orijinal metni okumak için tarayın veya tıklayın 50 indirim "Erken Kuş Bileti"]

270 milyar yuan'a mal olan Sichuan-Tibet Demiryolu burada ve yol boyunca manzara çok güzel! Herhangi bir demiryolunu delin!
önceki
Liu Binbin'in 24. doğum günü kutlu olsun! Çin Süper Ligi'nin en üstteki kanadı olmak için bu puanları geliştirin
Sonraki
Jiangsu, Zhejiang ve Şangay'dan 24 saat boyunca kaçın ve sonsuzluk havuzu ve kaplıcanın kucağına düşün!
Moments'ta 34 yaşındaki bir polis memuruyla bu şekilde tanıştığım için üzgünüm.
Yeni Volkswagen otomobil, eski sürücüleri fethetmek için bir leapfrog dingil mesafesi alanına ve çoklu çekirdek yükseltmelerine sahip!
Dolandırıcılık nasıl etkili bir şekilde önlenir?
Bundesbank ve diğerleri renminbi'yi döviz rezervi olarak listeledikten sonra, yabancı medya: petrol ticareti yapmak için renminbi kullanmak en iyisidir
Güney Koreli koç kovuldu ve sorumlu liderler birlikte dersi attılar! Ulusal futbol ne olacak? Güvenli bir inişe öncülük etmek
Ali Tiejun koçu Yu Chaoling: Hedefe bakmak, süreci kovalamak demektir
"Google'ın yeni projesi açık" programlamayı öğrenmeye gerek yok, makine öğrenimi cep telefonu kamerası ve tarayıcısı ile yapılabilir
İnsanları ve büyü-Kamakura Monogatari'yi tasvir eden büyülü dünya
Değerleriniz ve zevkiniz etrafınızda kim olduğunu belirler
Hintli dijital ekonomistler: Hindistan'ın ekonomik verileri sahte olabilir ve Hindistan'ın üretimi de düşebilir
Küçük kırmızı bir çiçeğin çocukları iyileştirmesinin ardındaki mantık nedir?
To Top