Otomatikleştirilmiş makine öğrenimi: Otomatikleştirilmiş bir öğrenim projesinde ekipler birlikte nasıl çalışır? (Ekli bağlantı)

Yazar: Francesca Lazzeri

Çeviri: Wang Qi

Düzeltme: Feng Yu

Bu makale hakkında 3300 kelime, Önerilen Okuma 13 dakika.

Bu makale, ürün fazlalığını azaltmak için otomatik makine öğrenimi ve Azure makine öğrenimi hizmetlerini kullanan perakendecilerde çalışan veri bilimcileri, proje yöneticileri ve işletme yöneticilerinin belirli süreçlerini tanıtır.

Geçen yıl Kasım ayında, yapay zekayı demokratikleştirmek için otomatik makine öğreniminin kullanımı hakkında bir makale yazdım (aşağıdaki bağlantıya bakın).

Ekli bağlantı:

https://medium.com/microsoftazure/democratize-art artificial-intelligence-with-automated-machine-learning-169b348a9509

Bugünün makalesinde size göstereceğim Otomatik makine öğrenimi için kullanım örnekleri (Github'da yayınlandı, aşağıdaki bağlantıya bakın).

Ekli bağlantı:

https://github.com/Azure/MachineLearningNotebooks/blob/master/how-to-use-azureml/automated-machine-learning/forecasting-orange-juice-sales/auto-ml-forecasting-orange-juice-sales. ipynb? WT.mc_id = azuremedium-blog-lazzeri

Ayrıca bu makale, veri bilimcilerin, proje yöneticilerinin ve işletme yöneticilerinin ekip çalışmasını ve öğrenmeyi iyileştirmek ve yeni veri bilimi çözümlerinin başarılı bir şekilde gerçekleştirilmesini teşvik etmek için otomatik makine öğrenimini nasıl kullandıklarını da tanıtır.

Kuruluşlarda makine öğrenimi projelerini yürütmek söz konusu olduğunda, veri bilimcileri, proje yöneticileri ve işletme yöneticilerinin, belirli iş hedeflerini karşılamak için en iyi modeli dağıtmak üzere birlikte çalışması gerekir. Bu adımın temel amacı, analizde tahmin edilmesi gereken temel iş değişkenlerini belirlemektir. Bu değişkenleri modelin hedefleri olarak ele alıyor ve ardından projenin başarısını sağlamak için bunlarla ilgili göstergeleri kullanıyoruz.

Bu kullanım örneğinde (kullanım örneği halka açıktır ve GitHub'da yayınlanır), perakendecilerde çalışan veri bilimcilerin, proje yöneticilerinin ve işletme yöneticilerinin ürün envanterini azaltmak için otomatik makine öğrenimi ve Azure makine öğrenimi hizmetlerini nasıl kullanabileceğini göreceğiz. AŞIRI. Azure Machine Learning Service, tümü bulut kapsamında yapılabilen makine öğrenimi modellerini eğitmek, dağıtmak, otomatikleştirmek ve yönetmek için kullanabileceğiniz bir bulut hizmetidir. Azure makine öğrenimi hizmetinde otomatik makine öğrenimi, eğitim puanına göre verileriniz için en iyi modeli otomatik olarak seçmek amacıyla tanımlanmış hedef özelliklere sahip eğitim verilerini alma ve algoritma kombinasyonu ve özellik seçimi yoluyla yineleme işlemidir.

Fazla envanter hızla bir likidite sorunu haline gelir ve indirimler ve promosyonlar yoluyla karları azaltmadıkça nakde çevrilemez. Ya da daha kötüsü belli bir oranda birikip bayilik gibi diğer kanallara gönderildiğinde bu satışlarını geciktirecektir. Hangi ürünlerin istenen ciro düzeyine ulaşmayacağını önceden belirlemek ve satış tahminleri doğrultusunda stok yenileme yoluyla stok yenilemeyi kontrol etmek, perakendecilerin yatırım getirisi (ROI) elde etmesine yardımcı olan temel faktörlerdir. Ekibin bu sorunu çözmek için nasıl yola çıktığını ve otomatik makine öğreniminin şirket genelinde yapay zekayı nasıl demokratikleştirebileceğini görelim. .

Şirket için doğru iş hedeflerini belirleyin

Doğru ürün karışımı ve envanter seviyeleri muazzam satışlar ve karlar sağlayabilir. Bu ideal kombinasyonu elde etmek için en güncel ve doğru envanter bilgilerine sahip olmanız gerekir. Manuel işleme sadece zaman almakla kalmaz, mevcut ve doğru envanter bilgilerinde gecikmelere neden olur, aynı zamanda hata olasılığını da artırır. Bu gecikmeler ve hatalar, fazla envanter, yetersiz envanter ve stokların tükenmesi nedeniyle gelir kaybına neden olabilir.

Fazla envanter aynı zamanda değerli depo alanını kaplayabilir ve yeni envanter satın almak için kullanılması gereken parayı alabilir. Ancak bir tasfiye modelinde fazla stok satmak, itibarın zedelenmesi ve diğer mevcut benzer ürünlerin satışları üzerinde etki gibi bir dizi soruna neden olabilir.

Veri bilimcisi ile iş operasyonu arasında bir köprü görevi gören proje yöneticisi, aşırı stok sorununu çözmek için dahili ve geçmiş satışlarının bir bölümünü kullanma olasılığını tartışmak için işletme yöneticisi ile iletişim kurar. Proje yöneticileri ve iş yöneticileri, iş hedefleriyle ilgili belirli soruları sorarak ve mükemmelleştirerek proje hedeflerini tanımlar.

Bu aşamada iki ana görev vardır:

  • Hedefleri tanımlayın: Proje yöneticilerinin ve işletme yöneticilerinin iş sorunlarını belirlemesi ve en önemlisi, veri bilimi teknolojisinin hedefleyebileceği iş hedeflerini tanımlamak için sorular sorması gerekir;
  • Veri kaynağını tanımlayın: Proje yöneticilerinin ve veri bilimcilerin, proje hedeflerini tanımlayan soruları yanıtlamaya yardımcı olması için ilgili verileri bulması gerekir.

Doğru verileri ve ardışık düzeni bulun

Her şey veri bulmakla başlar. Proje yöneticilerinin ve veri bilimcilerinin, iş sorularına verilen yanıtların bilinen örneklerini içeren veri kaynaklarını belirlemesi gerekir. Aşağıdaki veri türlerini ararlar:

  • Sorunla ilgili veriler. Hedefle ilgili hedefe özel göstergeleri ve özellikleri var mı?
  • Model hedeflerini ve ilgili özelliklerini doğru bir şekilde ölçebilen veriler.

Bu aşamada, veri bilimcilerin üç ana görevi çözmesi gerekir:

  • Verileri hedef analiz ortamına uygulayın;
  • Veri kalitesinin soruyu cevaplamak için yeterli olup olmadığını belirlemek için verileri araştırın;
  • Yeni verileri veya periyodik olarak yenilenen verileri puanlamak için bir veri hattı oluşturun.

Veri bilimcisi, verileri kaynak konumdan analiz işleminin yürütülebileceği hedef konuma taşıdıktan sonra, hedef değişkenle ilişkisi tam olarak anlaşılan temiz, yüksek kaliteli bir veri kümesi üretmek için ham verileri işlemeye başlar. Makine öğrenimi modellerini eğitmeden önce, veri bilimcilerin verileri tam olarak anlamaları, veri özetleri ve görselleştirmeler oluşturarak verilerin kalitesini gözden geçirmeleri ve modellemeye hazır olmadan önce verileri işlemek için gereken bilgileri sağlamaları gerekir.

Son olarak, veri bilimcisi, verileri periyodik olarak yenileyen ve puanlayan veri hattı çözümünün mimarisini geliştirmekten de sorumludur.

Otomatik makine öğrenimi yoluyla portakal suyu satışlarını tahmin edin

Veri bilimcileri ve proje yöneticileri, çeşitli nedenlerden dolayı otomatik makine öğrenimini kullanmaya karar verirler: Otomatikleştirilmiş makine öğrenimi, veri bilimi uzmanlığı olan veya olmayan müşterilerin herhangi bir sorun için uçtan uca makine öğrenimi ardışık düzenini belirlemesine olanak tanır ve böylece daha az zaman harcar Aynı zamanda daha yüksek doğruluk elde etmek için. Dahası, çok sayıda deney de çalıştırabilir, böylece üretime hazır akıllı deneyimlerin yinelemesini hızlandırabilir.

Portakal suyu satış tahminleri için otomatik makine öğrenimi kullanma sürecinin bu faydaları nasıl elde edebileceğini görelim.

Veri bilimcisi, iş hedefi ve hedefe ulaşmak için ne tür dahili geçmiş verilerin kullanılması gerektiği konusunda anlaştıktan sonra, bir çalışma alanı oluşturacaktır. Çalışma alanı, hizmet için en iyi kaynaktır ve veri bilimcilerinin oluşturmaları gereken tüm yapıları idare etmeleri için merkezi bir yer sağlar. Azure Machine Learning Service'de bir çalışma alanı oluşturulduğunda, aşağıdaki Azure kaynakları otomatik olarak eklenir (bölgede mevcutsa):

  • Azure kapsayıcı kayıt defteri
  • Azure depolama
  • Azure uygulama içgörüleri
  • Azure Anahtar Kasası

Otomatikleştirilmiş makine öğrenimini çalıştırmak için veri bilimcilerin de bir deney yapması gerekir. Deney, çalışma alanında tahmini bir görevi temsil eden adlandırılmış bir nesnedir Görevin çıktısı, eğitilmiş bir model ve model için bir dizi değerlendirme göstergesidir.

Veri bilimci artık önceki portakal suyu satış verilerini yüklemeye ve CSV dosyasını pandalarda basit bir DataFrame türüne yüklemeye hazır. CSV'deki zaman sütununa WeekStarting adı verilir, bu nedenle tarih ve saat türü olarak özel olarak ayrıştırılacaktır.

DataFrame'deki her satır, belirli bir portakal suyu markasının belirli bir mağazadaki haftalık satış hacmini temsil eder. Veriler ayrıca satış fiyatlarını, portakal suyu markasının her hafta mağazada ilan edilip edilmediğini gösteren bayraklar ve mağaza konumuna göre bazı müşteri demografik bilgilerini içerir. Geçmişe yönelik nedenlerden dolayı veriler, satış hacminin logaritmasını da içerir.

Şu anki görevimiz "miktar" sütunu için bir zaman serisi modeli oluşturmaktır. Bu veri setinin birçok ayrı zaman serisinden oluştuğuna dikkat etmek önemlidir; her bir zaman serisi, mağazaların ve markaların benzersiz bir kombinasyonudur. Her bir zaman serisini ayırt etmek için, değeri zaman serileri arasındaki sınırı belirleyebilen bir sütun olan greni tanımlarız.

Gelecekte tahmin etkisini değerlendirmek için verileri eğitim seti ve test seti olarak ayırıyoruz. Bundan sonra, veri bilimcileri tahmin görevlerini gerçekleştirmek için modellemeye başlar ve otomatik makine öğrenimi, zaman serileri için ön işleme ve tahmin adımlarını kullanır. Otomatik makine öğrenimi, aşağıdaki ön işleme adımlarını gerçekleştirir:

  • Zaman serisi örneklerinin sıklığını kontrol edin (örneğin, saatlik, günlük, haftalık) ve seriyi düzenli hale getirmek için zamanda var olmayan noktalar için yeni kayıtlar oluşturun. Düzenli zaman serilerinin iyi tanımlanmış bir frekansı vardır ve sürekli bir zaman aralığındaki her örnekleme noktasının bir değeri vardır;
  • Hedefteki eksik değerleri ileri-doldurma ve özellik sütununun medyanını kullanarak tahmin edin;
  • Farklı diziler arasında sabit efektler elde etmek için tane tabanlı özellikler oluşturun;
  • Mevsimsel kalıpların öğrenilmesine yardımcı olmak için zamana dayalı özellikler oluşturun;
  • Kategorik değişkenleri dijital nicelikler olarak kodlayın.

Otomatik bir makine öğrenimi eğitim görevi için, AutoMLConfig nesnesi ayarları ve verileri tanımlar. Aşağıda, portakal suyu satış tahmin modelini eğitmek için kullanılan otomatik makine öğrenimi yapılandırma parametrelerinin bir özeti verilmiştir:

Tahmin hakkında daha fazla bilgi almak için GitHub'ı ziyaret edin (aşağıdaki bağlantıya bakın). Her yineleme deneyde çalışır ve doğrulama kümesinde en iyi performansı gösteren ardışık düzeni bulana kadar otomatik makine öğrenimi yinelemelerinden serileştirilmiş işlem hatlarını depolar.

Ekli bağlantı:

https://github.com/Azure/MachineLearningNotebooks/blob/master/how-to-use-azureml/automated-machine-learning/forecasting-orange-juice-sales/auto-ml-forecasting-orange-juice-sales. ipynb? WT.mc_id = azuremedium-blog-lazzeri

Değerlendirme tamamlandıktan sonra, veri bilimcisi, proje yöneticisi ve iş yöneticisi tahmin sonuçlarını kontrol etmek için tekrar bir araya gelir. Proje yöneticilerinin ve işletme yöneticilerinin görevi, çıktıları anlamak ve bu sonuçlara göre gerçek adımları seçmektir. İşletme yöneticilerinin, iş hedeflerini karşılamak için en iyi modeli ve boru hattını onaylamaları gerekir. Buna ek olarak, makine öğrenimi çözümü, dahili satışlar için uygulamaları tahmin ederek, sistemin üretime dağıtılmasıyla ilgili çeşitli soruları kullanım için kabul edilebilir doğrulukla yanıtlar.

Microsoft'un otomatik makine öğrenimine yatırımı

Otomatik makine öğrenimi, Microsoft Araştırma departmanındaki bir gelişmeye dayanmaktadır. Bu yöntem, işbirliğine dayalı filtreleme ve Bayes optimizasyonu fikirlerini birleştirir ve olası makine öğrenimi ardışık düzenlerinin geniş alanını akıllıca ve verimli bir şekilde arayabilir.

Artık Azure Machine Learning Service'in bir parçası olarak kullanımınıza sunulmuştur. Burada görebileceğiniz gibi, veri bilimi uzmanlığı olsun veya olmasın, otomatikleştirilmiş makine öğrenimi, müşterilerin herhangi bir sorunu çözmek ve doğruluğu artırırken zamandan tasarruf etmek için uçtan uca bir makine öğrenimi ardışık düzeni belirlemesini sağlar. Ayrıca çok sayıda deney çalıştırabilir ve yinelemeleri hızlandırabilir. Otomatikleştirilmiş makine öğrenimi kuruluşunuza nasıl fayda sağlayabilir? Ekibiniz, iş hedeflerine ulaşmak için daha yakın işbirliği yapmak için makine öğrenimini nasıl kullanabilir?

Kaynaklar

  • Azure Machine Learning Service hakkında daha fazla bilgi edinin: https://docs.microsoft.com/en-us/azure/machine-learning/service/?WT.mc_id=azuremedium-blog-lazzeri
  • Otomatik makine öğrenimi hakkında daha fazla bilgi edinin: https://docs.microsoft.com/en-us/azure/machine-learning/concept-automated-ml
  • Azure Machine Learning Service'in ücretsiz deneme sürümünü başlatın: https://azure.microsoft.com/en-us/trial/get-started-machine-learning/?WT.mc_id=azuremedium-blog-lazzeri

Yazar hakkında:

Francesca Lazzeri bir makine öğrenimi bilimcisi, yazar ve konuşmacıdır. Microsoft bulut savunucuları, veri bilimcileri ve geliştiricilerinden oluşan uluslararası bir ekibe liderlik ediyor. Microsoft'a katılmadan önce Harvard Üniversitesi Teknoloji ve Operasyon Yönetimi Bölümü'nde araştırmacıydı. Aynı zamanda Microsoft "Women @ NERD" Derneği'nin yönetim kurulu üyesi, MIT ve Columbia Üniversitesi'nde veri bilimi danışmanı ve AI topluluğunun aktif bir üyesidir.

Orjinal başlık:

Otomatik Makine Öğrenimi: Ekipler bir AutoML projesinde birlikte nasıl çalışır?

Orijinal bağlantı:

https://www.kdnuggets.com/2020/01/teams-work-together-automl-project.html

Editör: Huang Jiyan

Çevirmen Profili

Wang Qi, Çin Bilimler Akademisi'nde yüksek lisans öğrencisidir.Araştırma ilgi alanları makine öğrenimi ve veri madenciliğidir. Yeni şeyler keşfetmeyi sever ve öğrenmeyi seven bir kişidir.

-Bitiş-

Tsinghua-Qingdao Veri Bilimi Enstitüsü'nün resmi WeChat kamu platformunu takip edin " THU Veri Pastası "Ve kız kardeş numarası" Veri Pastası THU "Daha fazla ders avantajı ve kaliteli içerik elde edin.

OpenKG, yeni taç virüsü ile ilgili çok sayıda açık bilgi grafiği yayınladı (bağlantılar)
önceki
Makine öğreniminde sınıflandırma modellerinin etkisini ölçmek için tıbbi yanlış negatifler nasıl kullanılır (ekli kod)
Sonraki
11 tür AI öğrenme çerçevesi ve platformu dahil olmak üzere 2020'de en fazla potansiyele sahip 44 en iyi açık kaynaklı proje
Savaş Salgını | Tsinghua Üniversitesi 2018, Lider İnovasyon Mühendisliği alanında doktora öğrencisi iş başında
Guan Xiaotong, Zheng Shuang, Yu Haoming ve babası bu hafta okula dönüş "Ace vs. Ace" için bir sınıf toplantısı düzenlediler.
"Yatak bekleyen hastalardan" "hasta bekleyen yataklara" kadar, iyi haber heyecan verici Warriors in White Anti-salgın Günlüğü
İlk yeni taç rehabilitasyon kliniği listelenecek! Wuhanın TCM tedavisine katılımının yaklaşık% 90'ı
Kahraman
Köy komitesini "yıktılar"
"Wuhan'da bir kişi olarak, salgın bitene kadar hareket edebildiğin sürece evde oturamaz ve gönüllü olarak kalamazsın" | Ben bir gönüllüyüm
Beyaz Çin Seddi: 2020'nin en kahramanca ve hareketli ayna görüntüsü
Yeni koronavirüs söylentileri her yerde, salgın karşısında dikkatsiz olmayın
Makao'daki "China Temperature" İtfaiyeciler: Görevlerine saygı duyun ve ellerinden gelenin en iyisini yapın
Hookup +Yeni Yıl, Xi Jinping'in Yeni Yıl selamları iç açıcı
To Top