Xin Zhiyuan bugün
Xinzhiyuan Raporu
Kaynak: Google AI
Derleyici: Xiao Qin
Xin Zhiyuan Rehberi Bugün, Google AI bir kez daha büyük bir hamle yayınlayarak makine öğrenimi uygulamasına odaklanan bir "etkileşimli kurs" başlattı. İlki, görüntü sınıflandırma, makine öğrenimi uygulamasıdır. 10.000'den fazla Google çalışanı, kendi görüntü sınıflandırıcılarını oluşturmak için bu eğiticiyi kullandı. . İçerik özlü ve kullanımı kolay, bu yüzden deneyin.
Adres: https://developers.google.com/machine-learning/practica/
Birkaç ay önce, Google AI eğitim projesi, daha fazla geliştiricinin makine öğrenimini öğrenmesine ve kullanmasına yardımcı olmak için dahili makine öğrenimi hızlandırılmış kursunu (MLCC) herkese ücretsiz olarak açan büyük bir fayda sağladı.
Bugün, Google AI bir kez daha büyük bir hamle yayınlayarak " Etkileşimli ders ". İlk halka açık kurs, Google AI ekibi ve görüntü modeli uzmanları tarafından geliştirilen görüntü sınıflandırma makine öğrenimi uygulamasıdır.
Bu uygulamalı kurs, Google'ın en gelişmiş resim sınıflandırma modelinin nasıl geliştirildiğini adım adım açıklayan videolar, dokümanlar ve etkileşimli programlama alıştırmaları içerir. Bu görsel sınıflandırma modeli, Google Foto'nun arama işlevinde uygulanmıştır . Şimdiye kadar, 10.000 kişi Google çalışanları, resim sınıflandırıcılarını fotoğraflardaki kedileri ve köpekleri tanımak üzere eğitmek için bu pratik kılavuzu kullanıyor.
Bu etkileşimli kursta, önce görüntü sınıflandırmanın nasıl çalıştığını anlayacak, Evrişimli Sinir Ağı Yapı taşları. O zaman yapacaksın Sıfırdan bir CNN oluşturun , Aşırı takmanın nasıl önleneceğini anlayın ve özellik çıkarma ve ince ayar için önceden eğitilmiş modelleri kullanın.
Bu kursta, Google Foto'da arama yapmak için kullanılan Google'ın son teknoloji görsel sınıflandırma modelinin nasıl geliştirildiğini anlayacaksınız. Bu, Evrişimli Sinir Ağları (CNN) üzerine hızlandırılmış bir kurstur. Öğrenme sürecinde, Kedi fotoğrafları ile köpek fotoğrafları arasında ayrım yapmak için bir görüntü sınıflandırıcı oluşturacaksınız. .
Tahmini tamamlanma süresi: 90 ~ 120 dakika
Önkoşullar
Mayıs 2013'te Google, kişisel fotoğrafları aramak için bir işlev yayınladı. Kullanıcılar, fotoğraflardaki nesnelere göre ilgili fotoğrafları kendi albümlerinde alabilirler.
Albümde Siyam kedisi içeren fotoğraflar arayın
Bu özellik daha sonra 2015 yılında Google Foto'da görüldü ve yaygın olarak yıkıcı bir etkiye sahip olduğu kabul edildi. Bu, bilgisayarla görme yazılımının görüntüleri insan standartlarına göre sınıflandırabildiğini kanıtlar ve değeri şunları içerir:
Kullanıcıların artık fotoğrafların içeriğini "plaj" gibi etiketlerle manuel olarak sınıflandırmasına gerek yok Yönetilecek binlerce resim olduğunda bu görev çok külfetli hale geliyor.
Kullanıcılar, hiç etiketlememiş olabilecekleri nesnelerin fotoğraflarını bulmak için arama terimlerini kullanarak fotoğraf albümlerini yeni yöntemlerle keşfedebilirler. Örneğin, "palmiye ağaçları" arayabilir ve tüm tatil fotoğraflarını arka planda palmiye ağaçlarıyla bir araya getirebilirler.
Yazılım, kullanıcının algılayamayacağı sınıflandırma farklılıklarını "görebilir" (örneğin, Siyam ve Habeş kedileri arasında ayrım yaparak), bu da kullanıcının uzmanlığını etkili bir şekilde artırabilir.
Görüntü sınıflandırması nasıl çalışır?
Görüntü sınıflandırması bir Denetimli öğrenme problemi : Bir hedef sınıf kümesi (yani görüntüde tanınması gereken nesneler) tanımlayın ve hedefi tanıması için bir model eğitmek için etiketli örnek fotoğrafları kullanın. İlk bilgisayar görüşü modelleri, modele girdi olarak ham piksel verilerine dayanıyordu.
Ancak, aşağıdaki şekilde gösterildiği gibi, yalnızca orijinal piksel verileri, görüntüde yakalanan sayısız nesnenin ince değişikliklerini içerecek kadar kararlı bir temsil sağlamaz. Nesnenin konumu, nesnenin arkasındaki arka plan, çevreleyen ışık, kameranın açısı ve kameranın odağı orijinal piksel verilerinde dalgalanabilir; bu farklılıklar çok önemlidir ve piksel RGB değerlerinin ağırlıklı ortalaması ile düzeltilemezler.
Solda: Farklı duruşlara, farklı arka planlara ve ışık koşullarına sahip fotoğraflarda kediler tanımlanabilir; Sağ: Bu değişikliği açıklamak için ortalama piksel verilerini kullanmak üretemez
Nesneleri daha esnek bir şekilde modellemek için, klasik bilgisayar görme modelleri, renk histogramları, dokular ve şekiller gibi piksel verilerinden yeni özellikler ekler. Ancak bu yöntemin dezavantajı, özellik mühendisliğini bir yük haline getirmesidir çünkü ayarlanacak çok fazla girdi vardır. Örneğin, bir kedi sınıflandırıcı için en önemli renk hangisidir? Şekil tanımı ne kadar esnek olmalı? Özelliklerin çok hassas bir şekilde ayarlanması gerektiğinden, kararlı bir model oluşturmak çok zordur ve modelin doğruluğu da etkilenecektir.
Evrişimli Sinir Ağı
Görüntü sınıflandırma modelleri oluşturmadaki bir atılım, evrişimli sinir ağlarının (CNN) görüntü içeriğinin daha yüksek seviyeli temsillerini kademeli olarak çıkarmak için kullanılabileceğinin keşfidir. CNN, doku ve şekil gibi özellikler elde etmek için verileri önceden işlemez, ancak Görüntünün ham piksel verilerini girdi olarak alın ve bu özelliklerin nasıl çıkarılacağını "öğrenin" Ve nihayet ne oluşturduklarını anlayın.
İlk olarak, CNN bir girdi özelliği haritası alır: üç boyutlu bir matris, burada ilk iki boyutun boyutu piksel görüntünün uzunluğuna ve genişliğine karşılık gelir. Üçüncü boyutun boyutu 3'tür (renkli görüntünün 3 kanalına karşılık gelir: kırmızı, yeşil ve mavi). CNN, her biri üç işlem gerçekleştiren birçok modül içerir.
CNN bölümü daha sonra sırasıyla evrişim, ReLU, Havuzlama ve tamamen bağlı katmanları açıklayacaktır. Sonraki iki bölüm, "Aşırı Takmayı Önleme" ve "Önceden Eğitilmiş Modelleri Kullanma" ve üç alıştırma sağlar:
Bu alıştırmada, evrişimli bir sinir ağı oluşturma konusunda uygulamalı deneyim kazanacak ve kedilerin fotoğraflarını köpeklerin fotoğraflarından ayırmak için sıfırdan bir görüntü sınıflandırıcı oluşturacaksınız.
Bu alıştırmada, veri artırma ve bırakma düzenlemesini kullanarak 1. Alıştırmada oluşturulan kedi ve köpek sınıflandırması CNN modelini daha da geliştireceksiniz.
Bu alıştırmada, kedi ve köpek sınıflandırma modelinizi daha doğru hale getirmek için Google'ın ilk Inception v3 modelinde özellik çıkarma ve ince ayar yapacaksınız.
Topluluğa katıl
Xinzhiyuan AI teknolojisi + endüstri topluluğunun işe alımında, AI teknolojisi + endüstrisiyle ilgilenen öğrenciler küçük bir WeChat asistanı hesabı ekleyebilirler: aiera2015_3 Gruba katılın; incelemeyi geçtikten sonra sizi gruba katılmaya davet edeceğiz. Topluluğa katıldıktan sonra, grup açıklamalarını değiştirmeniz gerekir (isim-şirket-pozisyon; profesyonel grup incelemesi katıdır, lütfen anlayın).