Yapay zeka ve Endüstri 4.0 arasındaki uçurum ne kadar?

Bu makale, AI Araştırma Enstitüsü tarafından derlenen, orijinal başlığı olan teknik bir blogdur:

Yapay zeka ve Endüstri 4.0 arasındaki gerçeklik boşluğunu genişletmek

Yazar | Philip Montsho

Tercüme | ciky, Ophria

Düzeltme | Demps Jeff İncelemesi | Yeni Günlük Bitirme Olarak Ebedi | Ananas Kız

Orijinal bağlantı:

https://medium.com/@p.k.montsho/a-summary-of-industry-ready-state-of-the-art-computer-vision-techniques-a7f2b893de2f

Sektördeki en gelişmiş bilgisayarla görme teknolojisinin özeti

Bugün yapay zekanın endüstriyel alanda patlama eğilimi var çünkü otomasyon ve optimizasyon hala dijital devrimin ana odak noktası. Bu yazıda, son yıllarda AI topluluğundaki en heyecan verici ve gelişmiş bilgisayarla görme teknolojilerini gözden geçireceğiz.Bu teknolojiler endüstriye hazır olarak kabul edilir ve endüstriyel kullanım durumları üzerinde önemli ve pratik bir etkiye sahiptir. Bu teknolojilerden bazıları, performansı inanılmaz derecede artırarak, insanların elde edebileceği performans düzeyini ve böylece çoğu endüstrinin beklediği doğruluk ve güvenilirlik standartlarını aştı. Temel bilgisayarla görme görevlerinde (görüntü sınıflandırma gibi) sağlanan inanılmaz ilerleme, daha önce endüstriyel bir ortamda hiç keşfedilmemiş yeni kullanım durumlarını gerçekleştirmek için yeni bileşik teknolojiler oluşturmak için birden fazla teknolojiyi güvenilir bir şekilde birleştirmeyi mümkün kılmıştır. Bununla birlikte, bu yeni teknolojiler, sonuçlarının, yalnızca çok yoğun donanıma ayrılmış sistemlerle elde edilebilen hassasiyet ve güvenilirlik sonuçlarıyla karşılaştırılabilir olduğunu kanıtladı. Bu özel sistemlerin uygulanmasında ve bunlarla ilişkili donanımın kurulmasında pratik zorluklar ve sınırlamalar olsa da, kameralar kolaylıkla temin edilebilir ve bu da kullanım durumlarının kapsamını büyük ölçüde genişletir. Yapay zeka destekli bilgisayar görme sistemi, Endüstri 4.0 sürecini, gerçek dijitalleşmeyi ve fiziksel gerçeklik artırmayı hızlandırarak yeni bir alana girmeyi mümkün kılar.

Bilgisayarla görme alanındaki en son gelişmelere dalmadan önce, derin öğrenme ve bilgisayarla görme alanındaki bazı temel kavramları ve tarihsel olayları tanıtalım.

Bilgisayarla Görmeye Giriş

Bilgisayar görüşü, bilgisayarların grafikleri ve videoları anlamasını ve bunlardan içgörüler elde etmesini sağlamak için tasarlanmış bir bilimdir. Bilgisayar görüşü, grafiklerden veya videolardan yararlı bilgileri ayıklama ve analiz etme gibi görsel görevleri otomatik olarak gerçekleştirme yeteneğidir.

Makine öğrenimi ve derin öğrenmeye giriş

Makine öğrenimi, algoritmaların ve istatistiksel modellerin bilimsel araştırmasıdır. Karar vermek için kural tabanlı yöntemler yerine veriye dayalı yöntemlere dayanır. Büyük miktarda yüksek kaliteli veri ve iyileştirilmiş algoritmalar göz önüne alındığında, makine öğrenimi sistemleri belirli görevlerdeki performanslarını kademeli olarak artırabilir. Derin öğrenme, tamamen bir ağ olarak tanımlanabilecek bir dizi matematiksel algoritmaya odaklanan bir makine öğrenimi alt kategorisidir. Başlangıçta insan beyninde bulunan biyolojik sinir ağlarından esinlenmişlerdi Benzer şekilde, yapay sinir ağları milyonlarca yapay sinapslara sahip ve matematiksel olarak milyonlarca basit doğrusal cebirsel denklemle temsil ediliyor.

Derin öğrenme bilgisayar görüşünü yönlendirir

Derin öğrenme sinir ağları, 2012'den beri iyi bir sebepten dolayı bilgisayar vizyonunun ana odak noktası olmuştur. Derin öğrenme ile yönlendirilen bilgisayarlı görme sistemlerinin avantajları, daha doğru, daha esnek olmaları ve ışık koşulları, bakış açıları, ölçekler, yönler ve arka plan füzyonu, sınıf içi farklılıklar, deformasyon ve görsel kapanmadaki çok sayıda değişikliğe yanıt verebilmeleridir. Daha yüksek tolerans. Ama en önemlisi, yeni kullanım durumlarına ilham veriyorlar.

İlk bilgisayar görüşü modelleri, makine öğrenimi modelleri için girdi olarak ham piksel verilerine dayanıyordu. Ancak, tek başına ham piksel verileri görüntüde sürekli değişen nesneleri içermek için yeterli değildir.

Derin öğrenmeye dayalı bilgisayar görüşü, eğitim aşaması sırasında göreve özgü özellikleri otomatik olarak ayıklayıp oluşturabilen ve ardından bunları bilgisayarla görme görevlerini gerçekleştirmek için kullanabilen derin sinir ağlarına dayanır.

Aşağıdaki şekil, yaklaşık 6 yıllık derin öğrenme ve bilgisayarla görme tarihindeki en önemli olaylardan bazılarını vurgulamaktadır.

  • 2012'de derin sinir ağlarının getirilmesinin getirdiği atılım, görüntü sınıflandırma hatasını yaklaşık% 10 azalttı (2011'de% 25,8'den 2012'de% 16,4'e).

  • 2015 yılında, görüntü sınıflandırmada en gelişmiş algoritmanın performansı,% 3,57 doğruluk oranıyla insan düzeyini (% 5,1, Russakovsky ve ark.) Aştı.

  • Genel olarak, derin sinir ağlarının tanıtımı, görüntü sınıflandırma hatasında 10 kat azalma ile sonuçlandı (2011'de% 25,8'den 2017'de% 2,3'e).

  • Yukarıdaki sonuçların, 20.000 kategorinin yüzlerce düşük çözünürlüklü 469x387 piksel görüntüden oluşan "balon" veya "çilek" gibi tipik kategorilere sahip olduğu ImageNet veri setinde elde edildiğini belirtmek gerekir. Bir bilgisayar görme sistemi, daha az kategori, daha az değişiklik ve daha fazla sayıda daha yüksek çözünürlüklü görüntü içeren belirli bir göreve uygulandığında, doğruluğu% 99,9'a kadar çıkabilir. Bu, bir sistemi tamamen bağımsız ve güvenle çalıştırmayı mümkün kılar.

    Artık temelleri tanıttığımıza göre, bu teknolojileri daha ayrıntılı olarak anlayabiliriz.

    Görüntü sınıflandırması

    Bu bölümde, bir dizi sabit kategoriden bir görüntüye bir etiket atama görevi olan görüntü sınıflandırmasını tanıtacağız. Bu, bilgisayarla görmedeki temel sorunlardan biridir ve basitliğine rağmen çeşitli pratik uygulamaları vardır. Görünüşte farklı olan diğer pek çok bilgisayar görüşü görevi (resim yazısı, nesne algılama, anahtar nokta algılama ve bölümleme gibi) görüntü sınıflandırması olarak basitleştirilebilir ve diğer görevler yeni bir sinir ağı mimarisi kullanır. Aşağıdaki video klip, çok basit bir sınıflandırma örneğini göstermektedir.

    Evrişimli Sinir Ağı kullanarak Basit Görüntü Sınıflandırma (Venkatesh Tata Aralık 2017)

    Görsel anahtar sözcükler ve altyazılar

    Bu teknoloji, yapay zekanın en ilginç iki alanı olan bilgisayar görüşü ve doğal dil işleme (NLP) 'nin kesişme noktasındadır. Anahtar sözcükler, fotoğraf veya görüntü öğelerini tanımlamak için kullanılan sözcüklerdir. Anahtar kelimeler, fotoğraflara açıklayıcı terimler ekleme sürecidir.

    Resim yazısı, resimdeki nesnelere ve eylemlere dayalı olarak resimlerden veya videolardan metin açıklamaları oluşturma sürecini ifade eder. Bunun bir örneği aşağıdaki şekilde görülebilir.

    Derin Pekiştirmeli Öğrenmeye dayalı Resim Altyazıları (Shi ve diğerleri, Ağu 2018)

    Hedef Tespiti

    Nesne algılama, görüntüler veya videolardaki nesneleri tanımlamak ve konumlandırmak için kullanılan bir bilgisayar görüşü teknolojisidir. Bu genellikle nesneyi kenarlıkla işaretlenmiş bir çerçeve içine alarak yapılır. Nesne algılama, kendi kendine giden arabaların arkasındaki anahtar teknolojidir ve diğer arabaları tanımalarını veya yayaları lamba direklerinden ayırt etmelerini sağlar. Ayrıca endüstriyel inceleme ve robot görüşü gibi çeşitli uygulamalarda da kullanılabilir. ImageNet rekabeti nedeniyle, konumlandırma hatası (% 42,5'ten% 25,3'e) yalnızca 2010'dan 2014'e 1,7 kat azaldı. Aşağıdaki video klip, otonom sürüş görüş sistemiyle ilgili olarak şehirde bulunan arabaları, insanları ve diğer yaygın nesneleri tespit etmek için kullanılan bu teknolojinin gerçek zamanlı uygulama sonuçlarını göstermektedir.

    YOLO v3: Artımlı Bir İyileştirme (Redmon ve diğerleri, Nisan 2018)

    Anahtar nokta tespiti ve tutum tahmini

    Anahtar noktalar, görüntünün ilginç veya önemli kısımlarının özellikleri olarak kabul edilir. Görüntüdeki ilginç veya öne çıkan içeriği tanımlayan, görüntüdeki uzamsal konumlar veya noktalardır. Kilit nokta özeldir çünkü değiştirilmiş görüntüde, görüntüdeki görüntünün veya nesnenin döneceği, küçüleceği / genişleyeceği veya deforme olacağı aynı kilit noktayı izlemeyi mümkün kılar.

    Poz tahmini, bilgisayar görüşünde yaygın bir sorundur ve amacı, bir nesnenin konumunu ve yönünü tespit etmektir. Bu genellikle nesnenin kilit nokta konumunu tespit etmek anlamına gelir. Bu teknik, nesnenin kilit noktalarının konumunu tanımlayan çok doğru bir 2D / 3D model oluşturmak için kullanılabilir ve ardından dijital bir ikiz oluşturmak için kullanılabilir.

    Örneğin poz tahmin probleminde, ortak kare ev nesnelerinin köşe noktaları tespit edilebilir, böylece nesnenin ortamdaki üç boyutlu konumu derinlemesine anlaşılabilir.

    Hanehalkı Nesnelerini Anlamsal Robotik Kavrayış için Derin Nesne Duruşu Tahmini (Trembley ve diğerleri, Eylül 2018)

    Aynı yöntem insan duruşunu tespit etmek için de kullanılabilir ve insan vücudundaki omuzlar, dirsekler, eller, dizler ve ayaklar gibi kilit noktalar tespit edilir.

    OpenPose: Parça Benzeşme Alanlarını Kullanarak Gerçek Zamanlı Çok Kişili 2D Poz Tahmini (Cao ve diğerleri 18 Aralık 2018)

    Anlamsal bölümleme

    Bir sonraki teknik, bilgisayarla görme alanındaki temel bir sorunu çözen anlamsal bölümleme (nesne maskeleme olarak da adlandırılır) olarak adlandırılır: görüntülerdeki nesneleri görsel olarak ayırmak. Büyük görüntüler perspektifinden bakıldığında, anlamsal bölümleme, sahnenin tam olarak anlaşılmasının yolunu açar. Bu çok kullanışlıdır çünkü bilgisayarın farklı nesnelerin sınırlarını doğru bir şekilde tanımlamasını sağlar. Sahne anlayışı, bilgisayar vizyonunun temel bir problemidir ve önemi, giderek daha fazla uygulamayı daha sağlam hale getiren anlamsal bölümlemeden elde edilen bilgide yatmaktadır. Aşağıda gösterilen kendi kendine giden araba örneğinde, aracın yolların ve diğer nesnelerin doğru konumunu tanımasına yardımcı olur.

    Derin Öğrenmenin Anlamsal Segmentasyonu (George Seif, Eylül 2018)

    Aşağıda belirtilen teknolojiler, görüntüden görüntüye dönüştürme kategorisine aittir. Aşağıdaki teknolojiler için ağ, içgörüler çıkarmak veya sonuç çıkarmak yerine kaliteyi artırarak görüntüleri ve videoları geliştirir.

    Süper çözünürlük:

    Bu görevin amacı, görüntünün çözünürlüğünü artırırken aynı zamanda ayrıntı düzeyini de artırmaktır. Çok derin bir sinir ağı, son zamanlarda görüntü süper çözünürlüğünde büyük başarı elde etti. Büyütme, aşağıdaki şekilde gösterildiği gibi 2x büyütmeye uygulanabilir.

    Yoğun süper çözünürlüklü görüntü tutma ağı (Zhang ve diğerleri, Mart 2018)

    Gece görüşü

    Düşük ışıkta görüntüleme bir zorluktur. Kısa pozlama görüntüleri parazite neden olur ve uzun pozlama süreleri hareket bulanıklığına neden olur. İkincisi, özellikle elde tutulan fotoğrafçılık için genellikle pratik değildir. Çeşitli gürültü azaltma, çapak giderme ve geliştirme teknikleri önerilmiştir, ancak etkileri gece yüksek hızlı fotoğrafçılık gibi aşırı koşullar altında sınırlıdır. Mevcut standartları iyileştirmek için araştırmacılar, derin ağların uçtan uca eğitimine dayanan düşük ışıklı bir görüntü işleme teknolojisi geliştirdiler. Ağ, birçok geleneksel görüntü işleme tekniğinin yerine doğrudan ham sensör verilerini kullanır. Bu, aşağıdaki resimde açıkça görülebilmektedir, karanlık gürültü görüntüsü önemli ölçüde iyileştirilmiştir.

    Karanlıkta görmeyi öğrenin (Chen ve diğerleri, Mayıs 2018)

    Süper SloMo

    Video enterpolasyonu, iki ardışık çerçeve arasında ara çerçeveler oluşturmayı amaçlar. Yapay olarak üretilen bu görüntüler, orijinal görüntülerden ayırt edilemez görsel özelliklere sahiptir. Bu teknoloji, bir kamera sisteminin performansını artırmanın ideal bir yoludur. Birden fazla veri seti üzerindeki deneysel sonuçlar, derin öğrenme yöntemlerinin mevcut yöntemlerden daha iyi tutarlılığa sahip olduğunu göstermektedir. Bu tekniğin sonucu aşağıdaki video klipte görülebilir ve yumuşak bir ağır çekim video oluşturmak için orijinal kareler arasına 7 ara kare ekleyerek.

    Super SloMo: Video enterpolasyonunda çoklu ara karelerin yüksek kaliteli tahmini (Jiang ve diğerleri, Temmuz 2018)

    Bu yazıda, son aylarda geliştirilen derin öğrenme ile desteklenen ve inanılmaz sonuçlar gösteren ve sektörde uygulanmaya hazır birçok bilgisayarla görme teknolojisini inceledik. Bu teknolojiler, teknolojinin ön saflarında yer alır ve hızı, doğruluğu, güvenilirliği ve esnekliği geliştirerek, önceki teknolojilerden önemli ölçüde daha iyi olduklarını göstermiştir.

    İnovasyonun temel itici gücü, son yıllarda yapay zeka araştırma makalelerinin sayısındaki artış, özellikle bilgisayar görüşü alanında, endüstriyel operasyonlardaki en son trendleri iyileştirmek için teknolojik gelişmelerden tam olarak yararlanmayı daha önemli hale getiriyor.

    Okuduğunuz için teşekkürler! Umarım, endüstride pratik uygulamalar için hazır olan en gelişmiş bilgisayarla görme teknolojileri hakkında bazı yeni ve faydalı şeyler öğrendiniz.

    Daha fazlasını öğrenmek istiyorsanız, lütfen bu yazı için alkışlayın ve beni takip edin.

    Üretim ortamınızla ilgili bir kullanım senaryosunu tartışmak isterseniz, lütfen doğrudan philip@beamberlin.com adresinden benimle iletişime geçin.

    Bu makalenin ilgili bağlantılarını ve referanslarını görüntülemeye devam etmek ister misiniz?

    Açmak için bağlantıya uzun basın veya [AI ile Industry 4.0 arasındaki boşluk ne kadar? :

    https://ai.yanxishe.com/page/TextTranslation/1410

    AI Araştırma Enstitüsü heyecan verici içerikleri günlük olarak güncelliyor ve daha heyecan verici içerikler izliyor: Lei Feng Wang Lei Feng Wang Lei Feng Wang

    Görüntü sınıflandırması için ipuçları envanteri

    Dinamik Programlama: Binom Dizisi

    LSTM modeli oluşturmak ve parametreleri ayarlamak için Keras nasıl kullanılır

    Bir makale, PyTorch ile daha hızlı RCNN'yi nasıl oluşturacağınızı öğretiyor

    Çevirmeni bekliyorum:

    Nöral NLP işlemede anlamsal yapıdan nasıl bahsedilir

    Uyuyor musun? Neden kalkıp uykunuzu kategorilere ayırmıyorsunuz?

    Gelişmiş DQN'ler: Pac-Man oyunlarını oynamak için derin takviyeli öğrenmeyi kullanın

    Kapsamlı pekiştirmeli öğrenmede yeni eğilimler: Google, pekiştirmeli öğrenim aracılarına merakı nasıl katıyor

    Düğün ayakkabıları ilk tercih mi? 600 Dual -Limited Adidas NMD_R2 "" Yüksek tanımlama ayrıntılarını not etmeyin!
    önceki
    En hızlı yerli! Xiaomi MIX 2S, Android P'nin resmi sürümünü ilk güncelleyen
    Sonraki
    Bu gerçek doktor!
    Samsung'un katlanır ekranlı cep telefonu Galaxy Fold ön kayıt için resmi olarak mevcut
    Deliksiz ve düğmesiz ilk cep telefonu! Meizu Zero resmen yayınlandı
    Hikaye hala o hikaye, ama neden artık "Meteor Bahçesi" nden hoşlanmıyoruz?
    Takahashi Shield cüzdanınızı bırakmaz! UNDERCOVER 2017 sonbahar ve kış serilerine yeni ürünler ekliyor!
    Betta balık çapası olmayı bırakmak mı? Zhang Daxian sonunda iyi haberi duyurdu ve şirkete kıdemli olarak katıldı.
    Vivo Ant Financial, stratejik bir işbirliği anlaşmasının imzalandığını duyurdu: yüz ödemesi geliyor
    Yuan Zhenguo: Üniversite sıralaması ciddi, bilim dışı ve güvenilmez değil
    "Kötülük Doğruluğu Bastırmaz" ı izlemeden önce bunu bilmelisiniz!
    Kış geliyor, Cav Empt 2017 sonbahar ve kış yeni çalışmaları bu hafta yayınlandı
    2022'de, çok sayıda sıradan lisans kolejleri ve üniversiteleri uygulama odaklı hale gelecektir.
    Letme Üniversitesi ders veriyor, hayranların ondan imparator olmasını istemelerine izin verilmiyor, bu başlık çok fazla baskı mı getiriyor?
    To Top