Görüntü işleme için evrişimli sinir ağı kullanılmalı mı? İşte farklı bir yol

Son yıllarda, Convolutional Neural Network (CNN), özellikle büyük ölçekli görüntü işlemede yerel ağırlıkları paylaşan özel yapısı ile konuşma tanıma ve görüntü işlemede hızla gelişerek, giderek sektör lideri haline geldi. Önemli teknoloji seçenekleri.

Bununla birlikte, kullanımı kolay, her şeye kadir olmak anlamına gelmez. Burada Leifeng.com, uydu görüntüsü analizinin belirli bir örneğinden yola çıkıyor ve CNN modellemesi ile yerel Laplacian filtrelemesinin etkilerinin karşılaştırmasını sunuyor.Sonunda, yerel Laplacian filtrelemesinin etkisinin daha iyi olduğunu gördük.

Evrişimli Sinir Ağı

Uydu görüntülerinden bir doğal afetin neden olduğu kayıpları analiz etmek ve değerlendirmek için, öncelikle sonraki tüm analizler için veri temeli olan ilgili coğrafi alanın gerçek zamanlı yüksek çözünürlüklü uydu görüntülerinin elde edilmesi gerekmektedir. Şu anda, Google Earth'e ek olarak, en uygun ve ekonomik veri kaynağı OSM (OpenStreetMap) açık kaynak harita projesidir. Program 2004 yılında Amerika Birleşik Devletleri'nde kuruldu ve Wikipedia'ya benziyor ve dünyanın dört bir yanındaki kullanıcıları coğrafi konum verilerini özgürce ve engelsiz olarak paylaşmaya ve kullanmaya teşvik ediyor.

OSM, vektör verileri sağladığından, uzamsal analizi ve yüzey simülasyonunu kolaylaştırmak için, GDAL (Geospatial Data Abstraction Library) kütüphanesindeki gdal_rasterize aracını raster verilere dönüştürmek için kullanmak gerekir.

Lei Feng Net Not: Hem vektör verileri hem de tarama verileri, coğrafi bilgi sistemlerinde (GIS) ortak analiz modelleridir. Izgara yapısı, uzamsal özelliklerin veya fenomenlerin düzenli bir dizideki dağılımını temsil eden bir veri organizasyonudur ve organizasyondaki her veri, özelliklerin veya fenomenlerin geometrik olmayan nitelik özelliklerini temsil eder. Karakteristik, özellik performansının açık olmasıdır, bu da uzamsal analiz ve yüzey simülasyonu için uygundur, ancak konumlandırma bilgisi örtüktür. Vektör veri yapısı, koordinatları kaydederek noktalar, çizgiler ve çokgenler gibi coğrafi varlıkları olabildiğince doğru bir şekilde temsil etmektir. Koordinat alanı, keyfi konumların, uzunlukların ve alanların kesin tanımlarına izin verecek şekilde sürekli olacak şekilde ayarlanır. Karakteristik, konumlandırma bilgilerinin açık, ancak öznitelik bilgilerinin örtük olmasıdır.

Tarama verilerini aldıktan sonra, sonraki adım, sistemi eğitmek için Caffe açık kaynak çerçevesini ve CNN modelini kullanmaktır. Şekilde, CNN modelinin bir parametre ayarı gösterilmektedir.

CNN modelinin bir parametre ayarı

Büyük miktarda veriyle eğitilen evrişimli sinir ağı modeli, afet sonrası görüntüleri işlemek için kullanılır ve tanımlanan afetten etkilenen evler şekilde gösterilir (Şekildeki beyaz renkli bloklar, daha sonra Laplacian filtrelemesinin işleme sonuçlarıyla karşılaştırılabilecek evleri temsil eder).

CNN analiz sonuçları, soldaki resim afet öncesi görüntü, sağdaki resim ise afet sonrası görüntü

Laplacian filtresi

Diğer yol ise GDAL dönüşümünü geçmek ve Labrador filtresini kullanarak vektör verilerine dayanarak doğrudan analiz yapmaktır.

Spesifik yöntem, felaketten önceki ve sonraki iki görüntüyü karşılaştırmak, evdeki değişiklikleri ve iki görüntünün örtüşmesini, felaketin boyutunu değerlendirmek için belirlemektir. Bu örnekte karşılaştırma eşiği% 10 olarak ayarlanmıştır, yani afet sonrası görüntüde bir evin alanı afet öncesi alanın% 10'undan daha az ise evin hasar gördüğü tespit edilmiştir.

Burada iki önemli filtre kullanıldığına dikkat edilmelidir. Bunlardan biri, görüntüdeki tüm belirgin düzensiz kısımları (burada, tüm evin ana hatları) tanımlamak ve ardından bunları işaretlemek ve çizmek için kullanılan Laplacian filtrelemesidir. Diğeri ise% 10'a ayarlanmış, yani afet öncesi ve sonrası görüntüleri karşılaştıran ve etkilenen evleri% 10 eşiğine göre filtreleyen gürültü filtresidir.

CNN yöntemiyle karşılaştırıldığında burada sorunun kendine özgü bir özelliği kullanılmıştır, yani ev her zaman zeminden yüksektedir ve poligonal kareler kullanılarak ana hat açıkça işaretlenebilir.

Laplacian filtre modeli

Resim, Matlab tarafından modellenen yerel Laplacian filtre penceresini göstermektedir. "İmg" değişkeni, 4 kanal içeren orijinal görüntüdür. RGB'ye ek olarak, üç ana renk kanalına ek olarak, her birini belirtmek için ek bir Alfa kanalı vardır. Her pikselin gri tonlamalı bilgileri. "İmg1" değişkeni, alfa kanalının filtrelenmesi dışında "img" ile tamamen aynı görüntüdür.

Laplace filtreleme sonucu, kırmızı renk bloğu evdir

OpenCV filtre modeli

Şekilde gösterildiği gibi, OpenCV açık kaynak bilgisayar görüntü kitaplığı kullanılarak uygulanan ikinci filtre ve filtreleme sonuçları, felaketten etkilenen evlerin açıkça filtrelendiğini görebilirsiniz (CNN'e göre).

OpenCV filtreleme sonuçları

İki filtrenin etkisi şekilde gösterilmiştir.

İki filtrenin birleşik etkisi

Sonucu çıkarmadan önce, bu andaki filtreleme sonuçları ile afet öncesi görüntü arasında son bir karşılaştırma yapmak ve önceki hesaplamalarda ortaya çıkan hatalardan kaçınmak için nihai afetten etkilenen ev durumunu belirlemek için% 14'lük bir alan eşiği kullanmak gerekir.

% 14 alan eşiği değerlendirmesi

Şekilde gösterildiği gibi, sarı, Laplace filtrelemesinin sonucudur ve yeşil, afet öncesi görüntüdür.

Afet öncesi OSM veri tabanı yardımıyla hasarlı evler tespit edildikten sonra, hasarlı her evin adres listesi bilgileri de QGIS aracı ile kolaylıkla dışa aktarılabilmektedir. Spesifik adımlar şunlardır: önce afet öncesi OSM verilerini QGIS platformunun en düşük seviyeli bilgisine içe aktarın, ardından önceki analiz sonuçlarını içe aktarın, karşılaştırma yoluyla hasarlı evin belirli konumunu elde edin ve ardından XML formatında bir topolojik yapı açıklama dosyasını içe aktarın ve ardından SpatiaLite veritabanını kullanın Yönetim platformu, gerektiğinde belirli evlere ve adreslere karşılık gelen bir bilgi listesini dışa aktarabilir.

QGIS ve SpatiaLite kullanarak adres listesini dışa aktarın

Son karşılaştırma, çekirdek olarak CNN teknolojisine sahip felakete uğramış evlerin tanınma doğruluğunun yalnızca% 78 olduğunu, Labrador filtresinin ise% 96,3 kadar yüksek olduğunu buldu. Buna ek olarak, Labrador filtrelemesinin bu avantajı afet öncesi binaların tanınmasında da sürdürülmüştür Normal binaların tanınma doğruluğu CNN için sadece% 93 iken,% 97.9 kadar yüksektir. Buradaki sonuç açıktır: Düzlük tanımaya dayalı Laplacian filtrelemesinin nihai etkisi, büyük veri eğitimine dayalı CNN evrişimli sinir ağından daha iyidir.

Yukarıda bahsedilen Laplacian filtreleme yönteminin öneminin teknik olarak gerçekleştirilmesiyle sınırlı olmadığı belirtilmelidir.Özel sorunlara göre özel tedavi yöntemlerinin alınması şeklindeki bu tür başa çıkma stratejisi de dikkate değerdir.

Kaynak: ortam, Leifeng.com tarafından derlenmiştir

Gişe 10 günde 160 milyon oldu ve katılım oranı Shen Teng ve Zhang Yimou'yu geçti. Başka bir şaheser doğdu!
önceki
"Final Fantasy 15" çok oyunculu DLC, prensin dünyayı kurtarmasına yardımcı olmak için bugün yayında
Sonraki
Model oyun kontrolü: tam ateş gücü, Gatlin Kshatriya'yı yeniden yükleyin
Kullandığım ilk cep telefonu ilk aşkımdan daha akılda kalıcı | Blast Zone 037
Intel, oyuncuları ve içerik oluşturucuları toplamak için tüm masaüstü ürünlerini günceller
29. Altın Kartal Ödülleri açıklandı, Li Yifeng, Di Lieba en büyük kazanan oldu, netizenler: Sıkıntılı Yang Zi!
Makine öğreniminin altı ana geliştirme dili
2018 Dünya Kupası başlıyor, güvenli bir izleme rehberine ihtiyacınız var
Model oyun kontrolü: aristokrat mizaç, altın rengi ters X'e
Daoxian: İyi sebzeler yetiştirmek için iyi barakalar
15 günde 940 milyon gişe hasılatı elde eden 63 yaşındaki süperstar hala kral!
"Mario" ya da animasyon filmi başlatacak Minion Man Company prodüksiyona liderlik edecek
WeChat, hesabınızı iptal ederek size yeniden başlama şansı verebilir
Onun yüzünden 20 yıl boyunca duygularının kapısını kapattı!
To Top