Leifeng.com AI Teknolojisi İnceleme Basın : Bu makale, NIPS 2017 makalesinde bahsedilen temel algoritma modelini tanıtmaktadır: Yağış için Derin Öğrenme, Nowcasting: Bir Karşılaştırma ve Yeni Bir Model. Makalenin yazarlarından Shi Xingjian, Leifeng.com tarafından düzenlenen son GAIR konferans salonunda çevrimiçi canlı sınıfta, makaledeki temel fikirlerin ve modelin evrim sürecinin ayrıntılı bir açıklamasını yaptı. AI Technology Review, herkes için paylaşımı derledi. ana içerik.
Profesör Yang Suiren'in vesayeti altında Hong Kong Bilim ve Teknoloji Üniversitesi'nde dördüncü yıl doktora yapan Shi Xingjian. Şu anda Amazon AWS Deep Learning grubunda uygulama bilimcisi olarak stajyerdir. Şanghay Jiaotong Üniversitesi'nde öğretim üyesi olarak profesörler Li Wujun ve Wang Shilin ile lisans. Ana araştırma yönleri derin öğrenme, zamansal sıra analizi ve bilgisayarla görmedir. Apache / mxnet'in geliştirme üyesi ve DMLC Association'ın bir üyesidir.
Video oynatma bağlantısı:
Konuyu paylaş : Kısa vadeli yağış tahmini için derin öğrenme: bir kıyaslama ve yeni bir model
Anahat paylaş:
Kısa vadeli yağış tahminini ve bu sorunu çözmek için kullanılan ConvLSTM ağını kısaca tanıtın.
Yeni TrajGRU ağına giriş
HKO-7 kıyaslamasına giriş
sonuç olarak
İçerik paylaşın
Kısa vadeli yağış tahmini, bir bölgedeki yağışların gelecekte kısa bir süre içinde tahmin edilmesini ifade eder. Bu süre genellikle 0 ila 6 saattir. Tahmin esas olarak radar yankı haritasına veya yağış dizisinin bilgisine veya yardımcı tahmin için diğer bilgilere dayanır.
Radar yankısı ile yağış arasında doğrudan bir yazışma vardır. Bu yüzden makalede sadece radar eko harita tahminini kullandık. Yani sorun, radar yankı dizisinin önceki birkaç karesi boyunca sonraki birkaç kareyi tahmin etmek haline geliyor.
Bu sorunun birçok uygulama senaryosu vardır ve konut sakinlerinin yaşamlarıyla yakından ilgilidir. Örneğin, yollardaki su birikimini tahmin edin, uçuşlar için hava durumu rehberliği sağlayın ve şehirlerde kısa süreli yoğun yağış uyarıları sağlayın. Atmosferdeki karmaşık dinamik değişiklikler ve kısa vadeli yağışların gerçek zamanlı gereksinimleri nedeniyle, büyük ölçekli ve yüksek hassasiyetli tahminlere ihtiyacımız var.Bu sorun, meteoroloji ve makine öğrenimi alanında çok büyük bir zorluk teşkil ediyor.
Geleneksel yağış tahmini için iki yöntem
NWP, atmosferin fiziksel bir modellemesidir ve sonraki tahminler fiziksel modelin simülasyonu ile yapılır. Bu yöntemin avantajı, daha uzun bir zaman aralığında tahmin için daha doğru olması, ancak ilk bir veya iki saatte tahmin edilememesidir, bu nedenle NWP yöntemi kısa vadeli yaklaşım için kullanılmaz.
Gerçek sistemdeki başka bir uygulama, optik akış vektör yöntemine dayanmaktadır. Fikri önce optik akış vektörünü iki radar yankı görüntüsü üzerinden tahmin etmektir Bu optik akış vektörü, bu bulutların hareket ettiği yön olarak anlaşılabilir. Ardından, değişmeyecek olan bu optik akış vektörünü kullanarak, son tahmini elde etmek için son radar görüntüsünü tahmin edin. Bu yöntem, ilk veya iki saat içinde daha doğrudur. Hong Kong Gözlemevi, optik akış vektörü tarafından yapılan kısa vadeli geliş tahminine dayanmaktadır.
Yeni model ConvLSTM tanıtımı hakkında
2015 yılında, evrişimli uzun vadeli kısa vadeli bellek ağı (Evrişimli LSTM) önerdik.Bu derin öğrenme yöntemi makine öğrenimine dayanır ve bu soruna uçtan uca bir çözümdür.
Bu şema, optik akış vektör yöntemine kıyasla bazı problemlere sahiptir.
Birincisi, bu şemanın ilk adımı optik akış vektörünü tahmin etmek olduğundan ve ikinci adım, optik akış vektörünü tahmin etmektir.Bu iki adım ayrı ayrı yapılır, böylece birikmiş hatalar olacaktır.
İkincisi, optik akış vektörü makine öğrenmesine dayalı değildir, bu nedenle radar yankı haritasından yararlanamaz.
Üçüncüsü, optik akış vektörünü tahmin etme yönteminde, iki bitişik çerçeve kullanılır ve daha uzun bir süre içindeki bazı ilişkiler dikkate alınamaz Örneğin, üç çerçeve, dört çerçeve ve beş çerçevenin optik akış vektörü tahmin edilemez.
Bununla birlikte, ışık kaybı yönteminin eksikliklerini gidermenin yanı sıra, bu sorunu çözmek için derin öğrenmeyi kullanmak da aşağıdaki iki zorluğa sahiptir.
Tahmin etmek istediğimiz şey bir dizidir, bu nedenle çok adımlı tahmin zor bir noktadır.
Başa çıkmamız gereken şey uzay-zamansal verilerdir, bu nedenle modelimiz modelleme için uzay-zamansal verilerin özelliklerinden tam olarak yararlanmalıdır.
Öncelikle bu konuyu kısaca açıklıyoruz.
Neyi gözlemleyebileceğimizi açıklamak için bir kodlama ağı kullanarak. RNN'yi kodlayıcı ve öngörücü olarak kullanıyoruz.
RNN'den bahsedileceği için, eğer LSTM temel bir kodlayıcı-tahminci ağı olarak kullanılıyorsa, modelimiz şöyle olabilir
Bu şemadaki sorun, LSTM'nin uzay-zaman dizisi için herhangi bir özel tasarım yapmamasıdır. Bu nedenle, özellikle uzay-zamansal diziler için tasarlanmış bir yapı olan Evrişimli LSTM'yi önerdik. Aralarındaki fark, genel LSTM'nin farklı durumlar arasında geçiş olarak tam bağlantı kullanması, ConvLSTM'nin tam bağlantıyı değil, evrişimi kullanmasıdır.
Yaklaşımımız, nihai modeli oluşturmak ve etki diyagramını karşılaştırmak için LSTM'yi ConvLSTM ile değiştirmektir.
Evrişimli LSTM ağı optimal değildir Bunun nedeni, durum geçişinde evrişim kullanımının döngüsel bağlantı yapısını sabit zaman ve mekana sahip bir yapıya dönüştürmeye eşdeğer olmasıdır, ancak doğada meydana gelen çoğu hareket için zaman ve uzay sabit değildir. . Dönme, ölçekleme gibi, bu nedenle bu tür bir hareket ilişkisini tanımlamak için özyinelemeli evrişim kullanmak kesinlikle optimal değildir.
İkinci sorun, bu modeli ölçmek için önceki makalede kullanılan şemanın pratik uygulama standardına ulaşmaktan uzak olmasıdır. Daha önce, yalnızca küçük bir veri kümesi üzerinde ölçülüyordu ve bu yalnızca bir eşikti.
Bu nedenle, kısa vadeli yağış tahmini için derin öğrenmenin kullanımı aslında başlangıç aşamasındadır. Bu modelleri nasıl ölçeceğimizi hâlâ bilmiyoruz.
Bu iki sorunu çözmek için, bu makalede konvolüsyon yapısını aktif olarak öğrenebilen yeni bir TrajGRU (yörünge GRU) modeli öneriyoruz.Ayrıca HKO-7 adlı yeni bir kıyaslama öneriyoruz. Gerçek hayata yakın bazı yeni performans değerlendirmeleri.
ConvLSTM'ye nispeten benzer bir model olan karşılaştırma modeli ConvGRU'yu kısaca inceleyin. Aradaki fark, ConvGRU'nun iki geçidi, bir güncelleme geçidi ve bir sıfırlama geçidi olmasıdır. ConvLSTM'nin üç Kapısı vardır.
ConvGRU'dan TrajGRU'ya
Ayrıca bir Kodlayıcı-Tahminci yapısı önerdik
Bu modeli anlamak ve karşılaştırma modeli ConvGRU ile basit bir karşılaştırma yapmak için Moving MNIST ++ veri kümesi üzerinde bir deney yaptık.
MovingMNIST görselleştirme oluşturma
Yeni kıyaslama HKO-7 hakkında
Bu veriler, Hong Kong Gözlemevi tarafından sağlanan 2009'dan 2015'e kadar olan yağış radar haritası verileridir Basitçe söylemek gerekirse, eğitim ve onay olarak 2009'dan 2014'e kadar olan verileri ve test verileri olarak 2015'ten elde edilen verileri kullanıyoruz.
Veri denoising grafiği
Gerçek hayatta, sürekli olarak gelen yeni yağış verileri vardır, bu nedenle modeli dinamik olarak eğitmek için sürekli olarak yeni verileri kullanabiliriz. Aslında yoğun yağmurun gerçek yaşamdaki etkisi daha da büyük.Çözümümüz modeli ölçerken yoğun yağışa daha fazla ağırlık vermek ve yeni B-MSE ve B-MAE'yi alıyoruz.
Sonuçları ölçün
sonuç olarak
Bu makalede, ağ özyinelemeli yapısını dinamik olarak öğrenme yeteneği ile karakterize edilen bir GRU yörüngesi öneriyoruz.Bu yörünge GRU, sentetik MovingMNIST ++ veri kümesi ve yeni HKO-7 kıyaslamamız üzerinde ConvGRU'dan daha iyi performans gösteriyor.
İkinci nokta, HKO-7 için yeni bir ölçüm standardı önermiş olmamızdır. Tüm derinlik modellerinin ışık kaybından daha iyi olduğunu bulduk. TrajGRU modeli en iyi performans gösteren modeldir.
Üçüncü nokta, dinamik ince ayarın modelin performansını iyileştirmede etkili olduğudur.
Bu algoritmayı Hong Kong Gözlemevi sistemine entegre etmeye çalışıyoruz.
Leifeng.com video oynatma bağlantısı: