Özel | CİKM AnalytiCup 2017 Şampiyon Takım Kazanan Deneyim PaylaşımıPPT videosu ile

Tsinghua Büyük Veri "Etkinlik Deneyimi Paylaşımı" Ders Serisi Tsinghua-Qingdao Veri Bilimi Enstitüsü tarafından "Uygulama·İnovasyon" ve "Teknoloji· Sınır" serilerinin ardından başlatılan bir diğer akademik markadır.Kazanan takımların ve bireylerin katılım geçmişini ve kazanma deneyimlerini önemli yarışmalarda paylaşmayı amaçlamaktadır. yurtiçinde ve yurtdışında büyük veri alanı. . Bu sayımızda davet ediyoruz CIKM AnalytiCup2017 "Radar Görüntülerine Dayalı Gelecek Yağış Tahmini" modeli ile mutlak üstünlüğe göre birinci sırada Tsinghua Üniversitesi Marmot Takımı (Yichen Yao, Zhongjie Li) , ekip üyesi Li Zhongjie Yarışma sorularının girişinden, veri açıklamalarından, yarışma soruları hakkında düşünmeden, çözümlere vb. kadar izleyiciler bunları detaylı bir şekilde paylaştı ve yorumladı.

WeChat genel hesabı "THU Veri Pastası" sahne arkası yanıt anahtar kelimeleri "1129" , PPT'nin tam sürümünü indirin. Video için, lütfen izlemek için Tsinghua-Qingdao Veri Bilimi Enstitüsü "THU Veri Okulu" resmi kamu hesabına dikkat edin.

Metindeki transkript aşağıdadır:

Li Zhongjie, Tsinghua Üniversitesi Termal Enerji Bölümü'nde doktora öğrencisi

takım tanıtımı

Li Zhongjie: Ekibimizin adı, Çince'de köstebek anlamına gelen Marmot'tur.Bunun anlamı, madencilikte bir köstebek kadar iyi olmayı ve verilerin değerini ve anlamını çıkarmayı umduğumuzdur. Bu yarışmada modelimizin son hatası 10.9972 ile 1395 takım arasında büyük farkla birinci sırada yer aldı.

1. Turnuva Tanıtımı

Yarışmanın başlığı "Radar Görüntülerine Dayalı Kısa Vadeli Yağış Tahmini".

Radar görüntüsü meteorolojik Doppler radarı tarafından toplanmıştır.Soldaki resim Doppler radarıdır.Radarın topladığı alan Shenzhen'dedir.

Genel konuşma, yansıtıcılık Bulut ne kadar büyükse (görüntüdeki daha kırmızı alan), bulutta o kadar fazla su bulunur ve bu da yağış getirme olasılığı daha yüksektir.

Yansıma faktörüne ek olarak, yağış miktarı bulut kümesinin genel mekansal yapısı ve bulut kümesinin zaman yönündeki hareket yasası ile de ilgilidir.

2. Veri açıklaması

Yağış tahmini bir regresyon problemi olduğundan, değerlendirme metriği RMSE'dir (Kök Ortalama Kare Hatası).

1,5 saat içinde radar görüntülerini (60 görüntü) girin, 4 farklı yükseklikte dağıtılmış, her yükseklikte 15 görüntü, zaman yönünde düzenlenmiş, her iki radar görüntüsü arasındaki zaman aralığı 6 dakikadır ve daha sonra bu 60 görüntüyü kullanın önümüzdeki 1-2 saat içinde yağış.

Tahmini konumlar kırmızı noktalardır (hedef siteler). Resimden de görebileceğiniz gibi, en alt katmanın yüksekliğinde, her bir radar görüntüsünün belirgin bir çemberi vardır, çok koyu mavi bir renge sahiptir, bunun nedeni yansıtma eksikliğinden değil, radar kapsamının tam olmamasındandır, yani simülasyonda Eğitim sırasında en düşük katman yüksekliğinde radar görüntüleri kullanmadık.

3. Turnuva düşüncesi

  • Görüntü sorunlarıyla başa çıkmak için yöntemlerin gözden geçirilmesi

2012'den önce, görüntü problemi işleme yöntemi genellikle Geleneksel Görüntü Algoritmaları . aracılığıyla görüntü Özellik çıkarma ve ardından bazı klasik makine öğrenimi modellerini uygulayın ve ardından sonuçların çıktısını alın.

2012'den sonra, uçtan uca öğrenme Modelin özellikleri manuel olarak çıkarmasına gerek yoktur ve görüntü, Derin Evrişimli Sinir Ağları , çıktıyı doğrudan alacaksınız.

Bu, 2010-2015'te imageNet'te kazanan modeldir. 2010'da kazanan algoritma hala bazı geleneksel görüntü işleme yöntemleridir, ancak 2012'den beri kullanılan modellerin tümü derin evrişimli sinir ağlarıdır.

Bilgisayar performansının artmasıyla ağın katman sayısı giderek derinleşiyor.2015 yılında ResNet'in ortaya çıkmasıyla birlikte görüntü katman sayısı 152'ye hatta daha fazlasına ulaştı.

Bu, yıllar içinde ImageNet'teki modelin ilk 5 sınıflandırma hatası sonucudur. Derin evrişimli sinir ağı kullanıldıktan sonra sınıflandırma hatası hızla düşmekte ve katman sayısının artmasıyla ResNet'in sınıflandırma hatası insan gözünün tanıma doğruluğunu aşan %3,57'ye düşmüştür.

Derin öğrenme için gereken örnek sayısı çok fazladır.CIAR10 ve MNIST gibi veri kümeleri için örnek sayısı nispeten azdır, bu nedenle geleneksel görüntü algoritmalarının dezavantajları o kadar belirgin değildir.

Sonunda 10.000'den az bağımsız örnekle, sağdaki daha büyük görüntüyü elde etmek için dikilebilen soldaki görüntü.

  • Model ve örneklem büyüklüğü arasındaki ilişki

Düzenli dışında göç öğrenimi , sen de yapabilirsin yapay göç öğrenimi , yaşam deneyimi çıkarma özelliklerini modele dahil eder. Küçük bir örneklem büyüklüğü ile bile daha iyi sonuçlar alınabilir.

  • Mevcut konu

Yerel taşınım hızının zaman aralığı ile çarpımı bu zaman aralığında bulut hareketinin X yer değiştirmesine eşittir.Konveksiyonun basit formülü ile bunu kolayca düşünebiliriz ancak LSTM algoritması için örnek sayısı küçük, , böyle bir konveksiyonu hesaplamak zordur.

  • Radar yansıtma faktörü ve yağış arasındaki ilişki

Örnekleri, değerleri (parlaklık), görüntüleri kırpma ve çevirme vb. değiştiren veri büyütme ile büyütemeyiz. Bu, radar görüntüsünün kendisinin fiziksel özelliklerini bozar.

4. Çözümler

Model Mimarisi Önceki sorulara dayanarak aşağıdaki model mimarisini oluşturduk:

Ön işleme aşaması: İlk olarak, bazı görüntülerin üst üste binen alanları olması özelliğinden yararlanın. görüntü dikişi ve ardından dikişli görüntüdeki kilit noktaları iletin SIFT tanımlayıcısı Zaman yönünde karşılık gelen ilişkiyi bulun ve ardından bulut hareket yörüngesini alın.

Özellik çıkarma aşaması:

  • İlk kategori zamansal ve mekansal yön özellikleridir;

  • İkinci kategori, bulut kümelerinin şekil özellikleridir;

  • Üçüncü kategori yerel radar görüntüleridir.

Model eğitim aşaması: İlk olarak, yerel radar görüntüsü sığ alana girilir. Evrişimsel Sinir Ağı , iki katmandan sonra Evrişim ve Havuzlama Tek boyutlu bir vektöre düzleştirin ve ardından zaman-uzay yönü özelliği ve bulut şekli özelliği ile birleştirin ve iki katmana birlikte girin Tamamen bağlı sinir ağı Nihai yağış tahminini yapın.

5. Diğer ekip çözümleri

İkinci olan ekip Xi'an Jiaotong Üniversitesi'nden geldi ve geleneksel görüntü algoritmalarını kullandılar. Önce görüntüyü 3×3 alt bölgelere ayırdılar, her bir alt bölgede yansıma histogramlarını çıkardılar ve bu histogramların zaman yönünde kalıntılarını daha sonra PC boyutluluk indirgeme ve gürültü giderme işlemlerini gerçekleştirerek farklı makine öğrenme modellerine girdiler, ve son olarak model füzyonu yapın.

Üçüncü sıradaki ekip Vietnam'dandı ve açık bir özellik çıkarma adımı olmadan uçtan uca bir öğrenme modeli kullandılar. Önce yağış dağılımını analiz ettiler ve yağış dağılımının bir Gauss dağılımı değil, iki tepe noktası olduğunu buldular, bu yüzden KAYIP'ı iki kısma ayırdılar: yağış dağılımı regresyon hatası farklı yağış türleri ile sınıflandırma hatası .

Modelleri, on ağ katmanıyla tüm ekipler arasında en karmaşık olanıdır.Ancak, az sayıda mevcut örnek nedeniyle, aşırı karmaşık bir modelin kullanılması, kolayca fazla uyum sağlamaya neden olabilir.

Dördüncü sıradaki ekip Çin Bilimler Akademisi'nden geldi ve özellikleri çıkarmak için geleneksel görüntü algoritmalarını da kullandılar. Çıkarılan özellikler iki kategoriye ayrılır:

  • geçmek yüzdelik yöntemi Farklı boyutlardaki yerel bölgelerin dört yüzdelik dilimini çıkarın;

  • geçmek rüzgar yöntemi Giriş olarak hedef sitenin yukarısındaki görüntü alanını bulun, ardından önceki adımda çıkarılan özelliklerle birleştirin ve ardından bunları üç farklı modele girin ve son olarak model birleştirmeyi yapın.

Üçüncü ve dördüncü sıradakilerin ikisi de LSTM kullanıyor.Aslında onlar da zaman yönünün özelliklerini çıkarmak istiyorlar, ancak zorluk nispeten büyük çünkü eğitim örnekleri çok sınırlı. Ekibimizin yöntemi, görüntü tanımada SIFT ve CNN'nin avantajlarını birleştirir ve aynı zamanda, rekabette yer alan fiziksel sorunların anlaşılmasına dayalı olarak, karşılık gelen temsili bulmak için ve sonunda diğer takımlara liderlik edebilmiştir. parametreleri ayarlamadan büyük marj.

6. Sonuç

Yarışma kodu ve ayrıntılı problem çözme adımları:

https://github.com/yaoyichen/CIKM-Cup-2017

Sahne arkası yanıt anahtar kelimeleri "1129" , PPT'nin tam sürümünü indirin.

Düzenleme: Chen Uzun

Düzeltme: Zhu Jianghuafeng

Bu dersin konukları Yao Yichen ve Li Zhongjie, aynı zamanda Veri Okulu Araştırma Departmanının üyeleridir.Onlarla arkadaş olmak ister misiniz? Veri Okulu Araştırma Departmanına katılmak için makalenin sonundaki "Orijinal metni oku"ya tıklayın!

yao Yichen, Veri Okulu Araştırma Bölümü Üyesi, Tsinghua Üniversitesi Mühendislik Mekaniği Bölümü doktora öğrencisi. Tianchi büyük veri platformunun en iyi 10 oyuncusu, Tianchi büyük veri IJCAI16 kulaktan kulağa varlık tüccar tavsiye yarışmasının galibi ve çaylak ağı son mil hızlı teslimat şampiyonu, veri analizi ve görüntü işlemede iyi.

Li Zhongjie , Veri Okulu Araştırma Bölümü üyesi, Tsinghua Üniversitesi Termal Enerji Bölümü'nde doktora öğrencisi. Python'da veri analizi, işleme ve makine öğrenimi algoritmalarının uygulanmasında iyidir. Büyük veri teknolojisi konusunda tutkuludur. Tianchi Büyük Veri IJCAI16 kulaktan kulağa varlık tüccar tavsiyesi yarışmasını ve Cainiao ağının son mil hızını kazandı teslimat şampiyonu.

Bilim adamları, ışık dönüşüm oranını 6 kat artırabilen "yapay yapraklar" geliştiriyor
önceki
Uluslararası Şampiyonlar Kupası Guangzhou Station-Bacca skoru, Aubameyang ikiye katlandı, Milan Dott'a 1-3 kaybetti
Sonraki
2016'da derin öğrenme İnternetin yerini aldı
Özel | 2017'de AI alanındaki önemli olayların envanteri!
Isınma maçı Lukaku'nun ilk golü Mkhitaryan 10 kişiyi geçti Manchester United, Salt Lake City 2-1'i tersine çevirdi
Ağır aşırı yüklenmiş iki binek otomobil yüksek hızda durduruldu ve her iki sürücü de gözaltına alındı
Ordudan emekli olduktan sonra, sadece gerçek savaş seviyesini korumak için orduya eğitime döndüler.
IBM Suzhong: Bilgi işleme verimliliğini artırmak için derin öğrenme, gelişmiş öğrenme ve diğer yöntemler nasıl kullanılır?
Denizin öfkesini okuyun, işte dünyanın en uzun ve en görkemli dalgası
Çok utanç verici! Çin Süper Ligi'nin dördüncü takımı Güney Kore'ye karşı bir deplasman maçı kazandı, sadece Luneng 1 sayı attı.
Etkili öğrenmenin anahtarı: "bilginin gerçekten bir şey olmadığını" unutmayın
Bay SIPG 60 milyon adeta kurtarıcı oldu! Rakibin kalecisi tanrı düzeyinde bir kurtarış yaptı, başını iki eline koydu
Teknoloji ve Hukuk: "Baş değiştirme tekniği" nin arkasında ne düşünmeliyiz?
Liangyou 4. Sayı: "Yabancı" aktris Yang Aili'nin ilk görünümü, Puyi'nin düğün yerel şiiri ortaya çıktı
To Top