AAAI 2020 | RiskOracle: Uzamsal-zamansal ince taneli trafik kazası tahmin yöntemi

Yazar | Bilim ve Teknoloji Üniversitesi Wang Yang Ekibi

Editör | Jia Wei

Bu makale AAAI 2020'de Çin Bilim ve Teknoloji Üniversitesi'nden Wang Yang'ın ekibi tarafından yayınlanan "RiskOracle: Dakika Düzeyinde Şehir Çapında Trafik Kazası Tahmin Çerçevesi" makalesini analiz ediyor.

Kağıt bağlantısı: https: // github .com /zzyy0929/AAAI2020-RiskOracle/blob/master/AAAI-ZhouZ.1664.pdf

Kentsel bilgi işlem alanında, akıllı ulaşım ve akıllı seyahat her zaman Dikkat Trafik kazaları trafikte giderek daha önemli bir rol oynamaktadır ve Dünya Sağlık Örgütü istatistiklerine göre, giderek insanlığın en büyük sekizinci katili haline gelmiştir. Geleneksel temel trafik dinamik unsurları akışı ve hız tahmini, kaza tahminine tamamen eşdeğer olamaz, çünkü kaza dağılımı daha düzensizdir ve onu etkileyen faktörler, hava durumu, insan faktörleri, yol ağındaki ve bölgeler arasındaki önemli dinamik değişiklikler dahil olmak üzere daha karmaşıktır. Dinamik ilişkilendirmeler vb. Ve yetersiz veri sorunu vardır.

Bu makale daha kısa vadeli bir trafik kazası tahmin çerçevesi önermekte ve trafik güvenliğini iyileştirmeyi ve teşvik etmeyi amaçlayan Çok Görevli Diferansiyel Zamanla Değişen Grafik Evrişim Ağı (Çok Görevli DTGN) önermektedir. Veriler, ulaşım gelişimini güçlendirir ve daha tescilli bir sinir ağının tasarımı yoluyla, yapay zeka topluluklarının ilerlemesini teşvik eder, kentsel bilgi işlem ve mekansal-zamansal veri madenciliğindeki benzer sorunlar için yeni fikirler (grip tahmini, suç algılama tahmini vb.) Fikirler.

1. Gerçek zamanlı trafik kazası tahmini

Trafik kazası tahmini, şehir güvenliği için büyük önem taşımaktadır. Doğru kaza tahmini yolculara daha zamanında ve güvenli bir rota sağlayabilir Önermek . Akıllı trafik bilgilerinin ve otonom sürüşün geliştirilmesiyle, üretim ve yaşamda daha ayrıntılı kaza tahmini için artan bir talep var. Doğru tahmin, daha gerçek zamanlı yol planlaması ve acil durum kurtarma için yol gösterici ve kritik bilgiler sağlayabilir.

Mevcut trafik kazası tahmin görevleri iki bölüme ayrılmıştır: uzun vadeli (gün düzeyinde tahmin) ve orta vadeli (saat düzeyinde tahmin). Saat düzeyinde kaza tahmini, zaman ilişkisini öğrenmek için geçmiş trafik kazası kayıtlarını eğitim ağına beslemek için genellikle bir sinir ağı (LSTM katmanı gibi) kullanır. Kısmi araştırma Birleştirmek Gerçek zamanlı insan faaliyetlerine dayalı olarak kaza modları, mevcut derin öğrenme çerçeveleri SDAE, SDCAE ve ConvLSTM temel alınarak incelenir.

Derin öğrenme modellerindeki en son gelişmeler saatlik kaza tahmini için tatmin edici sonuçlar getirse de, aşağıdaki üç önemli konunun büyük ölçüde göz ardı edildiğine ve bu modellerin doğrudan daha kısa dakikalara uygulanamayacağına inanıyoruz. Seviye tahmininde:

  • Tahmin görevinin uzay-zamansal çözünürlüğü arttığında, sıfır genişleme sorunu ortaya çıkacak ve tüm sonuçların sıfır olacağı tahmin edilmektedir. Bu sorunu çözmek için bir strateji yoksa, eğitim verilerindeki sıfır olmayan nadir maddeler, modelin yürürlüğe girmesini engelleyecektir.

  • Statik alt bölge korelasyon derecesi, evrişimli sinir ağı (CNN) ile anlaşılsa da, zamanla değişen alt bölge korelasyonu, şehrin kısa vadeli kaza tahmininde de hayati bir rol oynamaktadır, yani iki alt bölge gelgit akışı nedeniyle sabahlarıdır. Korelasyon düşük ve öğleden sonra korelasyon düşük.

  • Aynı alt bölgedeki bitişik zaman aralıklarında trafik koşullarındaki anormal değişiklikler genellikle kazaları veya diğer olayları tetikler. Yukarıda belirtilen uzay-zaman sorunları dikkate alınmazsa, önceki saatlik tahmin modelinin yeteneği ciddi şekilde engellenecektir.

Bu makalede, şehirdeki dakika düzeyindeki trafik kazalarının tahminini incelemek için çok görevli diferansiyel zamanla değişen grafik evrişimli ağa (Çok görevli DTGN) dayalı üç aşamalı bir RiskOracle çerçevesi öneriyoruz. Veri ön işleme aşamasında, küresel trafik koşullarını büyük ölçüde ortaya çıkarmak için bir ortak algılama stratejisi öneriyoruz ve ardından önceki bilgilere dayalı veri geliştirme işlevi, kısa vadeli tahmin için sıfır enflasyon sorununu çözebilir. Eğitim aşamasında, zamanla değişen toplam yakınlık matrisinin kısa vadeli dinamik alt bölge korelasyonunu açık bir şekilde modelleyebildiği ve diferansiyel özellik oluşturucunun aynı bölgedeki trafik koşullarındaki kısa vadeli değişiklikler için kullanıldığı çok görevli bir DTGN öneriyoruz. Kaza ile daha üst düzey bir ilişki kurun.

Kazalar ve trafik hacimleri genellikle şehirlerde eşit olmayan bir şekilde dağıldığından (mekansal heterojenlik olarak adlandırılan daha fazla araba ve daha fazla kaza şehir merkezinde yoğunlaşma eğilimindedir), çok görevli çözüm kaza tahmini sorununu çözmeyi amaçlamaktadır. Mekansal heterojenlik. Daha sonra, tahmin aşamasında öğrenilen çok ölçekli kaza dağılımını kullanarak, büyük olasılıkla bir dizi ayrık alt bölge elde edebiliriz. İki veri kümesi üzerinde yapılan deneyler, çerçevemizin 30 Hem dakika hem de 10 dakikalık tahmin görevleri en son çözümleri geride bırakıyor.

2. Hazırlık ve problem tanımı

Kaza tahmin çalışmamızda, çalışma alanının tamamı doğrudan tüm kare alanlar olarak modellenirse ve mekansal-zamansal öznitelik çıkarımı için geleneksel CNN kullanılırsa gereksiz fazlalıklara neden olur.Aynı zamanda şehir için kenar konturu Genellikle düzensizdir. Şekil 2 (a) 'da gösterildiği gibi, ilk olarak yol ağındaki çalışma alanını orta büyüklükteki dikdörtgen alanlara (dikdörtgen alanlar olarak adlandırılır) ayırıyoruz. Her dikdörtgen alan birkaç küçük kare alt alan içerir (alt alanlar olarak adlandırılır). Karayolu ağındaki alanı seçeceğiz Çalışma alanında toplam alt alanlar var Bu alt alanı modellemek için şehir haritasını (ağ) kullanıyoruz.

1. Tanım 1 Şehir Haritası

Tüm araştırma alanını bir şehir grafiği olarak tanımlıyoruz Düğüm seti, setteki her eleman ilk alt bölgeyi temsil ediyor. Verildiğinde, kenar, iki düğümün (alt bölgeler) bağlı olduğunu, yani iki bölgenin ilişkili olduğunu gösterir. Resmi ifadesi:

Bu makaledeki trafikle ilgili unsurlar, statik yol ağı özellikleri ve dinamik trafik özellikleri olmak üzere iki yönü içerir. Kentsel yol ağının seyrekliğini ve hesaplama karmaşıklığını korumak için bağlantı aracılığıyla afinite matrisini (statik afinite) ve (dinamik afinite) kontrol ediyoruz.

2. Tanım 2 Statik yol ağının özellikleri

Bir şehir alt bölgesi, yani alt bölgedeki yol ağının statik özellikleri, aşağıdaki istatistiksel alan özelliklerini kapsar: şerit sayısı, yol türü, yol bölümlerinin uzunluğu ve genişliği, kar kaldırma önceliği ve yükseltilmiş elektronik işaretlerin sayısı, tüm dahili yol bölümleri olabilir Sabit uzunlukta bir vektör olarak ifade edilir. Tüm kentsel alanın statik yol ağı özellikleri olarak ifade edilebilir.

3. Tanım 3 Trafik dinamiği özellikleri

Alanın zaman içindeki dinamik özellikleri şunları içerebilir: (1) trafik akışı, (2) trafik durumu (hız) ve (3) kaza riski. Kaza riski şu şekilde ifade edilebilir:

Dolayısıyla içeride, tüm kentsel alanın kaza risk dağılımı ve dinamik trafik özellikleri şu şekilde ifade edilebilir:

4. Problem tanımı: trafik kazası tahmini

Statik yol ağı özellikleri ve tarihsel dinamik trafik özellikleri göz önüne alındığında amacımız, şehir içindeki trafik kazası risklerinin dağılımını tahmin etmek ve gelecekteki zaman aralıkları için (şehir genelinde) kaza riski dağılımı için yüksek riskli alt bölgeleri seçmektir.

3. Yöntem: dakikalar içinde gerçek zamanlı trafik kazası tahmini

Modelimiz, Şekil 1'de gösterildiği gibi veri ön işleme, model eğitimi ve kaza tahmini (hiyerarşik kaza alanı taraması) olmak üzere üç bölüme ayrılmıştır.

Şekil 1 Modele genel bakış

Dördüncü olarak, veri ön işleme

1. Kaza tahmininde mekansal heterojenliği çözün

Çoğu trafik kazası, yüksek trafik hacmine ve yüksek risk değerlerine sahip şehir merkezlerinde meydana gelme eğiliminde olduğundan, ciddi risk alanı dengesizliklerine neden olurken, kırsal alanlardaki nispeten yüksek riskli alanlar ihmal edilmektedir. Şehir çapında tahminlerde bulunmak için, kaza geçirme olasılığı en yüksek alanları seçmek ve mekansal heterojenlik problemini çözmek gerekir. Bu nedenle, Şekil 2 (a) 'da gösterildiği gibi, şehir farklı boyutlara ayrılmıştır.Orta dikdörtgen alan, kaba taneli kaza dağılımının toplanmasından, küçük kare alan ise ince taneli kaza dağılımının toplanmasından sorumludur. Ardından, her bir orta büyüklükteki dikdörtgen bölgedeki alt bölgeler daha da vurgulanacaktır. Çok ölçekli kaza bilgisi dağıtımı, mekansal hiyerarşik bir kaza dağılımı olarak kabul edilebilir.

2. Sıfır genişleme sorununun üstesinden gelin

Eğitim etiketindeki sıfır olmayan öğeler çok nadir ise, derin sinir ağı (DNN) eğitimin ağırlığını tamamen 0 yapar, bu da modeli geçersiz kılar ve sıfır enflasyona maruz kalır. Şekil 2 (b), kısa vadeli kazaların doğal nadirliğini göstermektedir. Gerçek zamanlı kaza tahmininde bu sorunun üstesinden gelmek için, eğitim veri setinin etiketlerindeki risk değerlerini ayırt etmek için önceki bilgilere dayalı bir veri geliştirme (PKDE) stratejisi tasarladık. Spesifik olarak, aralık için, sıfır değerli öğeyi ayrımcılık ile negatif bir değere dönüştürüyoruz. Dönüşüm iki aşamaya ayrılmıştır: a) sıfır değeri, denklem (2) ile bir kaza riski göstergesine dönüştürülür; b) göstergenin değeri, denklem (3) ile bir istatistiksel kaza yoğunluğuna dönüştürülür. Bir bölüm verildiğinde, kaza riski endeksini şu şekilde hesaplayabiliriz:

Bunlar arasında eğitim veri setindeki toplam hafta sayısı bulunur ve tüm eğitim periyodundaki toplam risk değerinin jj. Haftasının zaman aralığını temsil eder. Ardından, bölgenin istatistiksel kaza yoğunluğunu hesaplayabiliriz

Toplam, mutlak değer aralığı ile gerçek risk değeri aralığı arasındaki simetriyi koruyan bir katsayıdır. Logaritmik fonksiyonun (tabanı 1'den büyük olan) 0 ile 1 arasında ayırt edici özelliklerini kullanırız, bu, dönüştürülen verileri kolayca ayırt edebilir ve ağı eğitmek için uygun olabilir. Dönüşüm şu şekilde gerçekleşir: 1) Sıfır değerli maddenin alt alanının kaza şiddeti değeri negatiftir, dolayısıyla sıfır olmayan maddenin alt alanının değerinden küçüktür, bu da sıfır değerli maddenin alt alanının kaza riskinin bu zaman aralığında daha düşük olduğunu yansıtır; 2) Kaza riski göstergelerinin daha düşük olduğu alt bölgeler daha düşük kaza olasılığına sahiptir ve gerçek kaza risklerinin sıralamasını koruyabilir.

Şekil 2 NYC şehir bölümü ve rastgele seçilen 10 dakikalık kaza dağılımı yöntemi

3. Seyrek algı verilerini doldurun

Gerçek zamanlı trafik bilgisinin kaza tahmini için tam olarak toplanması genellikle zordur, ancak dinamik trafik bilgisi genellikle statik uzaysal yol ağı yapılarıyla etkileşime girer. Bu nedenle, bir çarpanlara ayırma makinesinin (FM) etkileşimli çalışmasını kullanarak xDeepFM'i trafik verilerine uygun bir uzay-zamansal derinlik ayrıştırma makinesine (ST-DFM) dönüştürdük ve işbirliğine dayalı bir algılama stratejisi önerdik.

Karayolu ağı benzerliğini ve alt bölgeler arasındaki bağlantıyı, önce alt bölgeler arasındaki statik yakınlığı temsil eden ve aşağıdaki şekilde hesaplanabilen statik afinite matrisi aracılığıyla çıkarıyoruz:

Diverjans işlevi şu şekilde ifade edilebilir:

XDeepFM'e benzer şekilde ST-DFM, sıkıştırılmış bir etkileşimli ağ (CIN) modülü ve bir DNN modülü içerir. Üç uzamsal-zamansal alan, yani statik uzamsal özellikler, dinamik trafik karakteristikleri (bir alt alandaki dinamik trafik karakteristik alanı için, önce statik afinite matrisini (mevcut dinamik trafik, en yakın alt alanı seçeriz. Bu alt alanlardaki bilgiler) Dinamik trafik özellikleri. Ve zaman damgaları ST-DFM'ye gömülüdür) Ardından, ST-DFM, vektör yönündeki farklı uzay-zamansal özellikler arasındaki etkileşimi öğrenmek için CIN modülünü kullanır ve özelliklerin yüksek seviyeli temsillerini öğrenmek için DNN modülünü kullanır. Son olarak, özelliklerin üst düzey kombinasyonunu elde ederiz. İlgili alt bölgenin trafik hacmini ST-DFM'ye girerek hız değerini çıkarırız. Tersine, trafik hacmini çıkarmak için bir ST-DFM modeli de eğitebiliriz. İşbirlikli algılama teknolojisi Daha sonra, verileri iki gerçek zamanlı trafik veri setinin kesişme noktasında eğiterek, trafik bilgisi, küresel trafik durumunu elde etmek için büyük ölçüde çıkarılabilir.

5. Çok görevli DTGN'ye dayalı trafik kazası tahmini

1. Spatiotemporal DTGN (Spatiotemporal DTGN)

GCN'yi benimseme motivasyonları: (1) Trafik kazaları ve yol tıkanıklığı nedeniyle belirli bir etkileşimli etki ve iletişim ilişkisi vardır. Özellikle, bir yandan trafik kazaları, trafik sıkışıklığı nedeniyle araçların sık sık sollanmasından kaynaklanabilirken, diğer yandan, trafik kazalarından sonra yollar genellikle tıkanır, bu da araçların sıraya girmesine neden olarak trafik kazası riskini artırır ve trafik kazalarına neden olur. Sonuç olarak kaza noktasında / tıkanıklık noktasında yayılmaya devam ediyor. (2) Benzer yol ağı yapıları ve benzer dinamik trafik örüntüleri kazalara eğilimlidir. Örneğin, üç yönlü kavşaklar, dört yönlü kavşaklar vb. Vardır. Bu yol koşulları genellikle trafik yoğunluğundan ve kazaya meyilli şerit değişiklikleri ve dönüşler olgusundan kaynaklanır. Şehir aynı hava koşullarında olduğunda, bu alanlarda kaza riski aynı anda artacaktır. Ancak, farklılıklar nedeniyle Bölgesel trafik paternleri farklıdır ve kaza riskindeki artış değişkenlik göstermektedir, bu nedenle, farklı koşullar altında farklı bölümlerde (bölgelerde) trafik kazası riskindeki değişiklikleri ölçmek için bir yönteme ihtiyaç vardır. Bununla birlikte, bu ilişki Öklid ilişkisinde bitişik veya bitişik olmayabilir, ancak uzak bir benzerlik, yani Öklid dışı bir ilişki olabilir. Yukarıdaki iki düşünceye dayanarak, bu modeli Öklid dışı ilişkilerde GCN'nin iyi modelleme etkisini kullanarak oluşturduk. Bir GCN varyantı Diferansiyel Zamanla Değişen Grafik Sinir Ağı (DTGN) öneriyoruz ve gözlem özellikleri ve zorluklar için aşağıdaki iki faktörü dikkate alıyoruz:

(1) [Zamanla değişen grafik ağı] Bölgeler arasında belirli bir benzerlik ve alaka derecesi vardır. Gelgit trafiği ve diğer nedenlerle, Şekil 3'te gösterildiği gibi, zamanla değişecek olan alaka derecesi. Genel afinite matrisi, belirli bir zaman aralığında alt bölgeler arasındaki zamanla değişen trafik hacmi korelasyonunu şu şekilde yakalar:

Bunlardan bazıları statik benzerlik, dinamik benzerlik ve harmonik parametrelerdir.

(2) [Diferansiyel grafik ağı] Aynı alan için, bitişik zaman aralıklarında trafik temel unsurlarının sayısal değişikliklerinin trafik kazaları üzerindeki etkisi (katkısı). Geleneksel trafik tahmin problemleri (temel unsurlar) ile karşılaştırıldığında, kaza veya olay tahmini görevi, genel olarak kabul edilmiş olan şehir içi trafik koşullarındaki anormal değişikliklerle daha çok ilgilidir. Bu amaçla, bitişik zaman aralıklarında diferansiyel görüntüleri hesaplamak için bir diferansiyel özellik üreteci sunduk. GCN'ye diferansiyel dinamik trafik özellikleri girilerek, anormal trafik değişikliklerinin yayılması ve etkileşimi modellenebilir ve anlık trafik koşullarındaki değişiklikler ile kazalar arasındaki yüksek düzeyli korelasyon, özellikle dakika düzeyinde kaza tahmini için anlaşılabilir. Verilen diferansiyel vektör, aşağıdaki formülle hesaplanabilir:

Diferansiyel özelliklerin oluşturulmasına dahil olanlar arasında akış ve hız bulunur ve kaza riskinin kendisi, diferansiyelin oluşumuna katılmaz (çünkü farkın önemli bir fiziksel anlamı yoktur).

Şekil 3 Zamanla değişen bölgesel korelasyon diyagramı

tarafından Birleştirmek Dinamik trafik hacmi özellikleri ve ilgili fark vektörü ile birleşik bir özellik demeti oluşturuyoruz. Dinamik mekansal-zamansal veriler, zaman boyutunda güçlü özelliklere, yani süreklilik, dönemsellik ve eğilim içerdiğinden, bu özelliği zaman bağımlılığı oluşturmak için kullanırız. Modelin giriş kısmında, yukarıdaki üç özelliğe göre örnekler oluşturun ve verileri toplayın.DTGN, giriş verileri üzerinde özellik çıkarımı gerçekleştirir.DTGN ağ katmanlarının sayısı arttıkça, yüksek dereceli bölgeler arasındaki dinamik korelasyon model tarafından öğrenilecektir.

Şekil 4'te gösterildiği gibi, daha sonra üç zaman eğiliminin birleşik özellik demet kümelerini DTGN'ye bağımsız olarak giriyoruz. Şekil 4 (a), DTGN'nin ayrıntılı bir mimarisini göstermektedir. Belirli bir zaman açısı için, ilgili ortak özellik demetini olarak kaydederiz. Tüm öğeleri düşük boyutlu bir özellik kümesine kodlamak için tam bağlı (FC) bir ağa geçeceğiz ve ardından bunu GCN'ye besleyeceğiz. GCN, işlemleri yinelemeli olarak gerçekleştirir,

Şekil 4 Çok görevli DTGN'nin uygulama ayrıntıları

Burada, katman grafiği evrişim çekirdeğinin ağırlığını temsil eden katman grafiği evrişimi temsil etmektedir. Burada, bir zaman açısından, seçilen tüm zaman aralıklarının matrislerinin ortalamasını olarak aldığımıza dikkat edin. Gradyan patlamasını önlemek için her 2 GCN katmanı arasında toplu normalleştirme kullanıyoruz. Dönüştürülen veri setindeki negatif değerleri dikkate alarak aktivasyon fonksiyonu olarak seçiyoruz. Ek olarak, gerçek zamanlı dinamik dış faktörler (yani, zaman damgaları ve hava durumu verileri) sabit uzunlukta bir vektöre sürekli olarak yerleştirilir ve ardından her bir GCN biriminin çıktısı ile birleştirilir. Üç zaman açısı için, DTGN'nin çıktı özelliği haritasını ve olarak gösteriyoruz.

2. Çok görevli öğrenmeye dayalı trafik kazası tahmini

Yalnızca derin temsil öğrenme yeteneğini geliştirmekle kalmayıp, aynı zamanda hiyerarşik kaza dağılımını öğrenen ve en olası kaza bölgesi seçimi için rehberlik bilgileri sağlayan çok görevli bir öğrenme mekanizması tasarladık. Öncelikle ana görev olarak ayrıntılı kaza riski tahmini yapıyoruz. Trafik kazaları ile insan faaliyetlerinin yoğunluğu arasındaki önemli korelasyonu göz önünde bulundurarak, özellik temsil yeteneğini geliştirmek için bölgesel trafik hacmi tahminini ilk yardımcı görev olarak alıyoruz. Hiyerarşik kaza alanlarının seçimine rehberlik etmek için, ikinci yardımcı görev olarak farklı orta dikdörtgen alanlardaki toplam kaza sayısını kullanırız (ikisi önemli ölçüde ilişkilidir ve birbirlerine bilgi sağlayabilir).

Spesifik olarak, Şekil 1'de gösterildiği gibi, DTGN tarafından çıkarılan özellik haritalarını evrişime dayalı füzyon modülü dahil olmak üzere geçireceğiz. Ardından çoklu görev öğrenimi gerçekleştiririz. Şekil 4 (b) 'de çoklu görev bölümünün işlem akış şemasını görselleştirdik. Önce tahmin edilen risk özelliği dağılım haritasını ve trafik akışı özellik haritasını oluşturuyoruz. Daha önce negatif bir risk değeri oluşturulduğundan, Leaky_ReLU seçiyoruz yönetmen Hizmetin aktivasyon işlevi.

Tamamen evrişimli ek bir ağ kullanarak, her bir orta dikdörtgendeki kaza sayısını öğreniyoruz

Burada ve sırasıyla, üç görevdeki ince taneli trafik kazası risk dağılımı, insan faaliyeti yoğunluk dağılımı ve orta dikdörtgen kaza dağılımının (kaba taneli kaza dağılımı) eğitim ağırlıklarını temsil eder. Tamamen bağlantılı bir eğitim ağırlığıdır. Kaba taneli bir kaza dağılımı olarak kabul edilebilir ve birlikte oluşturulur, ikisi arasındaki (kaba ve ince taneli arasındaki) dahili korelasyonu öğrenmeye zorlar ve ardından aşağıdaki formülle güncellenebilir:

Modelimizin genel Kaybı şu şekilde tanımlanabilir:

3. Kazalara neden olma olasılığı en yüksek alanların hiyerarşik olarak belirlenmesi

Belirli bir şehirde, kentsel ve kırsal alanlar arasındaki kazaların ve trafik akışının kapsamı genellikle dengesizdir ve bu da mekansal heterojenlik sorununa neden olur. Bu nedenle, en olası kaza alt bölgelerini seçmek için birleşik bir risk eşiği kullanmak açıkça mantıksızdır. Bu yazıda, çok görevli programda öğrenilen hiyerarşik kaza dağılımına dayalı hiyerarşik, büyük olasılıkla kaza bölgesi seçimi (HARS) stratejisi öneriyoruz.

Şekil 5 En olası kaza bölgesinin belirlenmesinin şematik diyagramı

Her bir dikdörtgen alan için, ikinci yardımcı görevdeki karşılık gelen öğeye eşit parametreye sahip en riskli alt alanı seçiyoruz. Bu nedenle, kazaların meydana gelme olasılığının en yüksek olduğu bir dizi alan elde ettik. Bu şekilde öğrenme, aşırı tahmin edilen alanları azaltır, modeli zaman ve hava koşullarındaki değişikliklere uygun hale getirir ve dış faktörleri içerir.

Altı, deney

1. Veri açıklaması

İki gerçek dünya veri kümesi üzerinde deneyler yapıyoruz: NYC Opendata ve Suzhou Industrial Park (SIP) veri kümesi. New York City veri kümesi için, gerçek zamanlı trafik eksikliği nedeniyle, burada her alt bölgedeki taksi sayısını insanların seyahat ettiğinin bir göstergesi olarak kullanıyoruz. SIP veri setleri için trafiği ve hızı içerir. Bunu sosyal medya platformu Sina ile karşılaştırıyoruz Weibo Trafik kazası veri seti entegrasyonunun başka bir koleksiyonu. İki veri setinin istatistikleri Tablo 2'de gösterilmektedir.

Daha ayrıntılı bilgi için lütfen web sitesine bakın: https: // github .com / zzyy0929 / AAAI2020-RiskOracle /.

Tablo 2 Veri setinin istatistiksel özellikleri

2. Değerlendirme stratejisi

Önerilen RiskOracle'ımızı regresyon ve sınıflandırma perspektiflerinden değerlendiriyoruz. (1) Regresyon açısı: Öngörülen riskin ortalama kare hatası (MSE). (2) Uzamsal sınıflandırma perspektifinden: a) En yüksek (Acc @) doğruluk (sıralama görevlerinde yaygın olarak kullanılır), gösterge içindeki alt bölgelerdeki en yüksek doğru tahmin yüzdesini gösterir. İstatistiksel verilere göre, New York City veri setinde 30 Dakika ve 10 dakikalık değerlendirmeler, 20 ve 6'ya eşittir (NYC Kaza Kayıtları 2017). Benzer şekilde, SIP veri setinde 5'e eşittir. b) Acc @, ikinci yardımcı görevin öğrenmelerinin toplamı burada. Bunların arasında, Acc1, kaza sıklığının yüksek olduğu bir zaman dilimindeki doğruluğu temsil eder.

3. Temel yöntem

5 temel vardır, bunlar:

(1) ARIMA: Gelecekteki değerleri, özellikle zaman serisi tahminini anlamak ve tahmin etmek için kullanılan klasik bir makine öğrenimi algoritması;

(2) Hetero-ConvLSTM: Günlük kaza tahmin modeli aynı zamanda en yeni ve en iyi kaza tahmin yöntemidir;

(3) ST-ResNet: İnsan akış tahmini için önerilen klasik bir yöntem ve kaza tahmini için kullanılabilecek potansiyel bir derin öğrenme modeli;

(4) SDAE: Kısa vadeli kaza tahmini için, kaza tahmininin bir göstergesi olarak insan akışının (insan faaliyetleri, vb.) Tanıtılması;

(5) SDCAE: Kısa vadeli kaza tahmini için bir model.

4. Sonuç ekranı ve analizi

1) Modeller arasında karşılaştırmalı analiz

Tablo 3, aralığın 30 NYC ve SIP veri setlerinin dakika ve 10 dakika içinde performans karşılaştırması. RiskOracle çerçevemiz, neredeyse tüm göstergelerde en yüksek doğruluğu elde eder. Seyrek sensör verileri ve kısa vadeli düzensiz uzay-zamansal tahmin için ölçeklenebilirlik daha yüksektir. NYC'deki performansın SIP veri setinden daha iyi olmasının nedeni, SIP'deki eksik kaza etiketi olabilir. Acc @ göstergesinin sonuçlarını ilerideki ablasyon çalışmalarında rapor edeceğiz.

Genel olarak, zamanın tanecikliği daha ince hale geldikçe, çerçeve performansımız biraz düşecek, ancak kaza etiketindeki keskin düşüş ve sıfır enflasyon sorunu nedeniyle taban çizgisi keskin bir şekilde düşecek ve bu da kısa vadeli kaza tahminimizi kanıtlıyor Önermek Etkililik ve ölçeklenebilirlik. Gerçek uygulamadaki veri seti nadir kaza kayıtlarını içerse bile, iki veri setinin değerlendirilmesi önerilen RiskOracle'ımızın sağlamlığını ve çok yönlülüğünü doğrular.

Tablo 3 NYC ve SIP model tahminlerinin karşılaştırılması

2) Acc @ ve self-ablasyon deneyi

Tablo 4'te, makalemizde önerilen Acc @ sonuçlarını bildiriyoruz. Acc @ 20 ve Acc @ 6'nın sonuçları Acc @'dan biraz daha yüksektir, bu da mantıklıdır çünkü birleşik eşik gerçek zamanlı koşullara uyum sağlayamaz ve kaza oranını abartma eğilimindedir. Aksine, çerçevemiz, her bir dikdörtgen alandaki kaza sayısını potansiyel olarak yaklaşık olarak tahmin etmek için çok ölçekli kaza dağılımı tahminlerini kullanma esnekliğine sahiptir. Gözlemlendiği gibi, Tablo 3'teki sonuçlarla karşılaştırıldığında, çerçevemiz diğer kıyaslamalardan daha iyi performans gösterebilir ve Acc @ üzerinde kabul edilebilir bir doğruluk düzeyi sağlayabilir.

NYC veri seti üzerinde ablasyon deneyleri yaptık ve aşağıdaki modülleri genel çerçeveden çıkardık:

  • RO-1 PKDE veri dönüşümü geliştirme stratejisi

  • RO-2 ST-DFM (eksik veri çıkarımı için kullanılan mekansal-zamansal derinlik çarpanlarına ayırma makinesi)

  • RO-3 genel dinamik afinite matrisi (zamanla değişen grafik ağı)

  • RO-4 fark özelliği üreteci (diferansiyel grafik ağı)

  • HARS'li RO-5 Çoklu Görev (hiyerarşik kaza alanı tarama mekanizması)

Tablo 4 Ablasyon deneyi

3) Örnek Olay

Şekil 6'da gösterildiği gibi, belirli 30 RiskOracle tarafından tahmin edilen kazaların etkilerini görselleştirmek için dakika aralıkları. Genel olarak, RiskOracle tarafından oluşturulan şehir çapında risk haritası, ayırt edici risk değerlerini gösterir ve vurgulanan alt bölge riskleri, gerçek değer dağılımıyla büyük bir mekansal benzerliğe sahiptir. Pazar sabahı çok az insan dışarı çıktığı için, sabah 7: 00'de tahmin edilen çok az kaza var. Ancak öğleden sonra geldiğinde kaza sayısı artacak ve gece kazalar daha da ciddi hale gelecektir. Bu, esas olarak o gece meydana gelen ve kazaya açık yol koşullarına yol açan şiddetli yağmurdan kaynaklanıyordu. Sonuçlar, yardımcı görevlerin ve HARS'nin, birleşik eşik çözümünden daha uyarlanabilir olan dış faktörlerle birlikte kaza dağılımının dinamik modelini yakalayarak muhakemeyi buna göre ayarlamayı öğrendiğini kanıtlıyor.

Şekil 6 RiskOracle'ın 22 Mayıs 2017 (Pazar) NYC tahmini

Yedi, özet

Bu makalede, şehir içi güvenlik için daha zamanında kantitatif karar verme temeli sağlamak için dakika düzeyinde şehir genelinde trafik kazası tahmini zorluğunun üstesinden gelmek için çok görevli DTGN tabanlı entegre bir RiskOracle çerçevesi öneriyoruz. Sıfır enflasyon sorununun ve seyrek algının üstesinden gelmek için önce iki strateji öneriyoruz.

Farklı özellik üreteçlerini ve çok görevli DTGN'de zamanla değişen genel afiniteyi birleştiren çerçevemiz, düzensiz uzamsal-zamansal verileri modelleme ve kısa vadeli alt bölgesel korelasyonları yakalama işlevine sahiptir.

Ayrıca, çoklu görev şemasında kazaların meydana gelme olasılığının en yüksek olduğu alanlara odaklanıyoruz ve öğrenilebilir çok ölçekli kaza dağılımıyla mekansal heterojenlikle ilgileniyoruz.

İki gerçek veri seti üzerinde yapılan deneyler, çerçevemizin en son çözümlerden daha iyi olduğunu kanıtladı. Bu nedenle, çalışmamız, suç tahmini ve salgın salgınları gibi sporadik etiketlere ve yetersiz sensör verilerine sahip uzay-zamansal veri madenciliği görevlerini çözmek için bir paradigma olabilir.

AAAI 2020 raporu:

AAAI2020, yeni koronavirüs salgını altındaki toplantılara devam edecek mi?

Amerika Birleşik Devletleri ülkeye girmeyi reddetti ve AAAI2020 yerinde katılım başarısız oldu. Kağıt nasıl paylaşılır?

AAAI 2020 Bildirileri: AAAI 2020 Kağıt Yorumlama Toplantısı @ (PPT ile indir )

AAAI 2020'de NLP'nin araştırma trendleri nelerdir?

Popüler grafik makine öğrenimi, 2020'de hangi araştırma trendleri olacak?
önceki
Today Paper | El ve nesne rekonstrüksiyonu; 3D insan pozu tahmini; görüntüden görüntüye dönüşüm vb.
Sonraki
Makine öğrenimi ve istatistik arasındaki tartışma mantıklı mı?
AAAI 2020 | Ters R? Zayıflayan göze çarpan özellikler, ayrıntılı sınıflandırmada iyileştirmeler getiriyor
Today Paper | Dinamik jest tanıma; sahadan bağımsız denetimsiz öğrenme; BERT'ye dayalı çevrimiçi finansal metin duyarlılık analizi, vb.
Microsoft'un yeni çalışması, ImageBERT iyi olmasına rağmen, on milyonlarca veri kümesi öne çıkan özellikler
Beihang ve Megvii, en güçlü gerçek zamanlı semantik segmentasyon ağını oluşturmak için birleşiyor
AAAI2020 | Otomasyon Enstitüsü'nden WeChat AI: Görsel diyalog oluşturma sorununu daha iyi çözmek için çift kanallı çok adımlı akıl yürütme modeli
Kendi kendini denetleyen öğrenme, derin öğrenmeyi veri ikileminden nasıl kurtarabilirim?
Akıllı oyuncak araba üreticisi Qishida, Hong Kong borsasında listelendi: Lamborghini'nin bu kadar para kazanmasını beklemiyordum
Çift versiyonlu modelleri tekrar deneyin, Apple iPhone 6 döneminin ihtişamını yeniden yaratacak mı?
Altındaki düşüşün sebebi nedir?
Sadece araştırmak ama araştırmamak, peki pazarlama pragmatikleri?
Mobil konferanslar sıkıcı hale geliyor
To Top