Akademisyen Gong Jianya: Yapay Zeka Çağında Ölçme, Haritalama ve Uzaktan Algılama Teknolojisinin Geliştirme Fırsatları ve Zorlukları

Özet

Yapay zeka teknolojisinin hızlı gelişimi, hayatın her kesiminde büyük bir etkiye sahip olacak. Etüt, haritalama ve uzaktan algılama, yapay zeka ile yakından ilgili bir alandır.Yapay zeka alanındaki hızlı gelişme ortamında, ölçme, haritalama ve uzaktan algılama konusu sadece iyi gelişim fırsatlarına sahip olmakla kalmıyor, aynı zamanda büyük bir disiplin kriziyle de karşı karşıya. İlk olarak yapay zeka kapsamını ve ölçme, haritalama ve uzaktan algılama ile ilgili alanları tanıttı ve ardından fotogrametri ve uzaktan algılama uygulama ilerlemesi alanında yapay zeka-makine görüsü ve makine öğreniminin iki sıcak alanını tanıttı ve son olarak uzay-zaman büyük verisine dayalı tanımayı tanıttı. Bilgi ve muhakemenin araştırma ilerlemesi, doğal ve sosyal algı, biliş ve muhakemede uzamsal-zamansal büyük veri ölçme ve uzaktan algılama uygulama olasılıklarını göstermektedir.Ekleme ve uzaktan algılama konusunun yapay zeka çağında büyük gelişme sağlayacağı umulmaktadır.

Akademide, endüstride veya kamusal hayatta olsun, yapay zeka şu anda en sıcak konu ve aynı zamanda en hızlı büyüyen alan. Yapay zekanın gelişim sürecine bakıldığında, 1956'daki Dartmouth Konferansı, yapay zeka araştırmalarının başlangıcı oldu. 60 yıllık geliştirmeden sonra, iki iniş ve çıkış oldu. Her patlama, 50 gibi yapay zeka algoritmalarında yeni bir dönüm noktasıdır. 1980'lerde sinir ağı teorisi ortaya atıldı ve geri yayılma algoritması 1980'lerde ortaya çıktı. Ve her seferinde düşük dalga, hesaplama performansı ve veri ölçeğindeki sınırlamaların pratik uygulamaların ihtiyaçlarını karşılayamamasıdır, bu da hükümetin ve yatırımın ihmal edilmesine yol açar. 2013 yılından bu yana, derin öğrenmenin temsil ettiği sinir ağı algoritması çekirdek olmuştur.Büyük veri ve grafik işleme biriminin (GPU) büyük ölçekli uygulamasıyla hareket ederek, konuşma tanıma ve görüntü tanıma alanına ulaşmış veya aşmıştır. Ortalama insan seviyesi, yapay zeka araştırmasının üçüncü zirvesini başlattı. Günümüzde insanlar, AlphaGo'nun insan Go oyuncularını mağlup etmesi, takla gibi bazı zor hareketler yapan Boston Dynamics robotları gibi yapay zeka araştırmaları ve teknolojik ilerleme raporlarını yalnızca sık sık görmekle kalmıyor, aynı zamanda zaman zaman yapay zekanın yaşam üzerindeki etkisini de hissedebiliyorlar. Evde yeni eklenen süpürme robotları, yüksek hızlı tren çukurlarının "yüzünü süpürme", cep telefonuyla anında çeviri vb. Tüm bunlar, dünyanın hızlı gelişme ve geniş kapsamlı etki ile yapay zeka çağına girdiğini ilan ediyor. Yapay zekanın hızla gelişmesi hayatın her alanında büyük bir etkiye sahip olacak.Bu değişimde birçok sektör kaybolabilir ve bazı sektörler büyük gelişme kaydedecektir. Etüt, haritalama ve uzaktan algılama, yapay zeka ile yakından ilgili bir alan.Bu arka plan altında hem gelişim fırsatları hem de büyük krizler var.Bu makale tartışmaya odaklanacak.

Yapay zeka 6 araştırma yönüne ayrılabilir. Üç boyutlu yeniden yapılandırma, örüntü tanıma, görüntü anlama vb. Dahil olmak üzere makine vizyonu; Konuşma tanıma, sentez, insan-bilgisayar diyalogu, makine çevirisi vb. Dahil olmak üzere dil anlama ve iletişim; Mekanik, kontrol, tasarım, hareket planlaması dahil robotlar, Görev planlama vb .; Çeşitli fiziksel ve sosyal sağduyunun biliş ve akıl yürütmesi dahil olmak üzere tanıma ve muhakeme; Çoklu ajanların (aracıların), robotun ve sosyal entegrasyonun vb. Etkileşimi, yüzleşmesi ve işbirliği dahil olmak üzere oyun ve etik; makine Çeşitli istatistiksel modelleme, analiz araçları ve hesaplama yöntemlerini içeren çalışma.

İlk 3 öğe, dış dünya ile temas halinde olan insan benzeri görünümlerdir. İnsanın beş duyusuna (gözler, kulaklar, burun, dil, vücut) benzer şekilde, yapay zekanın araştırma yönü üç duyuyu içerir. Makine görüşü insan gözlerine eşdeğerdir ve konuşmayı anlama ve etkileşim insan kulağına eşdeğerdir. Robotik temelde hareketli ayaklar, çalışan manipülatörler ve takla atan cisimler dahil olmak üzere akıllı robotların hareketli organlarını inceler. Son üç madde, insan beyninin işlevlerine eşdeğerdir. Biliş ve akıl yürütme, bir ajanın sahip olması gereken temel yeteneklerdir. Basit bir biliş ve muhakeme veya karmaşık gelişmiş biliş ve akıl yürütme ve biliş ve muhakeme süreçleri olabilir. Bilgisayar algoritmaları tarafından yönlendirilebilir veya doğrudan mevcut kurallar veya bilgiler tarafından yönlendirilebilir; makine öğrenimi, aracı bilgisini artırma ve aracı biliş ve akıl yürütme düzeyini iyileştirme sürecidir; oyun ve etik, yalnızca daha gelişmiş zeka değildir Temsilci ile temsilci arasındaki işbirliğinin yanı sıra insan ve temsilci arasındaki işbirliği ve entegrasyonu içerir. Bir aracı, zekanın bir veya daha fazla yönünü içerebilir. Örneğin, makine çevirisi yalnızca dil anlayışını ve makine öğrenimini içerebilir, ancak yüz tanıma makine görü, makine öğrenimi ve biliş ve muhakeme içerebilir. Bir ajan, zekanın yukarıdaki altı yönüne sahip olduğunda, güçlü zeka çağına girebilir.

Güçlü zeka çağına ne zaman girebiliriz ve güçlü zeka çağının işareti nedir, yazar bir örnek verir. Bir gün robotlar ve insanlar bir futbol maçı oynayıp kazanırsa, güçlü zeka çağının geldiği düşünülebilir. Bunun nedeni, bu tür bir rekabetin, robotların yalnızca yukarıdaki altı yönün yeteneklerine sahip olmasını değil, aynı zamanda insanları yenecek kadar gelişmiş olmasını gerektirmesidir. Yapay zekanın bu seviyeye ulaşması onlarca yıl alabilir.

Yapay zekanın geliştirilmesinde türetilen birçok teknoloji başka alanlarda da kullanılabilir ve diğer alanlarda teknolojik değişiklikleri teşvik edebilir. Akıllı teknoloji endüstrisi, makrodan mikroya çeşitli alanlarda, küresel ekonomik yapıyı yeniden şekillendirecek, yeni teknolojileri, yeni ürünleri, yeni endüstrileri, yeni biçimleri ve yeni modelleri ortaya çıkaracak ve akıllı bir ekonomi, akıllı toplum ve akıllı yaşam yaratacak yeni talepler oluşturur. Ölçme, haritalama ve uzaktan algılama, yapay zeka ile yakından ilgili bir konu alanıdır. Fotogrametri ve uzaktan algılama ve makine görmesi birçok kavram, ilke, teori, yöntem ve teknolojiye sahiptir.Bunların tümü çevreyi algılamak için kullanılan teknolojilerdir; Aradaki fark, fotogrametri ve uzaktan algılamanın esas olarak dünyayı ve doğal ortamı algılaması, makine vizyonu Temsilcinin dikkat ettiği hedefi ve ortamı esas olarak algılar, ancak matematik ve fizikteki ilkeleri temelde aynıdır. Makine öğrenimi, özellikle derin öğrenme yöntemlerinin son yıllarda hızla gelişmesi, makine görmesi, örüntü tanıma, konuşmayı anlama vb. Alanlarda yaygın ve etkili bir şekilde uygulanmıştır. Devrim niteliğinde bir teknoloji olduğu söylenebilir ve ayrıca fotogrametri ve uzaktan algılama alanlarında da yaygın olarak kullanılmaktadır. uygulama. Biliş ve muhakeme, mekansal-zamansal büyük veri madenciliği ve akıllı şehirlerde çok faydalı olacak daha geniş bir zekadır. Bu makale, ölçme, haritalama ve uzaktan algılama konularında makine görüsü, makine öğrenimi ve biliş ve muhakeme uygulamalarını tartışacaktır.

1. Yapay görme ve fotogrametri ve uzaktan algılama alanındaki uygulamaları

Makine görüşü veya bilgisayarla görme, hedefleri belirlemek, izlemek ve ölçmek için insan gözü yerine kamera ve bilgisayar kullanımını inceleyen bir disiplindir. Genel olarak, bilgisayar görüşü görüntü işleme, hedef yeniden yapılandırma ve tanıma, sahne analizi, görüntü anlama vb. İçerir. Dar anlamda, bilgisayar görüşü genellikle toplanan resimleri veya videoları, yani üç boyutlu yeniden yapılandırmayı işleyerek karşılık gelen sahnenin üç boyutlu bilgisini elde eder.

1940'larda Bell Labs'tan Julesz, herhangi bir eşitsizlik haritasının, tek bir görüntünün anlamını önceden tanımaya gerek kalmadan üç boyutlu hissi geri getirebileceğini keşfetti; bundan önce, psikologlar ve sinirbilimciler, insanların üç boyutlu algı üretmek için algılaması gerektiğine inanıyorlardı. Marr bundan yola çıkarak karmaşık sinirsel ve psikolojik süreçlerin doğrudan matematiksel hesaplamalarla ifade edilebileceğini fark etti ve üç boyutlu yeniden yapılandırma için hesaplamalı bir vizyon teorisi önerdi. 1982 yılında yayınlanan "Vision: Study in Human Visual Information Expression and Processing from Computing Perspective" adlı eserinde, iki boyutlu görüntülerin anlatımını, üç boyutlu görüntülerin yazışmasını ve yeniden yapılandırılmasını, bilgisayar vizyonunun öncüsü olan algoritmaların ve donanımların gerçekleştirilmesini detaylı bir şekilde analiz etti. İçin. 1980'ler aynı zamanda bilgisayarla görmenin ilk altın çağıydı. Canny kenar algılama, gölgelemeden şekil, Hough dönüşümü, LoG (Laplace of Gaussian), vb. Gibi birçok klasik algoritma ve operatör 1970'lerde ve 1980'lerde ortaya çıktı. Görüntü işlemeye ek olarak, erken bilgisayar görüşü ayrıca geometri ve 3D rekonstrüksiyona odaklandı. Bununla birlikte, bilgisayarlar ve dijital kameralar olgunlaşmadan önce, o zamanki fotogrametri ve bilgisayar görüşü koşulları, Marr'ın savunduğu üç boyutlu yeniden yapılandırma teorisinden hala uzaktı.

Bilgisayarla görmeye benzer şekilde, fotogrametri nesnelerin şeklini, konumunu, boyutunu, özelliklerini ve karşılıklı konumsal ilişkilerini incelemek için optik fotoğrafları kullanan bir konudur.Kısacası, fotogrametri, fotoğrafı ölçmek için bir araç olarak kullanır. amaç için. Aslında, fotogrametrinin tarihi bilgisayar görüşünden öncedir. 19. yüzyılın başlarında, Alman profesör Schultz, gümüş karışımının güneşte kararacağını keşfetti; 1839'da Fransız ressam Daguerre, gümüş plaka fotoğraf yöntemini icat etti ve dünyanın ilk gerçek kamerasını üretti; 19. yüzyılın ortalarında Fransız bir araştırmacı ve fotogrametrinin öncüsü Fourcade, stereoskopik fotoğrafların, fotogrametrinin doğuşunu teşvik eden stereo görüşü yeniden yapılandırmak için kullanılabileceğini ilk keşfetti. Takip eden uzun yıllarda, kameralar ve fotoğraflar insanların iç kısımdaki dünya yüzeyindeki üç boyutlu nesneleri yeniden inşa etmelerine yardımcı oldu ve böylece saha araştırması çalışmalarını iç mekana taşıdı. "İç iş" çalışması ana yapı haline geldi ve fotoğraflar ve fotogrametrik aletler tripodların, teodolitlerin ve cetvellerin yerini aldı ve ana araştırma nesneleri haline geldi. Havacılık teknolojisinin gelişmesiyle birlikte, havacılık araçlarına dayalı fotogrametri ortaya çıkmıştır. Birinci Dünya Savaşı'nda, ilk hava kamerası çıktı ve üç boyutlu koordinat ölçüm cihazı ve 1318 üç boyutlu haritalama cihazı, hava fotogrametrisinin teori, yöntem ve teknik sisteminin ilk oluşumunu işaret ederek kullanıma alındı. 1957'de ilk uydu uzaya fırlatıldı ve aynı zamanda uydu fotogrametrisi çağını başlattı.

1973 yılında Boyle ve Smith of Bell Labs, dijital kameralar ve dijital fotogrametri çağının doğuşuna yol açan şarj bağlı cihazı (CCD) icat etti. CCD / tamamlayıcı metal oksit yarı iletken (CMOS) dijital görüntüleme cihazlarıyla temsil edilen dijital fotoğraf teknolojisi, dijital fotogrametri teorisi ve yöntemleri üzerine araştırmaları başlatmıştır. O zamandan beri bilgisayarlar ana ölçüm aracı haline geldi ve dijital görüntüler ve fotogrametrik algoritmalar ana araştırma nesneleri olarak film ve fotogrametrik araçların yerini aldı ve mevcut dijital fotogrametrik teori, yöntem ve teknik sistemi oluşturdu. Aynı zamanda, bilgisayar görüşü de hızla gelişti ve bilgisayar alanında popüler bir yön haline geldi.

1990'lardan sonra, her iki alan da dijital görüntüleme teknolojisi ve bilgisayar teknolojisi tarafından güçlü bir şekilde desteklendi. Yalnızca geometri açısından, iki disiplin aynı teorik temele, yani küçük delik görüntüleme ve binoküler görüş ilkesine sahiptir. Ancak uygulama ve teknik detaylarda ikisi arasında farklılıklar vardır. Örneğin, dijital fotogrametri esas olarak havacılık ve uzay platformlarını kullanarak nispeten statik arazi etüdü ve haritalama için kullanılır, kullanılan kameralar genellikle profesyonel ölçüm kameralarıdır; bilgisayarla görü ise çoğunlukla sıradan kameralar, manuel ve araca monteli mobil platformlar için kullanılır. Gerçek zamanlı yeniden yapılandırma ve hedeflerin tanınması, uygulama alanları arasında yüz tanıma, robotlar ve insansız araçlar ve diğer popüler uygulamalar yer alır. Kamera kalibrasyonu gibi teknik yöntemler açısından, fotogrametri genellikle yüksek hassasiyetli üç boyutlu kalibrasyon alanları ile donatılmıştır ve bilgisayar görüşü genellikle iki boyutlu bir düzlem satranç tahtası kullanır. Havadan üçgenlemede, fotogrametri genellikle katı ışın yöntemi alan ağı ayarlamasını kullanır ve bilgisayar görüşünde genellikle hareketten yapı (SfM) olarak adlandırılır.Global ışın yöntemi ayarlamasına ek olarak, aynı zamanda Artımlı yerel ayarlama, filtreleme vb. Gibi bazı küresel olmayan çözümler; bu farklılıklar, fotogrametride daha yüksek ölçüm doğruluğu ihtiyacından kaynaklanmaktadır. Ayrıca disiplinin gelişmesi nedeniyle farklı isimler alan bazı yaklaşık eşdeğer kavramlar da vardır. Örneğin, ayarlamada brüt hata tespiti, fotogrametride ağırlık seçimi iterasyonu adı verilen yöntem ve bilgisayarla görmede ağırlık azalması yöntemi; ve normal denklemin katsayı matrisinin (yani Hessian matrisinin) tekilliğe yakın olması sorununu çözmek için bilgisayar LM (Levenberg-Marquardt) algoritması, görmede yaygın olarak kullanılır ve sırt tahmin yöntemi genellikle fotogrametride kullanılır. Genel olarak, bilgisayarla görmedeki teorinin titizliği fotogrametrininkinden daha fazladır ve algoritmaların gelişimi de çok hızlıdır.Elbette öte yandan fotogrametri mühendislik ve pratiklik açısından daha avantajlı olabilir.

Bilgisayarla görmede eşzamanlı yerelleştirme ve haritalama (SLAM) önemli bir araştırma kolu haline geldi ve robotlar ve insansız araçlar için vazgeçilmez bir teknolojidir. Erken SLAM, aynı zamanda SLAM'deki Haritalamanın da kaynağı olan lazer tarayıcıların hakimiyetindeydi; daha sonra, görsel tabanlı SLAM (Görsel SLAM) ana akım haline geldi ve çeşitli araştırma noktalarında (eşleştirme, ayarlama, vb.) Fotogrametri, özellikle gerçek zamanlı fotogrametri ile birleştirildi. Konumlandırma ve yeniden yapılandırma) ortak bir noktaya sahiptir. Aslında, Visual SLAM ilkesi, fotogrametrinin havadan üçgenlemesine benzer. Havadan üçgenleme ile SLAM arasındaki bariz fark, birincisinin, hava kamerasının 6 harici yönlendirme elemanını, yani kamera istasyonunun konumunu belirlemek için bir hava kemeri oluşturmak için bağlantı noktalarını kullanmasıdır; ikincisi, konumlandırma sırasında yoğun bir nokta bulutu oluşturur. 21. yüzyılın başlarında Amerika Birleşik Devletleri, Mars sondaları "Cesaret" ve "Fırsat" ın belirli konumlarını doğru bir şekilde ölçmek için havadan nirengi bölgesel ağ ayarlaması ilkesini kullandı. Mars yüzeyinin günlük olarak elde edilen seri görüntülerine göre, Noktaları aynı ada sahip eşleştirin ve telemetri konumunun neden olduğu hatayı düzeltmek için her kamera istasyonunun koordinat konumunu doğru bir şekilde hesaplamak için "hava kemeri" modelini oluşturun. Projenin baş araştırmacısı, o sırada Ohio Eyalet Üniversitesi'nde profesör olan Dr. Rongxing Li idi. Şekil 1, Mars Rover'ı sekans görüntülerine göre doğru bir şekilde gezinmek ve konumlandırmak için bölgesel ağ ayarlamasını kullanan Mars Rover "Cesaretinin" şematik bir diyagramını göstermektedir Mavi, telemetri pozisyonudur ve kırmızı, düzeltilmiş pozisyondur. Bu örnek, fotogrametri çalışanlarının uzun zamandır Mars robot navigasyonu ve konumlandırması için bölgesel ağ ayarlama yöntemini, yani Görsel SLAM'ı benimsediğini göstermektedir.

Şekil 1 Mars robotunda gezinmek ve yerini belirlemek için bölgesel ağ ayarlama yöntemini kullanma

Fotogrametri ve bilgisayarla görmenin prensipler, yöntemler ve uygulamalarda birçok benzerliği olduğu görülebilir. 21. yüzyıla girdikten sonra, ikisinin entegrasyon hızı daha da iyileştirildi ve aralarındaki teknik kesişme, drone ve araca monteli mobil platformdur. Fotogrametrinin önemli bir gelişme yönü, yolları ve sokak sahnelerini toplamak için kullanılabilen yer mobil ölçüm sistemidir; bilgisayar görüşü aynı zamanda yol bilgilerinin çıkarılmasına ve yeniden yapılandırılmasına odaklanır ve robotlarda, şehir haritalarında, akıllı ulaşım ve otonom araçlarda kullanılır. Aynı zamanda, drone hava fotoğrafçılığı teknolojisi, fotogrametride sadece kullanışlı ve hızlı bir ölçüm teknolojisi değil, aynı zamanda bilgisayar görüşünün gelecekteki odağıdır.

Bilgisayar görüşü alanındaki araştırma akademisyenlerinin bir araya gelmesi ve geniş uygulama yelpazesi nedeniyle, çok sayıda yeni teori ve yeni yöntemler geliştirilmiştir. Fotogrametri çalışanları, bu teknolojik değişimde yeni teknolojileri benimsemeli, sınır ötesi entegrasyonu öğrenmeli, avantajlarını oynamalı ve bilgeliklerine katkıda bulunmalı, böylece disiplinleri yenilmez olabilsin ve aynı zamanda diğer disiplinlerle birlikte ilerleyin. Akıllı bilimin gelişimi.

Yerli bilim adamları, anket, haritalama, uzaktan algılama ve bilgisayar vizyonunun çapraz entegrasyonunu teşvik etmek ve yapay zeka alanındaki teknolojik eğilime ayak uydurmak için aktif eylemler yapmak için özel bir yapay zeka araştırma ekibi oluşturdu. Şekil 2, Wuhan Üniversitesi tarafından geliştirilen sürücüsüz arabaları ve robotları göstermektedir. İnsansız araç teknolojisinin insansız trafik için kullanılabilmesine ek olarak, insansız haritalama için önemli bir uygulama. Aracın kendisinin navigasyonu ve konumlandırılması için kullanılmasının yanı sıra, sürücüsüz araca monte edilen çeşitli sensör ekipmanları, otomatik ölçüm için yol ve çevre çevre bilgilerini de otomatik olarak alabilir. Akıllı robotlar, özellikle kömür madenlerinde yer altı ölçümü gibi zor ve tehlikeli alanlarda, iç ve dış ölçümlerde de yaygın olarak kullanılacaktır. Bir yandan ölçme, haritalama ve uzaktan algılama uzmanları yapay zeka gelgitinde yapay zeka teknolojisinin gelişimine katılırken, diğer yandan yapay zeka teknolojisinin ilerlemesi, ölçme, haritalama ve uzaktan algılama teknolojisinde daha derin değişiklikleri teşvik edecek.

Şekil 2 Wuhan Üniversitesi tarafından geliştirilen sürücüsüz arabalar ve kapalı alan akıllı robotlar

2. Makine öğrenimi ve fotogrametri ve uzaktan algılama alanındaki uygulamaları

Yapay zekanın mevcut gelişiminin önemli bir yönü makine öğrenmesidir. John McCarthy, 1955'te yapay zeka kavramını önerdiğinden beri, makine öğrenimi yapay zekanın önemli bir yönü olmuştur. Makine öğreniminin temel ilkesi, veriler ve kategoriler arasında doğru veya optimum eşlemeyi elde edebilecek belirli bir işlevi bulmaktır. İstatistiksel öğrenme fikri sadece makine öğreniminde uzun süredir kullanılmamakta, aynı zamanda denetimli ve denetimsiz hedef tanıma ve sınıflandırma yöntemleri gibi fotogrametri ve uzaktan algılama alanında da yaygın olarak kullanılmaktadır. Uzaktan algılama görüntülerinin geleneksel istatistiksel öğrenmeye ve klasik sinir ağı yöntemine dayalı denetimli ve denetimsiz sınıflandırmasının araştırma ilerlemesi çok yavaş olmuştur ve hedef tanımanın doğruluğu ve sınıflandırma doğruluğunu büyük ölçüde iyileştirmek zordur.Makine öğrenimi bu durumu etkili bir şekilde değiştirmiştir.

2006'da Hinton'un araştırması, katman katman açgözlü bir algoritmanın kullanımının derin nöron ağlarının eğitimini sağlayabileceğini gösterdi ve derin öğrenme kavramı ortaya çıktı. Derin öğrenme algoritmalarının atılımı, LeCun Yann, Bengio Yoshua ve Hinton Geoffrey'in derin evrişimli ağlardaki olağanüstü çalışmasından geliyor. Görüntünün soyut özelliklerini, aslında derinlemesine algoritma tasarımcısının deneyimine bağlı olan çok katmanlı derin evrişim işleme yoluyla çıkarırlar. Mevcut araştırma ilerlemesi, derin bir ağı eğitebildi, farklı hedef görevlere göre farklı özellikler seçebildi ve yapay zeka yöntemleri ve uygulamalarında atılımlar gerçekleştirebildi. 2012 yılında, ImageNet Challenge'da derin öğrenme yöntemi birinci oldu ve geleneksel makine öğrenimi yöntemini tek seferde yüzde 10 puan aştı; ikinci ve dördüncü sıra arasındaki fark, geleneksel yöntemin tavanını göstererek% 1'den fazla değildi. Sonraki deneyler, derin öğrenmenin görüntü sınıflandırma, nesne tanıma, konuşma tanıma, uzaktan algılama uygulamaları ve öğrenme ve anlambilimle ilgili diğer araştırma alanlarında üstünlük sağladığını ve derin öğrenme çağının başladığını göstermiştir.

Doğal dil işlemeye (NLP) ek olarak, derin öğrenmenin en önemli uygulaması, el yazısı yazı tipi tanıma, doğal görüntü sınıflandırması ve hedef bulma gibi görsel imgelerdedir. Derin öğrenme, yüz tanıma, robotlar ve sürücüsüz araçlar gibi ilgili teknolojilerin güçlü bir şekilde geliştirilmesini teşvik eden bilgisayar görüşü alanında yaygın olarak kullanılmaktadır. Fotogrametrinin araştırma nesnesi aynı zamanda görsel imgeler olduğu için fotogrametri, derin öğrenmenin gelişiminden en çok yararlanan konulardan biri haline gelmiştir.

Fotogrametrinin iki ana görevi, hedef geometrik konumlandırma ve 2D fotoğraflardan 3D geometrinin yeniden yapılandırılması ve özelliklerin sınıflandırılması dahil olmak üzere öznitelik çıkarımıdır. Derin öğrenmenin geometrik konumlandırmaya uygulanması henüz fotogrametri araştırma alanına girmemiştir, ancak SfM ve SLAM gibi yakından ilişkili bilgisayarla görme alanlarında ortaya çıkmıştır. Bununla birlikte, derin öğrenme yöntemlerinin konumlandırma doğruluğu şu anda geleneksel yöntemlerle karşılaştırılamaz, bu da yaklaşık olarak farklıdır. 3B rekonstrüksiyon yoğun eşleştirmedeki anahtar teknoloji için derin öğrenme, iyi uygulama sonuçları elde etmiştir. Örneğin, KITTI gibi standart veri setlerinde en iyi 10 yöntem, derin öğrenme yöntemlerinin uygulama potansiyelini gösteren derin öğrenme yöntemleridir.

Fotogrametri alanında derin öğrenmenin bir diğer önemli görevi, yani görüntülerin anlamsal çıkarımı, önemli ilerleme kaydetmiş ve yaygın olarak kullanılmaya başlanmıştır. Görüntü tabanlı binalar ve yol ağları gibi özelliklerin çıkarılması onlarca yıldır sıcak bir konu olmuştur. Klasik yöntem belirli sonuçlar elde etmiş olsa da, pratik, piyasa ve ticari yazılımlardan hala uzaktır. Evrişimli sinir ağı (CNN), yol ağı çıkarmanın ana yöntemi haline geldi. Literatür, kademeli uçtan-uca CNN yoluyla yol ağı çıkarımı ve yol merkez hattı çıkarımını aynı anda gerçekleştirir Diğer yöntemlerle karşılaştırıldığında, sınıflandırma doğruluğu daha yüksektir. Literatür, ağaç gölgeleri ve ev gölgelerinin neden olduğu yol ağındaki eksikliğin üstesinden gelmek için çizgi integral evrişimle birlikte CNN'yi kullanır. Literatür, denetimsiz öğrenme ön işleme ve uzamsal korelasyon uygulaması yoluyla karmaşık kentsel sahnelerin yol çıkarma doğruluğunu büyük ölçüde iyileştirmek için derin öğrenmeyi kullanır. Literatür, binaları yüksek çözünürlüklü multispektral uydu görüntülerinden çıkarmak için CNN kullanır. Literatür, görüntünün uzamsal ve spektral özelliklerini çıkarmak ve rastgele orman ve tamamen bağlı NLP'den daha iyi ürün sınıflandırma doğruluğu elde etmek için görüntü düzleminde iki boyutlu evrişim ve spektral yönde tek boyutlu evrişim gerçekleştirir. Xiao Zhifeng ve diğerleri, gökyüzü haritasındaki yüksek çözünürlüklü uzaktan algılama görüntülerinde anlamsal erişim gerçekleştirmek için derin öğrenme yöntemlerini kullandılar ve% 90'ın üzerinde bir doğruluk oranıyla 37 tür yer nesnesini alabildiler. Şu anda, derin öğrenme, uzaktan algılama görüntülerinin sınıflandırılması, tanınması, geri çağrılması ve çıkarılmasında yaygın olarak kullanılmaktadır ve temelde anlambilim açısından geleneksel yöntemleri ezmiştir. Tablo 1, Xiao Zhifeng ve diğerleri tarafından geliştirilen derin öğrenme yöntemine dayanan uzaktan algılamalı görüntü içeriği alma sistemini göstermektedir. Tablo 1'den görülebileceği gibi, burada kullanılan derin evrişimli sinir ağına dayanan uzaktan algılama görüntü özelliği çıkarma yönteminin (derin evrişimli sinir ağı, DCNN) geri çağırma ve doğruluğu, geleneksel LBF-HF'den (yerel ikili model histogramı) çok daha yüksektir. Fourier) ve EFT-HOG (yönelimli gradyanların eliptik Fourier dönüşüm histogramı) yöntemleri, doğrulukları% 20 ~% 30 daha yüksektir.

Tablo 1 Derin öğrenme ve geleneksel yöntemler kullanılarak görüntü içeriği alma yöntemleri arasındaki doğruluk karşılaştırması

Derin öğrenmeye dayalı yöntemler, uzaktan algılama görüntü sınıflandırma ve hedef bulma için etkin bir şekilde kullanılmasının yanı sıra, diğer fotogrametri ve uzaktan algılama veri işlemede de geniş bir uygulama alanına sahiptir. Örneğin, Hu Xiangyun ve diğerleri ışık algılama ve menzil (LiDAR) nokta bulutu veri işleme için derin öğrenme yöntemlerini kullandı. Dağ orman alanlarında nokta bulutu veri filtreleme, nokta bulutu verilerinden dijital yükseklik modellerinin çıkarılması, otomasyona ulaşmak zordur ve genellikle çok fazla insan gücü ve malzeme kaynağı tüketen insan-bilgisayar etkileşimi gerektirir. Şu anda ekip, insan-bilgisayar etkileşimi sürecinde eğitim almak, bilgiyi öğrenmek ve bunu nokta bulutu verilerinin otomatik olarak işlenmesine uygulamak için makine öğrenimi yöntemlerini kullanıyor. Otomatik işlemenin doğruluğu% 95'in üzerine çıkarak iş verimliliğini büyük ölçüde artırıyor. Şekil 3, Guangdong'da belirli bir yerin nokta bulutundan çıkarılan topografik kesiti göstermektedir Alanın oldukça karmaşık olduğu ancak derin öğrenme ile elde edilen zemin modeli kesiti hala oldukça doğrudur (kırmızı eğri). Bu, derin öğrenme yönteminin nokta bulutu verilerinin otomatik olarak işlenmesinde iyi bir uygulama olasılığına sahip olduğunu göstermektedir. Aynı şekilde, derin öğrenme yöntemleri de ölçme ve haritalama alanının diğer yönlerinde, özellikle de görüntü değişikliği tespiti ve harita sentezi gibi insan-bilgisayar etkileşimi veri işlemeyi gerektirenleri daha akıllı ve otomatik hale getirmek için önemli bir rol oynayacaktır.

Şekil 3 Derin öğrenme yöntemi, dijital yükseklik modelini otomatik olarak çıkarmak için nokta bulutu veri filtrelemesine uygulanır.

3. Uzay-zaman büyük verisine dayalı biliş ve muhakeme

İnsan-makine-şeylerin üçlü dünyası (fiziksel dünya, insan toplumu, bilgi alanı), Şekil 4'te gösterildiği gibi, birden çok insan, birden çok makine ve birden çok şeyden oluşan dinamik ve açık bir ağ toplumudur. Bu üçlü dünyada bir yandan insanlar fiziksel dünya hakkında bilgi edinmek için anket, uzaktan algılama, saha araştırmaları ve son zamanlarda ortaya çıkan sensör ağ teknolojisini kullanırken, diğer yandan insanlar sosyal anketler ve son yıllarda ortaya çıkan internet ve akıllı telefonlar kullanıyor. İnsanların sosyal ve ekonomik bilgilerini elde etmek için navigasyon ekipmanları, giyilebilir cihazlar ve gözetim videoları. Bu bilgi, çeşitli devasa mekansal-zamansal büyük veriler oluşturur. Bu veriler, aynı zamanda yapay zekanın misyonlarından biri olan fiziksel dünya ve insan toplumu hakkında biliş ve akıl yürütme kaynağı haline gelir ve karar vermeye yardımcı olmak için kullanılan gelişmiş zekadır.

Şekil 4 Fiziksel dünya, insan toplumu ve bilgi alanı arasındaki ilişki

Yapay zeka alanındaki bilgisayar görüşü ve derin öğrenme gibi nispeten eksiksiz teorilerden ve yöntemlerden farklı olarak, fiziksel dünya ve insan sosyal bilişi ve muhakeme için yapay zeka teorileri ve yöntemleri hala çok olgunlaşmamış ve parçalanmış durumda. Ancak bu, insanların yapay zeka çerçevesinde akıllı şehirler ve akıllı toplulukların araştırma ve uygulamasını yapmak için büyük veri analizi yöntemlerini kullanmasına engel olmuyor.

Onlarca yıllık geliştirmeden sonra, coğrafi bilgi sistemi nispeten eksiksiz bir mekansal analiz teorisine ve yöntem sistemine sahiptir. Bununla birlikte, mekansal-zamansal veri analizi ve sensör ağları ve sosyal algılama cihazları ile madencilik teorisi ve yöntemleri yeterince olgun değildir ve şu anda hızlı bir gelişim geçirmektedir.

Uzamsal-zamansal veriler iki farklı türe ayrılabilir. Birincisi, yeryüzünün ve çevrenin özelliklerini yansıtan uzaktan algılama ve yer sensörü ağlarının araştırılması ve haritalanmasından elde edilen uzamsal-zamansal verilerdir; diğeri ise İnternet, akıllı telefonlar, navigasyon ekipmanı dahil sosyal algılama cihazlarından ve Giyilebilir cihazlar, video gözetim ekipmanları ve sosyal araştırmalarla elde edilen mekansal-zamansal veriler, esas olarak insan faaliyetlerini ve sosyoekonomik özellikleri yansıtır. İlk veri türü nispeten standartlaştırılmıştır ve sayısal analiz ve hesaplama için uygundur, bu nedenle matematiksel modeller genellikle simülasyon ve tahmine dayalı analiz için kullanılır. Örneğin, Chen Nengcheng ve diğerleri, Yangtze Nehri Havzasında bir Dünya gözlem sensörü ağ sistemi kurmak için havacılık uzaktan algılama ve sensör ağı entegrasyon teknolojisini kullandılar. Havacılık uzaktan algılama verileri ve temel coğrafi bilgi verilerine ek olarak, sistem ayrıca meteoroloji, hidroloji ve seyrüsefer yardımcılarını da içerir. Zemin sensörü ağından, 32 çeşit toprak nemi dahil on binlerce gerçek zamanlı veri var. Bu gerçek zamanlı dinamik veriler sayesinde, havzadaki rezervuarların ve nehirlerin su seviyesini, su hacmini, tortusunu ve nehir kanallarını analiz etmek ve tahmin etmek, akıllı su koruma dağıtımını gerçekleştirmek ve su depolama ve enerji üretimi, taşkın kontrolü ve kuraklığa dayanıklılık için karar desteği sağlamak mümkündür. Şekil 5, Yangtze Nehri Havzasındaki gökyüzü-dünya gözlem sensör ağının şematik bir diyagramıdır.

Şekil 5 Yangtze Nehri Havzasındaki gökyüzü yerden yere gözlem sensör ağının şematik diyagramı

Sosyal algılama cihazlarından gelen uzamsal-zamansal veriler, daha çeşitli yapılara ve formlara sahip yeni bir veri türüdür. Örneğin, İnternet verileri esas olarak multimedya metin verileridir, navigasyon izi verileri akış noktası koordinat verileridir, video gözetim verileri görüntü verileridir ve akıllı telefon verileri metin, nokta koordinatları ve görüntüleri içerir. Bu veriler karmaşık ve çeşitlidir, bazıları açık uzay-zamansal etiketlere sahiptir ve bazıları uzay-zamansal etiketler eklemek için analiz ve işleme gerektirir. Şu anda, bilgisayar uygulamaları, ölçme ve uzaktan algılama, coğrafi bilgi bilimi, şehir planlama ve yönetim vb. Dahil olmak üzere birçok alandaki akademisyenler, sosyal algının mekansal-zamansal verileriyle ilgileniyorlar.Verinin sosyal bilim ve bilginin kesişme noktasında ortaya çıkan bir konu olduğuna ve bunun bir yapı olduğuna inanıyorlar. Akıllı şehirler ve akıllı topluluklar için etkili araçlar.

Sosyal algı mekansal-zamansal veriler, karmaşık sosyal ağ ilişkilerinin yanı sıra çok kaynaklı, heterojen ve büyük verileri içerir. Toplumsal algı için mekansal-zamansal veri analizi yöntemleri temel olarak aşağıdaki yönleri içerir: Veri ön işleme: veri temizleme, veri entegrasyonu, veri azaltma, veri dönüşümü; Mekansal-zamansal analiz: zaman serisi analizi, uzamsal otokorelasyon analizi, uzamsal kümeleme analizi; Ağ analizi: ağ inşası, öğrenme ve keşif; mekansal-zamansal madencilik: metin madenciliği, özellik oluşturma, öğrenme ve bilgi modeli çıkarma. Zamansal ve mekansal veri analizi ve madencilik yoluyla insan sosyal faaliyetlerinin ve davranışlarının yasalarını ortaya çıkarın. Şekil 6, Fang Zhixiang ve diğerlerinin, Shenzhen sakinlerinin faaliyet alanının ana alanlarını ve etkin noktalarını özetlemek için (Şekil 6 (a)) ve topluluğun sınırlarını tespit etmek (Şekil 6 (b)) için Shenzhen sakinlerinin cep telefonlarının mobil konum bilgilerini kullandığını göstermektedir. Şehir sakinlerinin sosyal davranış ve faaliyet kurallarını ortaya çıkarmak için büyük sosyal algı verilerini kullanmak, yüz tanıma, üç boyutlu modelleme, dil çevirisi vb.'den daha karmaşık ve gelişmiş yapay zekadır.

Şekil 6 Cep telefonlarının konum bilgilerine dayalı olarak Shenzhen sakinlerinin ana faaliyet alanlarını, merkezlerini ve topluluk sınırlarını ortaya koyuyor

4. Sonuç

Yapay zeka, teknolojik ve endüstriyel bir devrimi başlatıyor. Araştırma, haritalama ve uzaktan algılama, yapay zeka teknolojisinin hem faydalanıcıları hem de katkıda bulunanları. Fotogrametri, statikten dinamiğe ve gerçek zamanlıya geçer ve bilgisayar vizyonuyla derinlemesine bütünleşir; uzaktan algılama, görüntü yorumlama ve otomatik bilgi çıkarma sorunlarını çözmek için yapay zeka teknolojisini kullanır; İnternet, Nesnelerin İnterneti ve sensör ağları tarafından elde edilen devasa uzay-zamansal veriler yapay zekanın kanıdır. , Makine öğrenimi, akıllı karar ve hizmet için destek sağlayın. Bu makale ilk olarak fotogrametri ve makine vizyonunun tarihçesini gözden geçiriyor ve ikisi arasındaki yakın bağlantıyı analiz ediyor. Ardından, derin öğrenme ve evrişimli sinir ağlarının temel fikirleri tanıtılır; fotogrametri ve uzaktan algılama, bilgisayarla görme, makine öğrenimi ve diğer alanlardaki ilgili gelişmelerin yanı sıra, uzaktan algılamalı görüntü hedef alma ve lazer yüksekliği ölçüm veri işlemede derin öğrenme uygulamaları analiz edilir. Uygulama; Son olarak, doğal ve sosyal biliş ve muhakeme için anket, haritalama, uzaktan algılama ve sosyal algılama yöntemleriyle elde edilen mekansal-zamansal verilerin potansiyeli analiz edilerek, havza ve kentsel akıllı yönetim ve mekân-zamansal büyük veriye dayalı analiz uygulaması tanıtılmaktadır.

Fotogrametri çalışanları ister sadece mevcut derin öğrenme yöntemlerini kullanıyorlar, ister yeni uzaktan algılama derin öğrenme ağları oluşturuyorlarsa, yapay zekanın hızlı gelişimi ile karşı karşıya kalan fotogrametri çalışanları; sosyal algı bilgisinin ölçme ve uzaktan algılama ile nasıl ilişkili olduğu Bilgi füzyonu, doğal fiziksel alanın gelişimini ve insan sosyal davranış ve faaliyetlerinin yasalarını ortaya çıkarmak ve daha gelişmiş ve karmaşık yapay zeka geliştirmek için kullanılır; bunlar, anket, haritalama ve uzaktan algılama çalışanlarının karşılaştığı yeni görevler ve zorluklardır.

Kaynak: "Wuhan Üniversitesi Dergisi · Information Science Edition" 2018-12

Tahliye etmek çok mu zor? Gel! Para kaybetmeden kar sağlayan 5 pazarlama çözümü sunun!
önceki
Askeri İnceleme | "Savaşçı" ile "Şişman Kız", saldırıda el ele ver!
Sonraki
Yeterince cesursan gel! Çin'deki en heyecan verici eğlence projelerinden kaçını oynamaya cesaret edersiniz?
Odaklanma Japonya'nın Güneybatı Denizi'ndeki hava sahası keşif ve erken uyarının temel düğümü: Kumejima Radar İstasyonu
Singapur'un fiyatları yüksek olduğu söyleniyor ve size 5 SGD'den fazla olmayan yemek rehberi veriliyor!
3 arabaya çarpan bir kişi öldü! Arabada sürücü yok mu? Kazanın gerçeği utanç verici
360 çeşit süslü gezgin ayarı, hangisisin?
Sabah ikide bir telefon bir hayat kurtardı: Ölme, seni seviyorum
Beklenmedik bir şekilde, güveç yemek ve sadece ne tür bir içecek içeceğinizi sormak büyük bir karışıklığa neden olabilir
Simuwuding, Shang Hanedanlığı'nın son dönemlerinde ortaya çıkarılan en büyük ve en ağır bronzdur.
Harry Megan'ın yüzyılın düğünü tek kelimeyle çok kısa! Gözlerimi doğruladım, doğru insanla tanıştım
400 metrelik engelli yol-hayatın yolu
Sınıf Matematik çok ilginç çıkıyor, bir dizi resim düşüncenizi uyandırıyor!
Görüş: Messi, tarihte saf futbol teknolojisinde ilk olmasına rağmen, sermayenin kurbanı oldu!
To Top