Devasa 3D görüntü veritabanı, ev robotunu bize yaklaştırıyor

Robot teknolojisi her geçen gün değişiyor.Yazılımda yapay zeka teknolojisinin sıçraması veya donanım sistemlerinde görünüm tasarımı ve uygulanan malzeme teknolojisinin ilerlemesi olsun, robotların hayatımızı daha büyük ölçüde etkileyeceğini gösteriyor.

Ancak, robotlar ev hayatına girmeden önce, yine de bir beceride ustalaşmaları gerekir "Bilmek" -Odadaki her türlü nesneyi tanıyabilmeli, en azından masa neyin beşik olduğunu ayırt edebilmelidir. Bu, çoğu robotun sahip olmadığı bir işlevdir.

Bir şeyleri nasıl bildiğimizi düşünelim. Gençken, annem ve babam bize çocukların bilgi kartlarını gösterdiler ya da bize bunun ne olduğunu anlatmak için doğrudan bazı nesneleri gösterdiler. Ve bu aslında bir veri girişi ve sonra öğrenme sürecidir.

Bugün Stanford Üniversitesi, Princeton Üniversitesi ve Münih Teknik Üniversitesi, robot tanımlama için veri girişi olarak kullanılabilecek üç boyutlu bir görüntü veri tabanını ortaklaşa başlattı.

Veritabanı "ScanNet" olarak adlandırılır ve sehpalar, kanepeler, lambalar ve televizyonlar gibi açıklamaları olan çok sayıda nesne dahil olmak üzere binlerce oda manzarası içerir. Stanford Üniversitesi tarafından beş yıl önce bağımsız olarak oluşturulan iki boyutlu görüntü veritabanı "ImageNet" sayesinde "ScanNet" piyasaya sürüldü.

Farklı boyutlara ek olarak, ikisi genellikle çok benzerdir ve resimler ayrıca her nesne için notlar içerir. Ancak "ScanNet" açıkça robotlar için daha fazla veri desteği sağlayabilir.

Münih Teknik Üniversitesi'nden Profesör Matthias Neissner, veritabanının geliştiricilerinden biridir. Hem "ImageNet" hem de "ScanNet" için yüksek bir değerlendirme yaptı: "'ImageNet' Birçok önemli bilgi, özellikle resimdeki nesnelerin açıklamaları.

Bir bütün olarak veri tabanı, yapay zekanın geliştirilmesi için bir ön koşul sağlar. Ancak "ScanNet", robotunuzun evdeki nesneleri ve yapıları tanımasına gerçekten yardımcı olabilir. "

Şekil | Her odayı fotoğraflamak için hazır bir 3-D tarayıcı kullanın

Bundan bahsetmişken, Profesör Nesner hala "ScanNet" in temel figürü ve bu farklı geliştirme ekibi neredeyse onun yüzünden. "ScanNet" i geliştirirken, Stanford Üniversitesi'nde akademik bir ziyaret yapıyordu ve "ImageNet" in derin öğrenmedeki uygulamasını inceledikten sonra, bilgisayarı üç boyutlu bir sahne ile eğitmenin daha iyi olacağını hissetti.

Bu, "ScanNet" veritabanının orijinal fikridir. Yakınlık ilkesine göre, hemen öğrencilerini - Stanford Üniversitesi'nde doktora öğrencisi Angela Dai'yi ve Princeton Üniversitesi'nden Thomas Funkhauser'i ( Thomas Funkhouser) Profesör. Profesör Thomas Funkhauser'in öğrencileri daha sonra araştırma ekibine katıldı.

Bugün, "ScanNet" tamamen başlatıldı ve bir veritabanı oluşturma yöntemi araştırma ekibi tarafından özetlenip analiz edildi ve Hesaplama Araştırma Deposu (CoRR) üzerine bir makale şeklinde yayınlandı.

Veritabanının oluşturulması her zaman veri toplama ile başlar , Araştırma ekibi öncesi ve sonrası 1513 odayı örnekleyip analiz etti ve tüm sahneyi çekmek için "Microsoft Kinect" benzeri bir 3D kamera kullandı. Kamera iki bölümden oluşuyor - Normal bir kamera ile Kızılötesi alan derinliği probu , Üç boyutlu sahneler çekebilme. Ardından, araştırma ekibi çekim sahnesindeki nesneleri işaretledi ve not aldı.İşlem çok rahattı ve iPad üzerinden yapılabilirdi.

Aynı zamanda araştırma ekibi, çekim sahnesini sayısallaştırmak için üç boyutlu veri rekonstrüksiyonu (3B Yeniden Yapılandırma) ve nesne segmentasyonu (Segmentasyon) kullandı. Son olarak, ek açıklama bilgilerini sahne verileriyle birleştirmek için kitle kaynaklı platform Amazonun Mechanical Turk kullanılıyor. Bu şekilde 1513 oda, eğitim robotları için küçük kartlar haline geldi.

Şekil | ScanNet'in görüntü verisi işleme akış şeması

Sektördeki çalışanlar yüksek bir "ScanNet" değerlendirmesine sahiptir. Brown Üniversitesi'nden ev robotları üzerine çalışan bir yardımcı doçent olan Stefanie Tellex (Stefanie Tellex), "ScanNet" tarafından sağlanan veri miktarının emsalsiz olduğuna inanıyor ve şunları söyledi: "Bu kadar büyük bir veri tabanının başlatılmasının önemi dikkat çekicidir. Çünkü Üç boyutlu veriler, robotun tanınması ve çevre ile etkileşimi için çok önemlidir , "ScanNet" in ortaya çıkışı tam da doğru zamandır. "

Carnegie Mellon Üniversitesi Robotik Enstitüsü'nden Profesör Siddhartha Srinivasa, "ScanNet" veritabanının kullanılmasının robotların ev sistemine girmesine yardımcı olacağına inanıyor ve "ScanNet" in kopyalayabileceğini "söyledi. ImageNet "başarılı mod.

"ImageNet", veritabanının kendisinin, özellikle web sayfalarının uygulanmasında, her ikisi de başlatıldığında "ScanNet" özellikleri olan her şeyi kapsayan ve görüntü açıklama işlevlerine güveniyordu.

Şekil | Farklı renklerde açıklamalı öğeleri gösteren bir oda

Veritabanının uygulanmasıyla ilgili olarak Profesör Nesner, araştırma ekibinin bunu derin öğrenmeye düşündüğünü ve uygulamaya çalıştığını ve bilgisayarın birçok nesneyi yalnızca "ScanNet" tarafından sağlanan boyut ve şekil bilgileriyle tanıyabildiğini söyledi.

Bu, üç boyutlu bilginin bilgisayarlara ve hatta bize gerçek dünyayı daha derinlemesine anlayabileceği anlamına gelir. Profesör Nesner şaka yollu bir şekilde şunları söyledi: "Üç boyutlu bilgi kullanmak, bilgisayarların hayvanlar gibi nesneleri tanımasına olanak sağlayabilir."

Aslında, üç boyutlu bir görüntü veritabanı olarak "ScanNet", yalnızca üç boyutlu verileri depolamakla kalmaz, aynı zamanda görüntüdeki her nesnenin bilgilerini kaydeder, bu da daha yüksek bir bilgi boyutu oluşturur ve bilgiyi daha üç boyutlu hale getirir. .

Tabii ki yapay zeka ve robotlar için Verilerdeki bilgi miktarı doğal olarak ne kadar fazla olursa o kadar iyidir Bilginin genişlediği dünyada bile bilgiye olan talep artıyor. "Açıklamalı üç boyutlu görüntüler", şu anda şekillenmekte olan artırılmış gerçeklik teknolojisi gibi kesinlikle yeni bilim ve teknolojiyi oluşturacaktır.

Bu nedenle, robotik ve inşaat alanındaki uygulamalar dışında diğer alanlarda çok az 3D veri tabanı uygulaması olsa da, yeni uygulamalar kesinlikle birbiri ardına ortaya çıkacaktır.

En "kısa ömürlü" vivo cep telefonu doğduğunda bir top yemiydi ve sadece 7 ayda raftan kaldırıldı!
önceki
2018 Dayin Ligi tutkuyla sona erdi, "kara at" Southwest Üniversitesi şampiyonluğu kazandı
Sonraki
Yang Zirong "Dağ Heykelini" canlı yakaladı ve bugün 72. yıldönümü
"Büyük değişim" reformu ve açılış sergisi üst düzey reform tasarımını nasıl yansıtıyor?
Z3 yeşim versiyonu ile karşılaştırıldığında, Apple XS "Gold Inlaid Jade" sadece zayıftır! Netizen: Rengi affedin!
Üç "en güzel" vivo amiral gemisi telefonu, biri diğerinden daha çarpıcı, en ucuzu ise sadece 1.000 yuan!
Redmi 855 geliyor: kaldıran lens + ekran parmak izi + süper pil ömrü, fiyat dokunaklı!
Piyasaya sürüldüğünde ilk satılan en "kısa ömürlü" vivo cep telefonu sadece 7 ayda unutuldu!
Gizlilik ve teknoloji arasındaki oyun! Sizi izleyen mobil uygulamalar nasıl "anti-izlenir"?
40 akademisyen, teknolojik inovasyonla yüksek kaliteli gelişimi hızlandırmak için Wuhan Bilim ve Teknoloji İnovasyon Konferansı'nda bir araya geldi
Cui Yongyuan'ın Değişimi: Ev sahipliği yapmak depresyona girmesine neden oldu; girişimcilik onu "deli" etti
Kampüste özellikle popüler olan 4 bin yuan makine gecikmeden sorunsuz tavuk yiyip, 3 performansla da fotoğraf çekiyor!
Bitcoin 1.500 ABD dolarını aşmak için yükseldi, ABD endüstrisi 350 kat fırlayacağını tahmin ediyor?
OPPO Reno 10x zoom versiyonu onaylandı, fiyatı 5.000 yuan, Huawei P30'a savaş ilan etti!
To Top