2 ton Lego tuğlasını sıralamak için büyük inek bir GPU sinir ağı kurdu

2 ton Lego tuğlasını tasnif etme zorluğuyla karşı karşıya kalan bu adam, "tam otomatik Lego sıralama" elde etmek için GPU tabanlı bir sinir ağı kurdu.

Pek çok insan için, özellikle bilim ve mühendislik öğrencileri için, Lego tuğlaları çocukluğun en güzel anılarından biri olarak kabul edilebilir. Renkli temel bölümler, sonsuz yaratıcılık, bir çocuk için sınırın hayal gücüyle belirlendiği söylenebilir!

Aslında birçok kişi Lego alışkanlığını özellikle yurt dışında yetişkin yaşama getirmiştir.

Bugün bahsettiğimiz ana karakter, bilim ve teknoloji danışmanı Jacques Mattheij tam da "büyük bir oyuncu". Çukura girdikten kısa bir süre sonra, Ebay'de birkaç dökme Lego tuğlasının ihalesine körü körüne katıldı ve bir sabah uyandı ve aniden bir gecede toplam 2 ton dökme Lego satın aldığını keşfetti.

Şekil 2 ton Lego kavramı nedir? Bay DT daha önce söylemedi, belki de böyledir

2 ton sıralanmamış, karışık yapı taşlarıyla karşı karşıya kalan Mattheij, onları kesinlikle oraya koyamaz. Ancak manuel sınıflandırma tamamen imkansızdır (bir Lego tuğlasının ortalama ağırlığı 5 gram ve 2 ton 400.000 tuğladır). Bu nedenle büyük bir teknoloji uzmanı olan Mattheij, teknolojinin gücünü kullanmayı tercih etti.

İlk önce bir ayırma cihazı yapması gerekiyor. Bu kısım biraz zor olsa da teknik içeriği yüksek değildir: bir kayış, blokları kutudan taşıma bandına getirecektir; taşıma bandı, blokları tanımlama için bilgisayara bağlı bir mikroskoba getirecektir; tanımlandıktan sonra, bir Hava tabancası blokları ilgili kutulara üfleyecektir.

Şekil Lego blok aktarım cihazı

Şekil Lego tuğlalarının üfleme sınıflandırma cihazı

Mattheij'in sisteminde, en zor adım elbette "tanımlama" dır. Üstesinden gelmesi gereken ilk şey, algoritma bile değil, yapı taşlarını doğru bir şekilde nasıl fotoğraflayacağıdır. Örneğin, bazı bloklar çok uzun ve aynı anda fotoğraflanamayacak kadar büyük; bazı blokların renkleri arka plana çok benziyor vb. Görüntünün otomatik birleştirme ve kesme programında birkaç hafta hata ayıkladıktan sonra, sonunda her türden bloğu çekmeyi başardı.

Şekil Bu yapı bloğunun resmi iki fotoğraftan birbirine dikilmiştir

En zor tanıma algoritmasına gelince, Mattheij birçok girişimde bulundu. İlk olarak OpenCV'nin yapay görme kitaplığını benimsedi. Kontur eşleştirme ve algılama yoluyla, tanıma sistemi temel yapı taşları arasındaki farkı ayırt edebilir, ancak daha ayrıntılı bir tanıma sağlayamaz.

Yani, daha sonra denediği şey Bayes sınıflandırmasıydı: Yapı taşlarını ayırt edebilecek bazı özellikler seçti ve bunları tespit yazılımına yazdı. Listelediği 18 özellik arasında yükseklik, delik olup olmadığı ve kaç tane görünür sütun var. Bununla birlikte, bu tanıma yazılımı son derece yüksek doğruluğa sahip olmasına rağmen, ölümcül bir kusuru vardır: hız. Bu tanıma sistemi, konveyörün hızına yetişemez!

Altı aylık sıkı çalışmanın ve birçok başarısız girişimin ardından, Mattheij sonunda büyük bir katil buldu: sinir ağı. Algoritma kitaplığı olarak TensorFlow'u kullandı ve performansı artırmak için bilgi işlem kaynağı olarak Nvidia GTX 1080 TI grafik kartını (GPU) kullanmayı seçti.

TensorFlow hakkında biraz bilgisi olan okuyucular, öğrenmenin basitçe insan karşıtı olduğunu bilmelidir. Bununla birlikte, güçlü özellikleri onu son derece popüler kılar, bu nedenle, İnternette yeni başlayanların TensorFlow'u kullanmasına yardımcı olan birçok kaynak vardır. Mattheij bunlardan biri olan Keras'ı kullanır: Kullanım zorluğunu azaltmak için TensorFlow için bir sarmalayıcı olarak bir Python dil kitaplığı. (Mattheij gibi bununla ilgilenen okuyucular Jeremy Howard ve Rachel Thomas'ın makine öğrenimine giriş web kursunu izleyebilir.)

Sinir ağını oluşturduktan sonra, Mattheij'in karşılaştığı yeni sorun, 1.000'den fazla Lego tuğlasını ayırt edebilecek kadar büyük bir veri kümesinin nasıl bulunacağıydı. Hesaplamalarına göre blokların fotoğraflarını ve etiketlerini tek tek manuel olarak çekti ve kendi veri setini yavaşça oluşturması 6 aydan fazla sürecek ve bu en iyimser hesaplamadır.

Peki eğitim veri setini neden manuel olarak oluşturdu? Sinir ağı, yapı taşı resimlerini kendi başına etiketleyebilir. Ve sadece yanlış etiketi düzeltmesi ve makinenin bunu öğrenmesine izin vermesi gerekiyor.

Sinir ağı öğrendikçe daha az hata yapar. Mattheij'in orijinal eğitim seti, yapay olarak etiketlenmiş yapı taşlarının 500 fotoğrafıdır. Sinir ağını bu fotoğraflarla eğittikten sonra, ilk gün 2000 bloğu ayırt etti, bunların yaklaşık yarısı yanlıştı ve manuel olarak düzeltildi. Ve bu 2500 yapı taşı yeni bir eğitim seti haline geldi. İkinci gün,% 90 doğruluk oranıyla 4000 bloğu ayırt etti, bu nedenle Mattheij'in yalnızca 400 bloğun etiketlerini manuel olarak düzeltmesi gerekiyor. Bu şekilde 2 hafta sonra, veri seti 20.000 etiketli görsele yükseldi.

Şekil Sinir ağı ayırt edici

Bazı yapı taşı türleri nadir olduğundan, veri kümesinin yalnızca çok küçük bir yüzdesini oluştururlar. Bu bağlamda, Mattheij'in bu tür yapı taşlarının tümünü bulmak ve sınıflandırmak gibi bu tür yapı taşlarının sayısını manuel olarak artırması gerekir. Bu sistem tüm Lego türlerini güvenilir bir şekilde ayırt edebildiğinde, 2 tonluk Lego madenini kazmaya başlayacağını söyledi.

Neden öyle diyorsun? Çünkü nihai hedefi oynamak değil, para kazanmayı seven insanlara blok satmak!

Oppo çevrimdışı makinesi - oppo a57, işlemci ekranından daha büyük bir yuvaya sahiptir
önceki
Bu sabah Anhui Otoyolu'nda 23 araçlık bir çarpışmada 5 kişi öldü.
Sonraki
Mandzukic galibiyete doğru ilerledi, Juventus 1-0 Inter Milan Serie A'yı 6 galibiyetle önde götürdü.
Bir zamanlar iPhone'u geride bırakmayı hedefleyen müzik telefonu, şimdi çökmekte olan Lenovo Mobile
388'in yüksek taklit elma saati, pil değiştirme ve SIM kart takmayı da destekler
Yol kenarında 1.000 yuan karşılığında iPhone7 artı 256g
"Parti Üyesi Xiaoxin" gibi 1485 parti üyesi 300 saniyelik süper havalı animasyon sizi Zigong Yüksek Teknoloji Endüstri Parkı'nın "kırmızı parolasını" keşfetmeye götürür
En üzücü iOS cihazı olan Apple TV4'ün iç pazar payı zayıf
Üst düzey ada seyahati daha rahat, Fiji Çin pazarındaki dağıtımını hızlandırıyor
Google ve Wu Enda, aynı gün yeni bir yapay zeka projesini resmen duyurdular, bu da küresel yapay zeka endüstrisinin modelini değiştirmek için birkaç saat sürebilir.
Diyabet hastaları için Müjde: Bu elektronik "kan emici" kanınızı tek bir ısırıkla test etmenize yardımcı olabilir
Uçan bir kuş musun? Rol yapma, sadece yumurtalarına bak!
Bilgi İstasyonu | Karda geri dönün! Gövde "aile sevgisi" ile dolu, bak bakalım bir şey var mı
Yi Lu'nun yeni yılını kutlamak için şiirler, Çinli ve yabancı şairler Daliang Dağı'nın derinliklerine inmeye devam ediyor
To Top