Titanyum Ortam Notu: Bu makalenin yazarı Silver Keskkula, Teleportinc'in kurucularından biri ve Skype çekirdek ekibinin baş araştırmacısıdır. Yazar, evinizden çıkmadan yaşamanız için uygun bir yer bulmanızı sağlamak için AI teknolojisinin nasıl kullanılacağını beş açıdan açıklıyor. Makale Tupu Technology tarafından çevrilmiştir.
Bir keresinde okuyucularıma "Yapay zeka nüfusu nasıl yeniden düzenleyecek" başlıklı makalede şaka yapmıştım. Tıpkı çevrimiçi tanışma sitelerinin kimin ve kimin bebek yapacağına karar vermesi gibi, AI teknolojisinin de kimin nereye taşınacağına karar vermesine izin vereceğiz. Peki bugün hangi şehirlerin iyi şehirler olarak adlandırılabileceğini nasıl bileceğiz?
Haberleri okuruz, arkadaşlarımızdan güzel haberler alırız, fotoğraflara ve videolara bakarız ve oradan en iyi iş fırsatlarını alırız .. Çok yaygın olan, sık sık şehri görmek için dolaşmamızdır.
Hangi haberlerin, arkadaşların gönderilerinin, videolarının veya şehir fotoğraflarının bizim tarafımızdan görüleceğine karar verirken yapay zekanın nasıl yer aldığının analizine girmeyeceğim, ancak şehre daha objektif bakmanıza yardımcı olmak için Teleport'taki AI teknolojisini nasıl kullandığımızı açıklayacağım. . "Her Çocuk Programlamaya Başlar" makalesi beni derinden etkilediğinden, yapay zeka oynamak için tüm araçları kullanmanın kolay olduğunu göstermek için bu makaledeki süreci basit bir kod örneği ile göstereceğim. .
Aşağıdaki fikirler esas olarak MIT'nin StreetScore projesinden esinlenmiştir.
Teleport Developers API'den Estonia Tartu bölgesini alalım ve 10.000 rastgele coğrafi koordinat oluşturalım. Sorabilirsiniz, neden on bin? Bilim yüzünden!
Böylesine coğrafi olarak tek tip bir dağılım, elbette, şehrin manzarası hakkında bazı fikirlere sahip olmamızı sağlayacaktır, çünkü çoğu zaman ormanda veya çatıda neredeyse hiçbir şey göremeyiz. Neyse ki, Google Haritalar API'sinin yardımıyla koordinatları rastgele hareket ettirebilir ve şuna benzer bir şey elde edebiliriz:
Gördüğünüz gibi, ziyaret etmeyi planladığımız yerler (kırmızı noktalar) ağaçlarla dolu bazı yerlerden çok, az çok hareketli yollarda ve sokaklarda.
Artık konumumuza sahip olduğumuza göre, görüntüleme konumuna girme ve Google Street View görüntü API'sini tanımanın zamanı geldi. Temel olarak, koordinatlarımı API'lerini çağırmak ve oluşturulan görüntüyü yerel olarak kaydetmek için kullanıyorum.
Biraz ters coğrafi kodlamadan ve bazı genel takip işlemlerinden sonra, Google'ın API'si her koordinat için döndürülen fotoğrafları almamı sağladı (ve eşit olarak dağıtıldığında "Üzgünüz, resimlerimiz yok" gösterecek).
Ardından kodum aracılığıyla, odadan (veya bilgisayarımdan?) Çıkmadan binlerce Tartu görüntüsüne göz atabilirim.
İşleri basitleştirmek için, görüntü koleksiyonumuzu herkesin kullanımına açık makine görme API'si aracılığıyla çalıştırıyorum. Microsoft Computer Vision API / Google Cloud Vision API / IBM Vision Recognition API / Cloud / Sight API / Clarifai gibi birçok benzer seçeneğimiz var.
Ancak bu örnek için Microsoft'un Oxford projesine gittim. Microsoft Araştırma Kuruluşu beni etkiledi. Dürüst olmak gerekirse, bana en çok hitap eden API'siz kullanım koşulları. Python için hızlı başlangıç kodu sağlayacak kadar bile cömertler.
Temelde, yalnızca görüntüyü API'sına yüklemeniz ve sahneyi açıklayan bir metin satırı döndürmeniz gerekir. Tartu'dan bir resim örneği ve MS Vision API'den çıktı metni.
API'leri aracılığıyla, Tartu'dan 8.5GB ham görüntü piksel verilerini 255KB metin verilerine sıkıştırdım. Sıkıştırma ve zeka arasındaki ilişkiyi incelediyseniz, boyuttaki bu 35.294 kat azalma bazı sorunları açıklayabilir.
Her neyse, artık sahneyi açıklayacak doğal dile sahip olduğumuza göre, birini hareket etmeye ikna etmek için bir neden bulup bulamayacağımızı görmek için istatistikleri incelemeye başlayabiliriz.
Uzun listeye baktığımda "motosiklet" kelimesini görene kadar neredeyse uyuyakaldım. Motosikletlerin sayısı veya motosiklet sahibi olan insanların oranı, bir şehrin potansiyelinin iyi bir göstergesidir. Şahsen bununla rezonansa giriyorum (çünkü iki motosikletim var).
Elbette, çeşitli şehirlerde motosikletler hakkında istatistik bulmak için hala birçok kaynak var, ancak farklı ülkelerdeki farklı kaynaklardan gelen bu verilerin yakalanması ve normalleştirilmesi için çok fazla çalışma gerektirdiğini unutmayın. Google Street View'ın güzelliği, büyük şehirleri tek bir veri kaynağı olarak kullanması ve yakalanan görüntüde görünen her türlü bilgiyi yakalayabilmesidir.
Yapay zekanın ilerlemesi, daha spesifik olarak, derin sinir ağlarının ilerlemesi her hafta bizi şaşırtıyor.Eğer görüntülerden bilgi elde etmede yapay zeka teknolojisinin insanlar kadar iyi olmadığından hala şüpheleniyorsanız, lütfen aşağıdaki yapay zekanın insanları mağlup ettiği listesine bakın. :
Elbette, motosikletler kişisel olarak ilgilendiğim bir şaka örneğidir, ancak insanlar tarafından görülebilen (veya belki de görünmeyen) görüntülerden herhangi bir bilgi almayı hayal etmek zor değil. Google'ın yakaladığı milyonlarca görüntünün ardında saklı olan bu şehirlerdeki yaşam kalitesini anlatmak için birçok ipucu var.
İşte bildiğimiz bazı şeylerin doğru olup olmadığını kontrol etmek için hızlı ve sağlam bir kontrol yöntemi. Amsterdam için 10.000 fotoğraf daha çektik ve resimlerde hesaplanan bisikletlerin oluşumunu işaretledik:
Nüfus yoğunluğuna bakılmaksızın (veya aslında her bir görüntüde kaç bisiklet olduğunu hesaplamak), en azından sezgi doğrulanmış görünüyor. Bisikletlerin sayısını saymaktan ve harita üzerindeki binalar ve topluluklar üzerindeki çocukların grafitilerinin izini sürmekten, bu devasa görüntü verileri hareketimizin zengin ve çok sayıda olduğunu doğruluyor.
Elbette sokakta gördüğümüz her şeyi önemsememiz imkansız. Bazen hareketli sokaklardan çıkıp yoldan çıkmanız gerekir. Örneğin, Tanel Pärnamaa, Teleport'taki stajı sırasında bazı çalışmalar yaptı, Flickr'dan herkese açık bir şekilde coğrafi etiketli bir dizi fotoğraf elde etti ve plajları belirlemek için makine görüş etiketleri kullandı. İlginç bir şekilde, makine görme veri sinyali sınırlı olduğunda, çok sayıda kum golf sahası buldu.
Dahası, Planet tarafından fırlatılan 88 uydu tekrar yörüngeye girerken, AI teknolojisinin girmesine izin veren başka bir şaşırtıcı görüntü kaynağımız var. Sonuç olarak, veri miktarı katlanarak artacak ve kentsel yaşam kalitesi anlayışımız da artacaktır.
Yatırımcılarımızdan biri şunları söyledi: "Bilgisayarların ve İnternetin yaygınlaşması işleri iki kategoriye ayıracak: bilgisayarlara ne yapacaklarını söyleyenler ve bilgisayarlar tarafından ne yapacaklarını söyleyenler."
Sitemizdeki bazı görevlilerin kodla yapılabilecek şeyleri yakalamak için çok para harcadığını gördüm. Ancak makine öğrenimi ve kitle kaynak kullanımı yoluyla kazanılan verimliliğin bize büyük bir rekabet avantajı sağlayacağına inanıyorum.Uzun vadede nasıl çalışacağını görmek için sabırsızlanıyorum.
Aynı zamanda, bilgisayarlara ne yapacaklarını söylemeye daha meyilli olan kişilere bazı zorlayıcı gerçekler vermek istiyorum:
Daha heyecan verici içerik için Titanium Media WeChat ID'yi (ID: taimeiti) takip edin veya Titanium Media Uygulamasını indirin