g u t x .com.tr İpek yolu - Çin'i anlamaya götürürüm

"Bilim" Makine öğrenimi nedir?

Yazar: Chris Budd

İlkeden yeniden basıldı

Makine öğrenme Evet yapay zeka En önemli son gelişmelerden biri. Makine öğrenimi fikri, zekayı makinelere bir şeyler öğretmek olarak değil, bir şeyleri kendi kendilerine öğrenen makinelere öğretmektir. Bu şekilde makine, karmaşık görevleri doğrudan deneyimden (veya verilerden) öğrenebilir.

Nispeten basit makine öğrenimi algoritmaları bile kedi ve köpek resimleri arasında nasıl ayrım yapılacağını öğrenebilir.

Programlama için hesaplama hızı ve algoritmalarındaki muazzam ilerleme ve gelişmeyle birlikte makine öğrenimi hızla büyüdü. Ortaya çıkan algoritmalar hayatlarımız üzerinde büyük bir etkiye sahip olmaya başladı ve çoğu zaman insanlardan daha iyi performans gösteriyorlar. Peki makine öğrenimi nasıl çalışır?

Deneyimlerden öğren

Bir makine öğrenimi sisteminde, bir bilgisayar genellikle aynı görevin büyük bir veritabanında eğitilir ve ardından bir görevi gerçekleştirmek için kendi kodunu yazar. Bunun büyük bir kısmı, mod Ve sonra bu kalıplara göre kararlar verin.

Örneğin, bir şirketin yeni bir çalışan işe aldığını varsayalım İş ilanı verildikten sonra 1000 kişi başvurdu ve herkes bir özgeçmiş sundu. Tek tek kendiniz taramak zorunda kalırsanız, bu çok fazla, bu yüzden bu görevi tamamlamak için bir makineyi eğitmek istiyorsunuz.

Bunu yapmak için, şirketteki geçmiş başvuru sahiplerinin çoğunun özgeçmişlerini kaydetmeniz gerekir. Her özgeçmiş için, kişinin nihayet işe alınıp alınmadığını gösteren bir kaydınız vardır. Makineyi eğitmek için özgeçmişinizin yarısını çıkarırsınız ve bu özgeçmişlerin bir işe başarılı bir şekilde uygulanıp uygulanmadığını öğrenerek makinenin modeli bulmasına izin verirsiniz.

Bu şekilde, makine bir özgeçmiş aldığında, kişinin işe uygun olup olmadığına dair bir karar verebilir. Eğitimden sonra, özgeçmişinizin diğer yarısını makineyi test etmek için kullanabilirsiniz. Başarı oranı yeterince yüksekse, yani makinenin doğru kararlar verme olasılığı yeterince yüksekse, o zaman bir kişinin özgeçmişine dayanarak bir kişinin işe uygun olup olmadığına makinenin güvenle karar vermesine izin verebilirsiniz. Hiçbir aşamada insan yargısına gerek yoktur.

detaylar

Makine öğrenimi sürecini daha net anlamak için, el yazısı rakamları belirli bir örnek olarak tanıyan bir makinenin geliştirilmesini ele alarak örüntü tanıma problemini ele alacağız. Böyle bir makine, yazı biçimi nasıl değişirse değişsin, bir karakterin temsil ettiği sayıyı doğru bir şekilde tanıyabilmelidir.

Dijital tanıma süreci iki aşamaya ayrılmıştır. Öncelikle, el yazısı rakamların bir görüntüsünü makineye tarayabilmeli ve bu (dijital) görüntüden anlamlı veriler çıkarabilmeliyiz. Bu genellikle Temel bileşenler Analizi (PCA) istatistiksel yöntem, bu yöntem, çizgilerin uzunluğu, genişliği ve kesişimi gibi görüntüdeki ana özellikleri otomatik olarak çıkaracaktır. Bu süreç, matrisin özdeğerlerini ve özvektörlerini çözme süreciyle yakından ilgilidir ve ayrıca Google'ın World Wide Web'de bilgi aramak için kullandığı işleme çok benzer.

Ardından, makineyi bu çıkarılan özelliklerden sayıları tanıması için eğitmek istiyoruz. Eğitim makineleri için çok yaygın bir yöntem, Nöral ağlar . Sinir ağı algoritmaları için orijinal ilham, insan beyninin çalışma şeklimizdi, ancak bu kesinlikle insan beyninin çalışma şeklimize dayanmıyor.

Önce, bir " Nöronlar "Ve onları bağlayın, birbirlerine mesaj gönderebilirler. Sonra, sinir ağının sonuçları zaten bilen çok sayıda sorunu çözmesine izin verin. Bu, algoritmanın nöronlar arasındaki bağlantıyı nasıl belirleyeceğini" öğrenmesine "olanak tanır, böylece Verideki hangi modellerin doğru sonuçlara yol açtığını başarıyla belirleyin.

Bu tür bir sinir ağının erken bir örneği, adı verilen bir türdür Algılayıcı Tek katmanlı sistem, insanlar onu tek bir nöronu simüle etmek için kullanır. Algılayıcı kavramı 1962'de Frank Rosenblatt tarafından önerilmiş ve tipik yapısı aşağıdaki şekilde gösterilmiştir:

Sensöre X1, X2 ... Xn n sayılarını girin. Sonra her bir Xi'yi ağırlıklı bir wi ile çarpın ve tüm bu ürünleri bir araya getirerek toplamlarını elde edin.

wX1 + wX2 + ... + wnXn

Bu toplam belirli bir eşik C'den büyükse 1 döndürür; aksi takdirde 0 döndürür. Yani, eğer

wX1 wX2 ... wnXn C > 0,

Ardından, algılayıcı 1 döndürür; eğer

wX1 wX2 ... wnXn C 0,

Ardından sensör 0 döndürür.

Sayı tanıma problemi için, dijital görüntünün çıkarma özelliği Xi girişidir ve algılayıcı, bu sayının 3 veya 4 olup olmadığına karar verir. Algılayıcıyı eğitme süreci, algılayıcının tutarlı bir şekilde doğru sayıyı belirleyebilmesi için uygun ağırlık wi ve eşiği C bulmayı içerir. Bunu yapmak için, istatistiksel tabanlı matematiksel optimizasyon algoritmalarının dikkatli kullanılması gerekir.

Örnek: Sayı tanıma

Örneğin, görüntüden yalnızca iki özellik çıkardığımızı varsayalım: X1, görüntüdeki düz çizgilerin sayısını sayabilir ve X2, görüntüdeki çizgilerin kesişme sayısını sayabilir.

Şimdi, her el yazısıyla yazılan sayının görüntüsünde (3 veya 4 gibi) açıklanacak iki numara vardır, böylece bir koordinat sistemine yerleştirilebilir. 3 rakamı genellikle düz parçalara ve çapraz çizgilere sahip olmadığından, görüntüsünün koordinat sisteminde (0,0) 'a yakın bir noktaya karşılık gelmesi muhtemeldir. 4 rakamı üç düz çizgi parçasına ve bir kesişme noktasına sahiptir ve görüntüsü (3,1) noktasına yakın olabilir.

Verilen bir w, w ve C için, algılayıcıdaki toplam

wX1 wX2-C,

Düz bir çizgi tanımlamak için bu formülün 0'a eşit olmasına izin verin. Algılayıcı, w, w ve C değerlerini bulmak için eğitilmiş görüntüyü kullanabilirse, böylece bu düz çizgi 3 numarasına karşılık gelen tüm noktaları 4 numarasına karşılık gelen tüm noktalardan ayırırsa, o zaman büyük bir Olasılık, yeni dijital görüntüyü doğru bir şekilde tanımlayabilir. Böyle düz bir çizgi varsa, verilerin doğrusal olarak ayrılabilir olduğu söylenir.

Şekildeki kırmızı noktanın 3 sayısını temsil eden görüntüden ve mavi noktanın 4 sayısını temsil eden görüntüden olduğunu varsayın. Algoritma C = 2 ve X1 = X2 = 1 kullanıyorsa, ağırlıklı toplam 0, şekildeki düz çizgiye karşılık gelir (w + w-2 = 0). Mavi veri noktaları için ağırlıklı toplam sıfırdan büyüktür ve kırmızı veri noktaları için ağırlıklı toplam sıfırdan küçüktür, bu nedenle algoritma bu veri kümesi için her zaman doğru cevabı verecektir.

Veri noktaları düz bir çizgiyle bölünemezse, yani veriler doğrusal olarak ayrılamazsa, bu noktalar daha yüksek bir boyuta genişletilebilir ve daha yüksek boyutlu uzayda doğrusal olarak ayrılabileceklerini umabilir. Çok basit bir örnek, şekildeki noktaları ekranın dışına üçüncü boyuta sürükleyebilmeniz ve sürükleme mesafesinin, noktaya (0,0) olan başlangıç mesafesine karşılık gelmesidir. Bununla birlikte, genellikle daha karmaşık yöntemler kullanılır. Elbette orijinal verilerden çıkarılan ikiden fazla özellik varsa daha yüksek boyutlarda benzer yöntemler kullanılabilir.

Perceptron yöntemi, kedi ve köpeklerin görüntülerini sınıflandırmak için de kullanılabilir:

Eğitim verisi arttıkça, algoritma seçtiği düz çizgiyi güncelleyecek, yani sabit C'yi ve ağırlıklı w, w değerini değiştirecektir.

Sinir ağları ve derin öğrenme

Basit algılayıcılar birçok basit görevi tamamlamak için eğitilebilir, ancak yakında sınırlarına ulaşacaklar. Açıkçası, birçok algılayıcı daha fazla hesaplama yapmak için birbirine bağlanabilir, ancak bu gelişme daha güçlü bilgisayarların ortaya çıkmasını beklemelidir. Bu büyük atılım, çok katmanlı algılayıcılar bir sinir ağı oluşturmak için birleştirildiğinde gerçekleşti. Bu sinir ağının tipik yapısı, bir giriş katmanı, gizli bir katman ve bir çıkış katmanı içeren aşağıdaki şekilde gösterilmektedir. Bu durumda, girdiler, algılayıcıdaki ilk nöron katmanını tetiklemek için birleştirilecek ve ortaya çıkan çıktı, bir sonraki nöron katmanını tetiklemek için birleştirilecek ve son olarak, bunlar nihai çıktıyı vermek için birleştirilecektir.

Ne kadar fazla katman olursa, sinir ağı o kadar "derin" olur. Daha sonra, böyle bir sinir ağı, yukarıdaki nöronlar arasındaki her bağlantıya ağırlık verilerek eğitilecektir. Bu süreç, beynin sinir yollarının güçlenme veya zayıflatma şeklini taklit etmektir. Derin öğrenme, böyle bir sinir ağını eğitme sürecini tanımlar.

Aslında, sinir ağı algoritmalarının gerçekleştirilmesi, yeni matematiksel optimizasyon algoritmalarının ve güçlü hesaplama yeteneklerinin geliştirilmesinin birleşiminin sonucudur. Sinir ağı için doğru ağırlıklı wi bulma sürecinin sonunda, çok hızlı çalışabilen ve "kararlar" verebilen bir kara kutu elde ederiz.

Farklı makine öğrenimi yöntemleri

Sinir ağı öğreniminin birçok biçimi vardır.

Denetimli öğrenmede, kullanıcılar önceden bir çift örnek, yani girdi ve çıktı sağlayacaktır. Ardından, öğrenmenin amacı, çıktıları örnekle eşleşebilecek bir sinir ağı bulmaktır. Genellikle, bir sinir ağının çıktısını bir örneğin çıktısıyla karşılaştırmak için kullanılan yöntem, ikisinin ortalama kare hatasını hesaplamaktır; daha sonra ağı, tüm eğitim veri setleri için bu hatayı en aza indirecek şekilde eğitin. Bu yöntemin çok standart bir uygulaması, istatistikte kullanılan eğri uydurmadır ve bu, elle yazılmış rakamlar ve diğer örüntü tanıma problemleri üzerinde iyi bir etkiye sahiptir.

Pekiştirmeli öğrenmede, veriler kullanıcı tarafından önceden verilmez, ancak sinir ağı tarafından kontrol edilen makine çevre ile etkileşime girdiğinde üretilir. Makine, zamanın her noktasında çevre üzerinde bir işlem gerçekleştirecek, böylece bir gözlem ve bu işlemin maliyetini oluşturacaktır. Ardından bu sinir ağını, toplam maliyeti en aza indiren işlemleri seçmesi için eğitin. Birçok yönden bu süreç, insanların (özellikle çocukların) öğrenme şekline benzer.

Son yıllarda, makine öğreniminin matematiksel algoritmaları büyük ölçüde gelişti. Evrişimli Sinir Ağı (CNNs) heyecan verici ve önemli yeni bir gelişmedir. Görüntü işleme teknolojisini derin sinir ağları ile birleştiren yöntemlerin bir uzantısıdır. Yüz tanımaya uygulanabilir ve hatta duyguları tespit etmek için kullanılabilir. Tıbbi teşhis dahil olmak üzere birçok alanda kullanılmaktadır.

AlphaZero, satranç oynamayı daha iyi öğrenmek için derin bir evrişimli sinir ağı kullanıyor. Eğitimi, makinenin 24 saat içinde 700.000 tur oynamasına izin veren pekiştirmeli öğrenme yöntemlerinden geçer. Evrensel Monte Carlo Ağacı Arama Ağırlık atamak için (MCTS) algoritması. Go ve Japon Shogi'sini öğrenirken benzer yöntemler kullanılır ve her durumda benzer bir seviyeye ulaşmıştır. Bu harika!

Makine öğrenimi hızla ilerliyor. Daha hızlı eğitim algoritmaları ve gittikçe daha fazla veri tarafından yönlendirilen, daha karmaşık ve daha derin sinir ağları geliştirme eğilimi giderek daha belirgin hale geliyor. Ama belki de düşünmemiz gereken soru, yaşamı değiştiren kararları (tıbbi teşhis gibi) makineye bırakmak güvenli ve etik mi?

Orijinal bağlantı: https://plus.maths.org/content/what-machine-learning

SON

Makalenin yeniden basımı prensip , Telif hakkıyla ilgili herhangi bir sorunuz varsa, lütfen zamanında bizimle iletişime geçin. Telif hakkı yorumlama hakkı orijinal yaratıcıya aittir. Bu makale TechSugar yazı işleri departmanı tarafından önerilmektedir!

Bir zamanlar bir sarhoşla ölümüne araba sürerek tanıştım! TVB aktörünün 56 yaşından önce hâlâ devam eden bir korkusu var: arabam parçalanıyor

Sadece güzel! Levinin x Air Jordan 4 özel yeni renk düzeni hala böyle oynayabilir mi? !