Özel Derin öğrenmeyi anlamak için bir makale (öğrenme kaynakları ile)

Orijinal başlık: Derin Öğrenmenin nasıl çalıştığını öğrenmek mi istiyorsunuz? İşte herkes için hızlı bir kılavuz

Eser sahibi: Radu Raicea

Çeviri: Cheng Siyan

Düzeltme: Feng Yu

Bu makalenin uzunluğu 2500 kelime , Okumanız tavsiye edilir 6 dakika

Medium'da 15.000'den fazla övgü alan derin öğrenmeye giriş kılavuzu, resimler ve metinlerle birlikte, derin öğrenmedeki her temel kavramın çağrışımını netleştirecektir.

Resim kredisi: Datanami

Yapay Zeka (AI)

(https://en.wikipedia.org/wiki/Art artificial_intelligence)

Ve makine öğrenimi (ML)

(https://en.wikipedia.org/wiki/Machine_learning)

Hepsi şu anda en popüler konulara ait.

Günlük hayatta, AI terimini her yerde görebiliriz. Yüksek fikirli geliştiricilerden AI öğrenmek istediklerini duyabilirsiniz. Operatörlerden hizmetlerinde yapay zekayı uygulamak istediklerini de duyabilirsiniz. Ancak çoğu zaman bu insanların çoğu yapay zekanın ne olduğunu anlamıyor.

Bu makaleyi okuduktan sonra, AI ve ML'nin temellerini anlayacaksınız. Ve daha da önemlisi, en popüler makine öğrenimi türü olan derin öğrenmenin (https://en.wikipedia.org/wiki/Deep_learning) nasıl çalıştığını anlayacaksınız.

Bu eğitim herkes içindir, bu nedenle bu makale ileri matematik içermemektedir.

arka fon

Derin öğrenmenin nasıl çalıştığını anlamanın ilk adımı, aşağıdaki önemli terimler arasındaki farkı kavramaktır.

  • Yapay Zeka (AI) ile Makine Öğrenimi (ML)

Yapay zeka, insan zekasının bir bilgisayarda yeniden üretilmesidir.

Yapay zeka araştırmasının başlangıcında, o zamanki araştırmacılar oyun oynamak gibi belirli görevleri yerine getirmek için insan zekasını kopyalamaya çalıştı.

Bilgisayarların uyması gereken birçok kural getirdiler. Bu kurallarla, bilgisayarda olası eylemlerin bir listesi bulunur ve bu kurallara göre kararlar verir (https://en.wikipedia.org/wiki/Expert_system).

Makine öğrenimi, makinelerin sabit kodlanmış kurallar yerine büyük veri kümelerini kullanarak öğrenme yeteneğini ifade eder.

Makine öğrenimi, bilgisayarların kendi kendilerine öğrenmesine olanak tanır. Bu öğrenme yöntemi, bilgisayarın çok sayıda örnekle veri setlerini kolayca işleyebilmesini sağlayan modern bilgisayarların güçlü performansından yararlanır.

  • Denetimli öğrenme ile denetimsiz öğrenme

Denetimli öğrenme

(https://en.wikipedia.org/wiki/Supervised_learning)

Girdi ve beklenen çıktıyı içeren etiketli veri setlerini kullanarak öğrenmeyi ifade eder.

Yapay zekayı eğitmek için denetimli öğrenmeyi kullandığınızda, ona bir girdi sağlar ve beklenen çıktıyı söylersiniz.

AI tarafından üretilen çıktı yanlışsa (Çevirmenin Notu: beklenen çıktıdan farklı), hesaplamayı yeniden ayarlayacaktır (Not: Formülün parametrelerinin yeniden hesaplanması gerekir). Bu işlem, yapay zeka artık hata yapmayana kadar veri kümesi üzerinde yinelemeli olarak çalışacaktır.

Hava durumunu tahmin eden AI, denetimli öğrenmenin tipik bir örneğidir. Gelecekteki hava durumunu tahmin etmek için geçmiş verileri kullanır. Eğitim verilerinde giriş (hava basıncı, nem, rüzgar hızı) ve çıktı (sıcaklık) bulunur.

Denetimsiz öğrenme

(https://en.wikipedia.org/wiki/Unsupervised_learning)

Makine öğreniminin, öğrenme için belirli bir yapı olmadan bir veri setini kullanması bir görevdir.

Yapay zekayı eğitmek için denetimsiz öğrenmeyi uyguladığınızda, yapay zekanın verileri mantıksal olarak sınıflandırmasına izin verebilirsiniz.

E-ticaret web sitelerindeki davranış tahmini AI, denetimsiz öğrenmeye bir örnektir. Girdi ve çıktıları olan etiketli veri setlerinden öğrenemez. Bunun yerine, girdi verileri üzerinde kendi sınıflandırmasını oluşturur. Hangi kullanıcıların farklılaştırılmış ürünleri satın alma olasılığının en yüksek olduğunu size söyleyecektir.

Derin öğrenme nasıl çalışır?

Artık derin öğrenmenin ne olduğunu ve nasıl çalıştığını anlamaya hazırsınız.

Derin öğrenme, makine öğreniminde bir yöntemdir. Ona bir dizi girdi verdikten sonra, sonucu tahmin etmesi için yapay zekayı eğitmemize olanak tanır. Yapay zekayı eğitmek için hem denetimli öğrenme hem de denetimsiz öğrenme kullanılabilir.

Farazi bir bilet fiyatı tahmin sistemi kurarak derin öğrenmenin nasıl çalıştığını göstereceğiz. Eğitmek için denetimli öğrenme yöntemleri uygulayacağız.

Uçak bileti fiyat tahmin sisteminin aşağıdaki girdilere göre tahminler yapmasını istiyoruz (kısaca, dönüş uçak biletini kaldırdık):

  • Kalkış Havalimanı

  • Havaalanına varmak

  • Ayrılış tarihi

  • havayolu

Nöral ağlar

Daha sonra bakış açımızı AI beynimizin içine çeviriyoruz.

Hayvanlar gibi, Sistem AI'nın beyninde de nöronlar olduğunu tahmin ediyoruz. Onları dairelerle belirtin. Bu nöronlar dahili olarak birbirine bağlıdır.

Resim kredisi: CS231n

Bu nöronlar üç seviyeye ayrılmıştır:

  • Giriş katmanı

  • Gizli katman

  • Çıktı katmanı

Giriş katmanı, giriş verilerini alır. Bu durumda, giriş katmanında 4 nöron vardır: kalkış havalimanı, varış havalimanı, kalkış tarihi ve havayolu. Giriş katmanı, girişi ilk gizli katmana iletir.

Gizli katman, girdimiz üzerinde matematiksel işlemler gerçekleştirir. Bir sinir ağı oluşturmanın en büyük zorluklarından biri, gizli katmanların sayısını ve her katmandaki nöron sayısını belirlemektir.

Derin öğrenmedeki "derinlik", birden fazla gizli katmana sahip olmayı ifade eder.

Çıktı katmanının döndürdüğü şey çıktı verileridir. Bu durumda çıktı katmanı bir fiyat tahmini verir.

Peki fiyat tahminini nasıl hesaplıyor?

Bu, ortaya koyacağımız derin öğrenme harikasıdır.

İki nöron arasındaki her bağlantı bir ağırlığa karşılık gelir. Ağırlık, girdi değerinin önemini belirler. Başlangıç ağırlığı rastgele ayarlanacaktır.

Bir biletin fiyatını tahmin ederken kalkış tarihi, fiyatın belirlenmesinde en önemli faktörlerden biridir. Bu nedenle, ayrılış tarihindeki nöron ile bağlantı daha yüksek bir ağırlığa sahip olacaktır.

Resim kredisi: CodeProject

Her nöronun bir aktivasyon işlevi vardır (https://en.wikipedia.org/wiki/Activation_function). Matematiksel türetme olmadan bu fonksiyonların anlaşılması çok zordur.

Kısaca, aktivasyon fonksiyonunun işlevlerinden biri nöronun sonuçlarını "normalleştirmek" tir.

Bir dizi girdi verisi, sinir ağının tüm katmanlarından geçtikten sonra, sinir ağı çıktı verilerini çıktı katmanı üzerinden döndürecektir.

Hiç karmaşık değil, değil mi?

Bir sinir ağını eğitmek

AI eğitimi, derin öğrenmenin en zor kısmıdır. Bu nedenle?

  • Büyük bir veri kümesine ihtiyacınız var

  • Hala güçlü bir bilgi işlem gücüne ihtiyacınız var

Bilet fiyatı tahmin sistemimiz için geçmiş ücret verilerini almamız gerekiyor. Başlangıç havaalanı ve kalkış saati çok sayıda olası kombinasyona sahip olduğundan, ihtiyacımız olan şey çok geniş bir ücret listesi.

Uçak bileti fiyat tahmin sisteminin yapay zekasını eğitmek için, veri setinin verilerini sisteme vermemiz ve ardından çıktısını veri setinin çıktısı ile karşılaştırmamız gerekir. AI şu anda hala eğitilmediğinden, çıktısı yanlış olacaktır.

Tüm veri setini geçtikten sonra, AI çıktısının gerçek çıktıdan ne kadar farklı olduğunu bize söyleyen bir işlev oluşturabiliriz. Bu işleve kayıp işlevi diyoruz.

İdeal bir durumda, kayıp fonksiyonumuzun 0 olmasını isteriz, bu, AI çıktısı ile veri setinin çıktısı eşit olduğunda olur.

Kayıp işlevi nasıl azaltılır?

Nöronlar arasındaki ağırlığı değiştirin. Kayıp işlevi yeterince küçük olana kadar bu ağırlıkları rastgele değiştirebiliriz, ancak bu yöntem yeterince verimli değildir.

Bunun yerine, gradyan inişi adı verilen bir teknik uyguluyoruz (https://en.wikipedia.org/wiki/Gradient_descent).

Gradyan inişi, bir fonksiyonun minimum değerini bulmamıza yardımcı olan bir tekniktir. Bu durumda, kayıp fonksiyonunun minimum değerini arıyoruz.

Her veri seti yinelemesinden sonra, yöntem ağırlıkları küçük artışlarla değiştirir. Belirli bir ağırlık kümesi üzerinde kayıp fonksiyonunun türevini (gradyan) hesaplayarak, minimumun hangi yönde olduğunu bilebiliriz.

Resim kredisi: Sebastian Raschka

Kayıp işlevini en aza indirmek için, veri kümesini birçok kez yinelemeniz gerekir. Yüksek bilgi işlem gücü ihtiyacının nedeni budur.

Ağırlıkları güncellemek için gradyan iniş kullanma süreci otomatiktir. Bu, derin öğrenmenin büyüsüdür!

AI'yi uçak bileti fiyat tahmini için eğittikten sonra, gelecekteki fiyatları tahmin etmek için kullanabiliriz.

daha fazla okuma

Pek çok sinir ağı türü vardır: bilgisayar görüşü (https://en.wikipedia.org/wiki/Computer_vision) ve uygulamalar Doğal dil işleme için tekrarlayan sinir ağı (https://en.wikipedia.org/wiki/Recurrent_neural_network) (https://en.wikipedia.org/wiki/Natural_language_processing).

Derin öğrenmenin teknik ayrıntılarını öğrenmek istiyorsanız, çevrimiçi bir kurs almanızı öneririm.

Wu Enda (https://medium.com/@andrewng) Derin öğrenme özel kursları (https://www.coursera.org/specializations/deep-learning) şu anda en iyi derin öğrenme kurslarından biridir. Bir sertifikaya ihtiyacınız yoksa bu kursu ücretsiz olarak denetleyebilirsiniz.

özet

1. Derin öğrenme, hayvan zekasını taklit etmek için sinir ağlarını kullanır.

2. Bir sinir ağında üç düzey nöron vardır: giriş katmanı, gizli katman ve çıktı katmanı.

3. Nöronlar arasındaki bağlantı, her bir giriş verisinin önemini belirleyen bir ağırlığa karşılık gelir.

4. Nöron tarafından veri çıkışını "normalleştirmek" için nörona bir aktivasyon işlevi uygulayın.

5. Sinir ağını eğitmek için büyük bir veri kümesine ihtiyacınız var.

6. Veri setini yineleyin ve çıktı sonucu ile karşılaştırın, bir kayıp fonksiyonu elde ederiz, kayıp fonksiyonu bize AI tarafından üretilen sonucun gerçek sonuçtan ne kadar farklı olduğunu söyleyebilir.

7. Veri setinin her yinelemesinden sonra, gradyan iniş yöntemi, kayıp fonksiyonunu azaltmak için nöronlar arasındaki ağırlıkları ayarlamak için kullanılır.

Orijinal bağlantı:

https://medium.freecodecamp.org/want-to-know-how-deep-learning-works-heres-a-quick-guide-for-everyone-1aedeca88076

Daha fazla heyecan için lütfen Tsinghua-Qingdao Veri Bilimi Enstitüsü "THU Data Pie" resmi WeChat hesabını takip edin

Wuhan emlak piyasasındaki son gelişmeler! Üç tanınmış aracı birleşti, ev satın almak için yeni seçenekler olacak Günaydın Wuhan
önceki
Geçen hafta sonu, Chengdu alışveriş merkezindeki ilk Noel ağacı aydınlandı
Sonraki
Bir sonraki Sancho? 18 yaşındaki Manchester City dehası, eski kulübüyle yüzleşmek için Şampiyonlar Ligi'ni dört gözle bekleyerek Schalke'ye taşındı!
Özel | Anlamsal bir bakış açısıyla disiplinler arası ve sınır ötesi veri bilişi
Longmen Array | Tekleri savunan ancak çiftleri savunmayan Liu Guoliang, kadınların masa tenisinin krizde olduğunu söyledi
"Doctor Who" Noel Özelinde en tuhaf 15 an
Ayrıcalıklı Size hurda ile küçük bir program yapmayı öğretin! (Kod eklenmiştir)
20'den fazla suçlu müfettişi ortaya çıkarmak için üç uyarı atasözü kullandı.
Özel | E-sporları dijitalleştirme: League of Legends finalleri de buna güveniyor!
Bir gecede aşk! 20 yaşındaki İsviçreli güzel, Neymar ile unutulmaz bir akşam yaşıyor!
Tsinghua Didi: Travel Data Insights Çin Kentsel Alan Geliştirme Raporu!
Baby Groot'un sevimli satış yapmasına izin vermek için Marvel zaman çizelgesini değiştirdi!
Chao Technology | "Blue Arrow Aerospace" 80 tonluk motor gaz jeneratörü ilk tur ateşleme testi başarısı
Partiye sonsuza dek kalbinin başlangıcını hatırlatan Zigong Şehri İki Yeni Organizasyon Reformun ve Açılışın 40. Yıldönümünü Anıyor
To Top