Makine öğreniminde matematik: yeni yayınlanmış sıcak bir taslak

Kaynak: Heart of the Machine

Bu makale yaklaşık 1500 kelimedir, okumanız tavsiye edilir 5 dakika.

Bu makale, "Makine Öğrenmesi için Matematik" in tüm taslaklarının yakın zamanda yayınlandığını sizlerle paylaşıyor. Bu kitaba kısa bir genel bakış derledik.

Yakın zamanda, Marc Peter Deisenroth, A Aldo Faisal ve Cheng Soon Ong tarafından yazılan Mathematics for Machine Learning kitabının tüm taslakları yayınlandı Bu kitabın kısa bir özetini derledik. İlgilenen okuyucular tam metni (İngilizce) aşağıdaki bağlantıdan edinebilirler.

Kitap adresi: https://mml-book.github.io/

Aşağıdaki, kitabın kısmi bir önsözüdür.

Makine öğrenimi, makine inşa etmek ve otomatik sistemler oluşturmak için uygun bir format hakkında insan bilgisini ve mantığını yakalamak için en son girişimdir. Makine öğrenimi daha yaygın hale geldikçe ve yazılım paketlerinin kullanımı kolaylaştıkça, uygulayıcıların düşük seviyeli teknik ayrıntılara dikkat etmemesi doğaldır. Ancak bu, uygulayıcıların tasarım kararlarını anlamadıkları ve makine öğrenimi algoritmalarının sınırlamalarını görmezden gelme olasılıkları daha yüksek olan bazı riskler getiriyor. Başarılı makine öğrenimi algoritmalarının arkasındaki mekanizmalarla ilgilenen uygulayıcıların aşağıdaki temel bilgileri öğrenmesi gerekir:

  • Programlama bilgisi ve veri analizi araçları;
  • Büyük ölçekli bilgi işlem ve ilgili çerçeveler;
  • Matematik ve istatistik bilgisi ve bunun üzerine makine öğreniminin nasıl inşa edildiği.

Üniversitede, makine öğreniminin temel kursları gerekli bilgilerin bir kısmını tanıtmak için zaman alacaktır. Tarihsel nedenlerden dolayı, makine öğrenimi dersleri genellikle Bilgisayar Bilimleri Bölümüne aittir.Öğrenciler genellikle ilk iki gerekli bilgi alanında eğitim alırlar, ancak matematik ve istatistik konusunda çok fazla bilgiye sahip olmayabilirler. Mevcut makine öğrenimi ders kitapları, kitabın başında veya ekte olabilecek bir veya iki bölümle arka plan matematiğini kapsamaya çalışıyor. Bu kitap, temel makine öğrenimi kavramlarının matematiksel temelini tanıtacak ve ilgili bilgileri toplayacaktır.

Neden makine öğrenimi üzerine başka bir kitap yazasınız?

Makine öğrenimi, sezgisel görünen ancak resmileştirilmesi zor olan kavramları ifade etmek için matematik dili üzerine inşa edilmiştir. Düzgün bir şekilde resmileştirildikten sonra, makine öğrenimi algoritma tasarımının seçim sonuçlarını türetmek için matematiksel araçları kullanabiliriz. Bu, çözülen görevi anlamamıza ve aynı zamanda zekanın doğasını anlamamıza yardımcı olur. Dünya genelinde matematik alanında uzmanlaşan öğrencilerin yaptığı yaygın bir şikayet, matematik konularının gerçek problemlerle ilgisiz görünmesidir. Makine öğreniminin, insanların matematiği öğrenmesi için doğrudan motivasyon olduğuna inanıyoruz.

Bu kitap, modern makine öğreniminin temelini oluşturan kapsamlı matematik literatürüne bir rehber olarak tasarlanmıştır. Temel makine öğrenimi problemlerinde matematiksel kavramların yararlılığına doğrudan işaret ederek matematiksel kavram öğrenmeye olan ihtiyacı teşvik ediyoruz. Kitabı olabildiğince kısa tutmak için pek çok detayı ve ileri kavramları atladık. Bu kitap temel olarak temel matematiksel kavramları ve bunların makine öğrenimi bağlamındaki anlamlarını tanıtır.Okuyucular, bölümün sonunda daha fazla çalışma için birçok kaynak bulabilir. Matematiksel geçmişi olan okuyucular için bu kitap, makine öğrenimine kısa ama doğru bir genel bakış sağlar. Esas olarak makine öğrenimi yöntemlerini ve modellerini veya programlama bilgisini tanıtan kitapların aksine, bu kitap yalnızca dört temsili makine öğrenimi algoritması sağlar. Esas olarak modelin arkasındaki matematiksel kavramlara odaklanıyoruz ve soyut güzelliğini tanımlıyoruz. Tüm okuyucuların, matematiksel modeldeki temel seçim yoluyla makine öğrenimi uygulamalarında görünen temel makine öğrenimi problemleri ve ilgili pratik problemler hakkında daha derin bir anlayışa sahip olabileceğini umuyoruz.

Hedef kitle

Makine öğrenimi uygulamalarının toplumda yaygınlaşmasıyla birlikte, herkesin arkasındaki ilkeleri anlaması gerektiğine inanıyoruz. Bu kitap, okuyucuların makine öğreniminin arkasındaki kavramları doğru bir şekilde anlamalarına yardımcı olmak için akademik matematik tarzında yazılmıştır. Bu stile aşina olmayan okuyucuları bu kitabı okumaya ve her konunun hedeflerini akılda tutmaya teşvik ediyoruz. Okuyucuların genel durumu anlamalarına yardımcı olmayı umarak, metne çok sayıda yorum ekleyeceğiz. Bu kitap, okuyucunun ortaokul matematik ve fizik bilgisine sahip olduğunu varsayar. Örneğin, okuyucu iki boyutlu ve üç boyutlu geometrik vektörlerin yanı sıra türevler ve integraller hakkında bilgiye sahip olmalıdır. Bu nedenle, bu kitabın hedef kitlesi, lisans öğrencileri, ikinci öğretim öğrencileri ve çevrimiçi makine öğrenimi kurslarına katılan kişileri içerir.

Kitabın yapısı şu şekildedir:

Bölüm 1: Matematiksel temel

1. Giriş ve motivasyon

2. Doğrusal Cebir

3. Analitik Geometri

4. Matris Ayrıştırması

5. Vektör Kalkülüs

6. Olasılık ve Dağılım

7. Sürekli optimizasyon

2. Bölüm: Makine öğreniminin temel sorunları

1. Model verilerle karşılaştığında

2. Doğrusal regresyon

3. Boyut azaltma için temel bileşen analizini kullanın

4. Yoğunluk tahmini için Gauss karışım modelini kullanma

5. Sınıflandırma için destek vektör makinelerini kullanın

Makine öğreniminde matematiği anlamak için aşağıdaki iki stratejiyi kullanabiliriz:

Temelden ileri düzeye doğru kavramlar oluşturun. Bu genellikle matematik gibi teknik alanlar için tercih edilen yöntemdir. Bu stratejinin avantajı, okuyucuların belirsiz ve kabul edilemez görüşlerle karşılaşmadan daha önce öğrendikleri tanımlara her zaman güvenebilmeleridir. Ancak uygulayıcılar için, birçok temel kavramın kendisi çok ilginç değildir, bu nedenle çoğu temel tanım onlar tarafından hızla unutulacaktır.

Daha temel gereksinimleri bulmak için gerçek ihtiyaçların ayrıntılarını inceleyin. Bu hedef odaklı yaklaşımın avantajı, okuyucuların her zaman neden belirli bir kavramı incelemeleri gerektiğini bilmeleri ve hangi bilgiye ihtiyaç duyduklarını açıkça bilmeleridir. Bu stratejinin dezavantajı, bilginin temelinin sağlam olmaması ve okuyucuların anlamadıkları bir dizi kelimeyi hatırlamaları gerektiğidir.

Bu kitap iki bölüme ayrılmıştır: İlk bölüm matematiğin temellerinden bahseder ve ikinci bölüm ilk bölümün kavramlarını temel makine öğrenimi problemlerine uygular ve ardından Şekil 1.1'de gösterilen "makine öğreniminin dört sütununu" oluşturur.

Şekil 1.1: Makine öğreniminin temeli ve dört temel direği İlk bölüm matematikle ilgili

Sayısal verileri vektörler olarak ve bu verilerin tablosunu matrisler olarak temsil ediyoruz. Vektörlerin ve matrislerin incelenmesine doğrusal cebir denir, bu kitabın 2. Bölümüne bakın.

Genellikle verilerin, bazı gerçek potansiyel sinyallerin gürültü gözleminin sonucu olduğunu düşünüyoruz ve makine öğrenimi yoluyla gürültüden gelen sinyali tanımlamayı umuyoruz. Bunun için gürültünün anlamını ölçmek için bir dile ihtiyacımız var. Ayrıca, örneğin belirli bir test verilerinin olasılığına olan güvenimizi ölçmek için belirli belirsizlikleri ifade edecek tahmin edicilere sahip olmayı da sık sık umuyoruz. Belirsizliğin nicelendirilmesi, olasılık teorisi alanına aittir ve bu kitabın 6. Bölümünde ele alınmıştır.

Yokuş tırmanışı makine öğrenimi modellerini eğitmeye uygulamak için, bize çözümleri nerede bulacağımızı söyleyecek olan gradyan kavramını resmileştirmemiz gerekiyor. Arama yönü fikri, Bölüm 5'te sunduğumuz hesaplamayla biçimlendirilmiştir. Dağın tepesini bulmak için bu arama yönü dizilerinin nasıl kullanılacağı optimizasyon olarak adlandırılır, bu kitabın 7. Bölümüne bakın.

İkinci bölüm makine öğrenimiyle ilgili

Bu kitabın ikinci bölümü, aşağıdaki tabloda gösterildiği gibi makine öğreniminin dört temelini tanıtıyor. Tablodaki her satır, sorunun ilgili değişkeninin sürekli mi yoksa kategorik mi olduğunu ayırt eder. Bu kitabın ilk bölümünde tanıtılan matematiksel kavramların makine öğrenimi algoritmalarının tasarımına nasıl uygulanacağını açıkladık.

Tablo 1.1: Makine öğreniminin dört ayağı

Şekil 2.2: Bu zihin haritası, bu bölümde tanıtılan kavramları ve diğer bölümlerle olan bağlantılarını gösterir. - Bitiş -

Tsinghua-Qingdao Veri Bilimi Enstitüsü'nün resmi WeChat kamu platformunu takip edin " THU Veri Pastası "Ve kız kardeş numarası" Veri Pastası THU "Daha fazla ders avantajı ve kaliteli içerik elde edin.

Çok ilerisinde! 27 yaşındaki Çin Süper Ligi, Dörtlüsü öldürecek ve Avrupa'nın ilk on Altın Çizme'sine girecek!
önceki
35 yaşından önce, uluslararası futbolcunun bu kadar patlayıcı kasları var ve Süper Lig'de hala ana gücü oynayabilmesine şaşmamalı!
Sonraki
Kuru ürünler Tsinghua Üniversitesi'nden Zheng Fang: Kimlik Doğrulaması için Ses Teknolojisi Teorisi ve Uygulaması
İyi bir pomelo nedir? Bubble Expo'daki "göz alıcı" Meishan Pan'ao bal pomelo size cevabı söyleyecek
U23'e karşı çeşitli tanrı değişiklikleri! Mingji doğrudan ateş ediyor: Süper Lig takımı Futbol Federasyonu'nun politikasını küçük düşürüyor
Özel Otomatik özellik mühendisliğini gerçekleştirmek için Python Featuretools kitaplığını kullanın (bağlantı ile)
Bundesliga-Lewand 3 dakikada 2 gol Zhang Yuning kadroyu kaçırdı Bayern 2-0 Dortmund 2-0 Herta
Büyük veri ve yapay zeka, Double Eleven'e bir saldırı olan e-ticareti destekliyor!
Chengdu, 1-15 Kasım arasında 180.000'den fazla paylaşılan bisikleti temizledi
Savaş Raporu - Manchester United arka arkaya üç galibiyet kazandı, Dybala bir şapka giydi, Juventus 4 golle tersine döndü, Inter Milan 3-1 Roma
Karides kabukları, Pippi karidesleri için plastik, çevre dostu geri dönüşüm yöntemleri haline geliyor
Sanat öğrencileri 12 haftalık eğitimin ardından Google Brain AI bilim adamları mı oluyor? Kişi dedi ki: çok düşünüyorsun
İtalya'nın yaşam kalitesi sıralaması: Bolzano birinci, Milan 55., Roma 88.
La Liga-Messi puan kaybettikten sonra iki gol attı, Paulinho ilk maçına Barcelona 2-0 Atletico Madrid 5-1 ile çıktı.
To Top