Kaynak: Heart of the Machine
Bu makale yaklaşık 1500 kelimedir, okumanız tavsiye edilir 5 dakika.
Bu makale, "Makine Öğrenmesi için Matematik" in tüm taslaklarının yakın zamanda yayınlandığını sizlerle paylaşıyor. Bu kitaba kısa bir genel bakış derledik.
Yakın zamanda, Marc Peter Deisenroth, A Aldo Faisal ve Cheng Soon Ong tarafından yazılan Mathematics for Machine Learning kitabının tüm taslakları yayınlandı Bu kitabın kısa bir özetini derledik. İlgilenen okuyucular tam metni (İngilizce) aşağıdaki bağlantıdan edinebilirler.
Kitap adresi: https://mml-book.github.io/Aşağıdaki, kitabın kısmi bir önsözüdür.
Makine öğrenimi, makine inşa etmek ve otomatik sistemler oluşturmak için uygun bir format hakkında insan bilgisini ve mantığını yakalamak için en son girişimdir. Makine öğrenimi daha yaygın hale geldikçe ve yazılım paketlerinin kullanımı kolaylaştıkça, uygulayıcıların düşük seviyeli teknik ayrıntılara dikkat etmemesi doğaldır. Ancak bu, uygulayıcıların tasarım kararlarını anlamadıkları ve makine öğrenimi algoritmalarının sınırlamalarını görmezden gelme olasılıkları daha yüksek olan bazı riskler getiriyor. Başarılı makine öğrenimi algoritmalarının arkasındaki mekanizmalarla ilgilenen uygulayıcıların aşağıdaki temel bilgileri öğrenmesi gerekir:
Üniversitede, makine öğreniminin temel kursları gerekli bilgilerin bir kısmını tanıtmak için zaman alacaktır. Tarihsel nedenlerden dolayı, makine öğrenimi dersleri genellikle Bilgisayar Bilimleri Bölümüne aittir.Öğrenciler genellikle ilk iki gerekli bilgi alanında eğitim alırlar, ancak matematik ve istatistik konusunda çok fazla bilgiye sahip olmayabilirler. Mevcut makine öğrenimi ders kitapları, kitabın başında veya ekte olabilecek bir veya iki bölümle arka plan matematiğini kapsamaya çalışıyor. Bu kitap, temel makine öğrenimi kavramlarının matematiksel temelini tanıtacak ve ilgili bilgileri toplayacaktır.
Neden makine öğrenimi üzerine başka bir kitap yazasınız?Makine öğrenimi, sezgisel görünen ancak resmileştirilmesi zor olan kavramları ifade etmek için matematik dili üzerine inşa edilmiştir. Düzgün bir şekilde resmileştirildikten sonra, makine öğrenimi algoritma tasarımının seçim sonuçlarını türetmek için matematiksel araçları kullanabiliriz. Bu, çözülen görevi anlamamıza ve aynı zamanda zekanın doğasını anlamamıza yardımcı olur. Dünya genelinde matematik alanında uzmanlaşan öğrencilerin yaptığı yaygın bir şikayet, matematik konularının gerçek problemlerle ilgisiz görünmesidir. Makine öğreniminin, insanların matematiği öğrenmesi için doğrudan motivasyon olduğuna inanıyoruz.
Bu kitap, modern makine öğreniminin temelini oluşturan kapsamlı matematik literatürüne bir rehber olarak tasarlanmıştır. Temel makine öğrenimi problemlerinde matematiksel kavramların yararlılığına doğrudan işaret ederek matematiksel kavram öğrenmeye olan ihtiyacı teşvik ediyoruz. Kitabı olabildiğince kısa tutmak için pek çok detayı ve ileri kavramları atladık. Bu kitap temel olarak temel matematiksel kavramları ve bunların makine öğrenimi bağlamındaki anlamlarını tanıtır.Okuyucular, bölümün sonunda daha fazla çalışma için birçok kaynak bulabilir. Matematiksel geçmişi olan okuyucular için bu kitap, makine öğrenimine kısa ama doğru bir genel bakış sağlar. Esas olarak makine öğrenimi yöntemlerini ve modellerini veya programlama bilgisini tanıtan kitapların aksine, bu kitap yalnızca dört temsili makine öğrenimi algoritması sağlar. Esas olarak modelin arkasındaki matematiksel kavramlara odaklanıyoruz ve soyut güzelliğini tanımlıyoruz. Tüm okuyucuların, matematiksel modeldeki temel seçim yoluyla makine öğrenimi uygulamalarında görünen temel makine öğrenimi problemleri ve ilgili pratik problemler hakkında daha derin bir anlayışa sahip olabileceğini umuyoruz.
Hedef kitleMakine öğrenimi uygulamalarının toplumda yaygınlaşmasıyla birlikte, herkesin arkasındaki ilkeleri anlaması gerektiğine inanıyoruz. Bu kitap, okuyucuların makine öğreniminin arkasındaki kavramları doğru bir şekilde anlamalarına yardımcı olmak için akademik matematik tarzında yazılmıştır. Bu stile aşina olmayan okuyucuları bu kitabı okumaya ve her konunun hedeflerini akılda tutmaya teşvik ediyoruz. Okuyucuların genel durumu anlamalarına yardımcı olmayı umarak, metne çok sayıda yorum ekleyeceğiz. Bu kitap, okuyucunun ortaokul matematik ve fizik bilgisine sahip olduğunu varsayar. Örneğin, okuyucu iki boyutlu ve üç boyutlu geometrik vektörlerin yanı sıra türevler ve integraller hakkında bilgiye sahip olmalıdır. Bu nedenle, bu kitabın hedef kitlesi, lisans öğrencileri, ikinci öğretim öğrencileri ve çevrimiçi makine öğrenimi kurslarına katılan kişileri içerir.
Kitabın yapısı şu şekildedir:
Bölüm 1: Matematiksel temel
1. Giriş ve motivasyon
2. Doğrusal Cebir
3. Analitik Geometri
4. Matris Ayrıştırması
5. Vektör Kalkülüs
6. Olasılık ve Dağılım
7. Sürekli optimizasyon
2. Bölüm: Makine öğreniminin temel sorunları
1. Model verilerle karşılaştığında
2. Doğrusal regresyon
3. Boyut azaltma için temel bileşen analizini kullanın
4. Yoğunluk tahmini için Gauss karışım modelini kullanma
5. Sınıflandırma için destek vektör makinelerini kullanın
Makine öğreniminde matematiği anlamak için aşağıdaki iki stratejiyi kullanabiliriz:
Temelden ileri düzeye doğru kavramlar oluşturun. Bu genellikle matematik gibi teknik alanlar için tercih edilen yöntemdir. Bu stratejinin avantajı, okuyucuların belirsiz ve kabul edilemez görüşlerle karşılaşmadan daha önce öğrendikleri tanımlara her zaman güvenebilmeleridir. Ancak uygulayıcılar için, birçok temel kavramın kendisi çok ilginç değildir, bu nedenle çoğu temel tanım onlar tarafından hızla unutulacaktır.
Daha temel gereksinimleri bulmak için gerçek ihtiyaçların ayrıntılarını inceleyin. Bu hedef odaklı yaklaşımın avantajı, okuyucuların her zaman neden belirli bir kavramı incelemeleri gerektiğini bilmeleri ve hangi bilgiye ihtiyaç duyduklarını açıkça bilmeleridir. Bu stratejinin dezavantajı, bilginin temelinin sağlam olmaması ve okuyucuların anlamadıkları bir dizi kelimeyi hatırlamaları gerektiğidir.
Bu kitap iki bölüme ayrılmıştır: İlk bölüm matematiğin temellerinden bahseder ve ikinci bölüm ilk bölümün kavramlarını temel makine öğrenimi problemlerine uygular ve ardından Şekil 1.1'de gösterilen "makine öğreniminin dört sütununu" oluşturur.
Şekil 1.1: Makine öğreniminin temeli ve dört temel direği İlk bölüm matematikle ilgiliSayısal verileri vektörler olarak ve bu verilerin tablosunu matrisler olarak temsil ediyoruz. Vektörlerin ve matrislerin incelenmesine doğrusal cebir denir, bu kitabın 2. Bölümüne bakın.
Genellikle verilerin, bazı gerçek potansiyel sinyallerin gürültü gözleminin sonucu olduğunu düşünüyoruz ve makine öğrenimi yoluyla gürültüden gelen sinyali tanımlamayı umuyoruz. Bunun için gürültünün anlamını ölçmek için bir dile ihtiyacımız var. Ayrıca, örneğin belirli bir test verilerinin olasılığına olan güvenimizi ölçmek için belirli belirsizlikleri ifade edecek tahmin edicilere sahip olmayı da sık sık umuyoruz. Belirsizliğin nicelendirilmesi, olasılık teorisi alanına aittir ve bu kitabın 6. Bölümünde ele alınmıştır.
Yokuş tırmanışı makine öğrenimi modellerini eğitmeye uygulamak için, bize çözümleri nerede bulacağımızı söyleyecek olan gradyan kavramını resmileştirmemiz gerekiyor. Arama yönü fikri, Bölüm 5'te sunduğumuz hesaplamayla biçimlendirilmiştir. Dağın tepesini bulmak için bu arama yönü dizilerinin nasıl kullanılacağı optimizasyon olarak adlandırılır, bu kitabın 7. Bölümüne bakın.
İkinci bölüm makine öğrenimiyle ilgiliBu kitabın ikinci bölümü, aşağıdaki tabloda gösterildiği gibi makine öğreniminin dört temelini tanıtıyor. Tablodaki her satır, sorunun ilgili değişkeninin sürekli mi yoksa kategorik mi olduğunu ayırt eder. Bu kitabın ilk bölümünde tanıtılan matematiksel kavramların makine öğrenimi algoritmalarının tasarımına nasıl uygulanacağını açıkladık.
Tablo 1.1: Makine öğreniminin dört ayağı Şekil 2.2: Bu zihin haritası, bu bölümde tanıtılan kavramları ve diğer bölümlerle olan bağlantılarını gösterir. - Bitiş -Tsinghua-Qingdao Veri Bilimi Enstitüsü'nün resmi WeChat kamu platformunu takip edin " THU Veri Pastası "Ve kız kardeş numarası" Veri Pastası THU "Daha fazla ders avantajı ve kaliteli içerik elde edin.