Lei Feng Net Not: Bu makale, Lei Feng'in altyazı grubu tarafından derlenen teknik bir blogdur. Asıl başlık Matematik, İstatistikler ve Makine Öğrenimi için NLP: Olabildiğince Hızlı ve yazar Souman Roy'dur.
Tercüme | Liao Ying Long Keyu Noddleslee J Amca Bitirme | Fan Jiang
Makine öğrenimi: giriş
İnsanların makine öğrenimi hakkında konuştuğunu duydunuz, ancak kavramını anlamadınız mı?
Makine öğrenimine sıfırdan başlamak, ancak İnternet'teki devasa kaynaklar karşısında gözlerinizi kamaştırmak mı istiyorsunuz?
Endişelenmeyin, size 0'dan 1'e kadar bir makine öğrenimi serisi sağladık. Bu seri, girişten ustaya kadar size izin verebilir.
Şimdi öğrenmeye başlayın!
· · ·
Bu kılavuz, makine öğrenimiyle ilgilenen ancak nasıl başlayacağını bilmeyenler içindir. İnternette çok fazla bilgi aramaktan bıkan çoğu insanın hayal kırıklığına uğrayacağını ve birilerinin onlara nasıl başlayacakları konusunda rehberlik edebileceği umudunu yitireceğini düşünüyorum.
Bu dizinin amacı, makine öğrenimini yeni başlayanların bakış açısından doğru bir şekilde öğrenmeyi öğretmektir.
· · ·
Matematik neden gereklidir?
Makine öğrenimi, bazı temel matematik derslerine dayanır, Matematik, doğrusal cebir, olasılık teorisi, istatistik ve optimizasyon gibi . Bu makale, bazı temel kavramları öğrenmenize yardımcı olmayı ve Python programlama dilini Jüpiter Notebook'ta kullanmak için operasyonel bir yöntem sağlamayı amaçlamaktadır.
Adım 1: Doğrusal Cebir
Doğrusal cebir, bilgisayarlarda optimizasyon algoritmaları tasarlamanın bir yoludur - çözülebilir Doğrusal sistem kısıtlamaları sorun.
Doğrusal cebirde anlamanız gereken kavramlar:
# 1 Matrisin sıralaması;
# 2 Matris vektör çarpımı;
# 3 Matrisin sütun uzayı ve sıfır uzayı;
# 4 Özdeğerler ve özvektörler;
# 5 Matrisin tekil değer ayrışımı;
Bu, doğrusal cebir kavramlarını anlamak için bir hile sayfasıdır:
Kaynak: https://minireference.com/static/tutorials/linear_algebra_in_4_pages.pdf
Adım 2: Olasılık Teorisi ve Matematiksel İstatistik
Bu matematik dalı çözmek için kullanılır Rastgele dağıtım şüpheli.
Olasılık teorisinde ve matematiksel istatistikte anlamanız gereken kavramlar:
Olasılık teorisi:
# 1 Sayma yöntemi ve kombinasyon yöntemi;
# 2 Bayes teorisi;
# 3 Rastgele değişkenler;
# 4 Beklenti;
# 5 varyans;
# 6 Koşullu dağıtım ve ortak dağıtım;
# 7 Moment üreten fonksiyon;
# 8 Üstel dağılım ailesi;
Matematiksel İstatistikler:
# 1 Maksimum olasılık tahmini;
# 2 Maksimum arka olasılık;
# 3 Önceki olasılık ve son olasılık;
# 4 Spot kontrol yöntemi;
# 5 Gibbs fenomeni;
# 6 Ortalama, mod, medyan, varyans;
Bu, olasılık teorisi ve matematiksel istatistik kavramlarını anlamak için hızlı bir referans tablosudur:
Kaynak: https://static1.squarespace.com/static/54bf3241e4b0f0d81bf7ff36/t/55e9494fe4b011aed10e48e5/1441352015658/probability_cheatsheet.pdf
Kaynak:
3. Adım: Çok Değişkenli Analiz
Klasik hesap, değişkenler ve değişim oranı arasındaki ilişkiyi inceler. Ancak makine öğreniminde, esas olarak fonksiyonların aşırı değerlerini çözmek için diferansiyel işlemleri ve olasılık modellerini çözmek için integral işlemleri kullanırız.
Çok değişkenli analizde ustalaşmanız gereken kavramlar
1 numaralı vektör değeri işlevi
# 2 kısmi türev fonksiyonu
# 3 gradyan
# 4 Yönlü gradyan
# 5 Hesse Operatörü
# 6 Jacobi operatörü
# 7 Laplace operatörü (düşük miktar operatörü)
# 8 Lagrange Çarpanı
Kaynak:
Adım 4: Bilgi Teorisine Giriş
Bilgi teorisi, bilginin nasıl "ölçüleceğine" odaklanan uygulamalı matematiğin bir dalıdır.
Bilgi teorisinde ustalaşmanız gereken kavramlar:
# 1 entropi
# 2 karşılıklı bilgi
3. bilgi kazancı
# 4 KL sapması (göreceli entropi)
Kaynak:
Adım 5: NLP (Doğal Dil İşleme)
Doğal dil, konuşma ve metin enjekte etme teknolojisini otomatik olarak işlemek için yazılımın kullanılması anlamına gelir.
Metin verileriyle ilgilenen makine öğrenimi uygulayıcıları olarak, doğal dil alanındaki araçları ve yöntemleri önemsiyoruz.
Geniş anlamda, bir bilgisayar tarafından işlenen herhangi bir doğal dil, doğal dil işleme olarak kabul edilir veya NLP olarak kısaltılır. Örneğin, aşırı bir anlayış için, farklı yazarların yazma stillerini kelime frekanslarını sayarak karşılaştırabilirsiniz. Diğer aşırı anlayış, NLP'nin anlamlı bir yanıt vermek için en azından bir dereceye kadar tüm insan söylemini anlamayı içermesi gerektiğidir.
- Sayfa 9, Doğal dil işleme için python kullanın, 2009.
Doğal dil işleme (NLP), insan dilinin bir dizi otomatik işlenmesinin toplu bir ismini ifade eder. Yalnızca insanlar tarafından metin çıktısını işlemeyi değil, aynı zamanda insanların görebileceği metin çıktısını da içerir.
- Sayfa 18, Sinir Ağlarını Kullanarak Doğal Dil İşleme, 2017.
Dilbilimin amacı, çevremizdeki büyük miktarlarda gözlemlenebilen konuşmaları, metinleri ve diğer medyayı karakterize etmek ve yorumlamaktır. Bu, yalnızca insan bilişini incelemeyi, dili üretme ve anlama yeteneğini değil, aynı zamanda dil ifadesi ile nesnel dünya arasındaki ilişkiyi ve farklı dillerin dil yapısını anlamayı da içerir.
- Sayfa 3, İstatistiksel Doğal Dil İşleme, 1999.
Bunlar temel matematik, istatistiksel doğal dil işleme bilgisidir. Benim önerim, makine öğrenimini derinlemesine keşfetmek istiyorsanız, bahsedilen kavramların en azından bazılarına hakim olmanız gerektiğidir.
· · ·
Geçmişte makine öğreniminde hangi matematiksel bilginin kullanıldığını merak etmiş olabilirsiniz. Bu makale, makine öğreniminin (AI) ilk aşamasında ihtiyaç duyulan bazı matematiksel kavramlara giriş olarak düşünülebilir. Bir sonraki bölümde, matematiksel kavramların Python ile programlamaya nasıl uygulanacağını tartışacağım.Bu nedenle, Python programlama dilini ve ekosistemini de tanıtacağım, bu yüzden bizi izlemeye devam edin!
· · ·
Daha fazla makale için Leifeng.com'u takip edin Leifeng.com Leifeng.com
Leifeng Subtitle Group'un (leiphonefansub) WeChat hesabını arkadaş olarak ekle
Yapay Zeka Gönüllüsü Olmak İçin "Katılmak istiyorum" açıklaması