Makine öğrenimi modeli Siçuan mutfağını Hunan mutfağından ayırabilir mi?

Kaynak: Udacity, Weekly

Bu makale toplam 1100 kelimedir ve 8 dakika okumanız tavsiye edilir.

Bu makale, verileri yükleme ve analiz etme, modeller oluşturma ve model tahminlerinin üç adımı aracılığıyla hammaddeleri ve mutfakları haritalamak için bir makine öğrenimi modelini nasıl uygulayacağınızı öğretir.

Bir bölgenin kültürü her zaman yerel özel yemeklerden ayrılamaz, küçük bir köyden büyük bir ülkeye kadar her yerin kendine özgü bir "tadı" olduğu söylenebilir.

Kuzey Kaliforniya'daysanız, koyu mor lahana ve parlak pembe ve sarı pancar gibi çeşitli sebzeleri tadacaksınız. Kore'de baştan çıkarıcı kırmızı kimchi sizi karşılayacak ve denizin kokusu dikkatinizi yakınlarda kıvrılan kalamarlara çekecektir. Hint pazarı, parlak renkleri ve düzinelerce baharat aromasıyla belki de en renkli olanıdır: zerdeçal, yıldız anason ...

Nitelikli bir "gurme" olarak, "pirinç, deniz yosunu ve somon" gördüğümde Japon suşisini düşünüyorum ve "yumurta, jambon, ekmek, salata sosu" gördüğümde sandviçleri düşünüyorum ... Malzemelere göre mutfağı tahmin edin ve piton kullanın To!

Makine öğrenimi yöntemleri, modelleri oluşturmak, eğitmek ve test etmek için kullanılabilir ve hammadde ve mutfakların haritalanmasını sağlamak için değerlendirme matrisi aracılığıyla en uygun modeli seçebilir. İstenilen işlevi elde etmek için aşağıdaki üç adımı gerçekleştirmemiz gerekir:

  • Verileri yükleyin ve analiz edin
  • Modelleme
  • Model tahmini

1. Verileri yükleyin ve analiz edin

İtalyan mutfağını örnek alarak aşağıdaki formatta örnek veriler hazırladık. Bunlar arasında "id", farklı yemek türlerini ve "mutfak", mutfağın adını temsil eder.

Verileri aldıktan sonra, önce verileri çıkarın ve reçete düğümleri aşağıdaki gibidir. Tarif kimliği, yemek türü ve malzeme listesi eğitim seti içerir.

Ardından, sırasıyla train_ingredients ve train_targets için özellikler ve hedef atayın. İstatistiksel analiz ve diğer işlemler yoluyla, en sık kullanılan 10 hammadde hesaplanabilir ve hammadde adı ve oluşum sayısı sum_ingredients sözlüğüne atanabilir. Örnek veriler aracılığıyla, İtalyan mutfağında en sık kullanılan 10 malzemeyi hesaplayabilir ve malzemelerin adını ve geçtiği yeri italian_ingredients sözlüğüne atayabilir.

Elde edilen sonuçlar matplotlib ile görselleştirilebilir. Veri analizi sayesinde pek çok ilginç bilgi edinebiliriz.Örneğin Brezilya mutfağında en çok kullanılan malzemeler soğan, zeytinyağı, limon vb. Çin'de limon, ev yapımı yemeklere pek sık ziyaretçi gelmiyor. En çok kullanılan malzemeler soya sosu, susam yağı, mısır nişastası vb. Editör, Lao Gan Ma'nın Çin'in bir numaralı içeriğine büyük bir katkı yapmış olabileceğini tahmin etti!

Japonya'nın daha farklı aşkına ve soya sosu da listede yer alıyor.

Ancak soğuk Rusya'da tereyağı, sofraların vazgeçilmez bir bileşeni ve savaşan ülkeler için önemli bir enerji kaynağı haline geldi. Birleşik Krallık'tan bahsetmiyorum bile, tereyağı, tereyağı, patates ve sütü seviyorsanız Birleşik Krallık'a gidin!

2. Bir model oluşturun

Bir model oluşturma süreci biraz karmaşık olabilir ve esas olarak aşağıdaki dört adımda gerçekleştirilir:

1. Kelime temizleme

2. Özellik çıkarma (TF_IDF kullanarak)

3. Veri bölümleme ve yeniden düzenleme: Eğitim setini yeni bir eğitim setine ve bir doğrulama setine bölmek için train_test_split işlevini çağırın.

4. Eğitim modeli: Modeli eğitme sürecinde farklı parametreleri denemeniz ve en iyi genelleme yeteneğine sahip modeli seçmeniz gerekir. Modeli eğiterek, doğrulama setindeki puan hesaplanabilir. Puan ne kadar yüksekse, sınıflandırma doğruluğu da o kadar yüksek olur (doğru şekilde sınıflandırılan tabakların yüzdesi). Bu şekilde mükemmel bir model tamamlanmış olur!

3. Model tahmini

Test.json test dosyasında, tarifin formatı train.json ile aynıdır, tahmin etmek istediğimiz hedef değişken olduğu için sadece yiyecek türü silinir.

Genel olarak, malzemelere göre mutfağı tahmin etme süreci karmaşık değildir, ancak Sınıflandırma sistemini ve eşleştirme derecesini yükseltmek için kod nasıl geliştirilir ve model nasıl optimize edilir? , Başarmak istediğimiz anahtar hedeftir. Veriler etkili bir şekilde temizlenemez ve sınıflandırılamazsa, birçok Fransız yemeği yanlışlıkla İtalyan yemekleri olarak sınıflandırılacaktır.

Lütfen yeniden yazdırmak için THU verilerini belirtin

Operatör: Ran Xiaoshan

Dijital yerliler için özel olarak tasarlanmış, dünyanın ilk tam ağ bağlantılı gömleği 10ELEVEN9'un harika yanı nedir?
önceki
Bilim adamları, yarasaların uçuş hareketlerinin% 57'sini simüle edebilen bir yarasa robotu geliştirdiler.
Sonraki
4. seviyeye yükseliyor! Wuhan dünyanın en iyi 100 şehri arasında yer alıyor, uluslararası arkadaşlar bugün burada
O gece gol çizgisinin önünde dans ederek Şampiyonlar Ligi tarihindeki ilk mucizeyi yarattı!
Kuru Mal Koleksiyonu Bilgisayar öğreniminde kaçırmamanız gereken en iyi 10 web sitesi (web sitesi bağlantıları dahil)
çok acımasız! Kaliforniya orman yangınlarında binlerce hayvan öldürüldü, zürafalar sahipleri tarafından terk edildi
Kotlin tehditleri ve Python karşı saldırıları Programcıların yükseltmek için hangi becerilere ihtiyacı var? (İndirilecek raporu ekleyin)
Dronlarla oynadınız, ancak cep telefonu kılıflarında dronlarla oynadınız mı?
Kuru ürünler Aktivasyon işlevi hakkında 6 temel bilgi noktası, lütfen ustalaştığınızdan emin olun!
Yapay zeka kuru ürün paylaşımı: iş dünyasında veriye dayalı akıllı karar verme uygulaması (fotoğraflarla)
40 milyondan fazla veriyi analiz edersek, yetenek temettü cazibesi ne kadar büyük? (İndirilecek raporu ekleyin)
Dongfeng Honda UR-V: Seçkin tüketiciler mantıklı bir seçime geri dönüyor
Denetimsiz uçtan uca görüntü sınıflandırması elde etmek için bu yöntemi kullanın! (Kağıt ile)
100'den fazla fener seti Tianyi Gölü'nün kıyılarını aydınlatıyor
To Top