Python dilini bilmiyorsanız, sadece node.js konusunda acemisiniz. Bu makaleyi okuduktan sonra kesinlikle çok fazla faydalandığınızı ve yeni bir beceri kazandığınızı hissedeceksiniz. Sıfırdan node.js nasıl kullanılır? Basit bir tarayıcı yazmak için, bu on dakikada yapılabilir Adımlar aslında çok basittir. Düğümün kurulumu adım adım açıklanmayacaktır. Düğüm açık ortamında ilk adımı başlatın:
1: d sürücüsünde yeni bir WebSpider klasörü oluşturun
2: Yönetici modunda açmak için cmd'ye sağ tıklayın, d sürücüsüne girin ve az önce oluşturulan klasöre cd yapın
cd WebSpider
3: mkdir FirstSpider (FirstSpider klasörü oluşturun)
FirstSpider klasörünü oluşturduktan sonraki dizin
4: Az önce oluşturulan cd FirstSpider klasörünü girin
5: npm init (başlatma projesi)
Şu anda bazı proje bilgilerini doldurmanız gerekiyor, duruma göre doldurabilirsiniz, tabii ki sonuna kadar Enter tuşuna da basabilirsiniz.
Proje oluşturulduktan sonra bir package.json dosyası oluşturulacaktır. Bu dosya, projenin temel bilgilerini içerir.
6: Üçüncü taraf bir paket kurun (program doğrudan paketin modülünü arayacaktır)
Not: Http modülü ve fs modülünün her ikisi de yerleşik paketler olduğundan, bunları eklemeye gerek yoktur. Cheerio paketini kurun ve buradan paket isteyin. isteği bir http isteğini başlatmak için kullanılır, cheerio indirilen domu analiz etmek ve çıkarmak için kullanılır. Bunu cmd'de jQuery, cd FirstSpider klasörüne cd olarak kullanabilir ve şu komutu çalıştırabilirsiniz:
npm cheerio yükle save
Cheerio paketini kurduktan sonra, istek paketini kurmaya devam edin, npm yükleme isteği save
Açıklama: npm (nodejs paket yöneticisi), nodejs paket yöneticisi; save'in amacı, projenin paket üzerindeki bağımlılığını package.json dosyasına yazmaktır.
Taranan verileri ve resimleri kategorize etmek istiyorsanız, önceden hazırlamak için bir veri ve görüntü klasörü oluşturun. FirstSpider klasörünün altında yeni bir tane oluşturun.
Bir alt klasör verisi oluşturun (yakalanan haber metni içeriğini saklamak için kullanılır) Bir alt klasör görüntüsü oluşturun (yakalanan görüntü kaynaklarını depolamak için kullanılır) First_spider dosyası oluşturunTüm projenin dizin yapısı aşağıda gösterilmiştir:
7: Anahtar içerik, first_spider'ı açın ve kodu satır satır yazın.Kodu yazmak istemiyorsanız, test etmek için bir kod bulmak için web sitesine gidin.
var istek = gerekli ('istek') var cheerio = required ('cheerio') için (var i = 1; i < 4; i ++) { istek (' (hata, yanıt, gövde) { if (! error response.statusCode == 200) { $ = cheerio.load (gövde) var linkler =; $ (". boldBorder > a "). each (function (i, item) { links.push ($ (bu) .attr ("href")) }) için (var i = 0; i < links.length; i ++) { istek ('http: //www.souweixin.com'+links , function (hata, yanıt, gövde) { if (! error response.statusCode == 200) { $ = cheerio.load (gövde) console.log ('weixin:' + $ ['. bold']. text () + 'name:' + $ ['h1']. text () + 'desc:' + $ ('. f18'). Metin()); } }) } } }) }8: Programı çalıştırın, komut çok basittir, cmd komut satırında, FirstSpider'ı oluşturduğunuz proje klasörüne cd, ardından node first_spider.js programı çalışacaktır.
9: Not: Şu anda böyle bir hata ile karşılaşırsanız
Bağlantı noktası 80 dolu, işte ek bir söz: Bağlantı noktası işgal sorununu çözmek için: https://www.jianshu.com/p/a7fc19b0c2f1, bu bağlantı noktalarını bulun ve birer birer kapatın.
Orijinal yazar: Chi Che kız teknolojisi blogu: https: //www.jianshu.com/u/05f416aefbe1
90'ların sonrasındaki arayüz kızı, programlamayı seviyor, işlemleri seviyor, sanat ve kod bir arada uçuyor, bir program hanımını büyülüyor ve bilgelik bir arada var.