詳解50行代碼，Node爬蟲練手項目

更新時間：2019年04月22日 10:13:05 作者：zy_2071

這篇文章主要介紹了50行代碼，Node爬蟲練手項目，文中通過示例代碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值，需要的朋友們下面隨著小編來一起學習學習吧

First

項目地址：Crawler-for-Github-Trending

項目中基本每一句代碼都寫有注釋(因為就這么幾行😂)，適合對Node爬蟲感興趣的同學入入門。

Introduction

50 lines, minimalist node crawler for Trending.

一個50行的node爬蟲，一個簡單的 axios, express, cheerio 體驗項目。

Usage

首先保證電腦已存在node環(huán)境，然后

1.拉取本項目

git clone https://github.com/ZY2071/Crawler-for-Github-Trending.git
cd Crawler-for-Github-Trending
npm i
node index.js

2.或者下載本項目壓縮包，解壓

cd Crawler-for-Github-Trending-master // 進入項目文件夾
npm i
node index.js

Examples

當啟動項目后，可以看到控制臺輸出

Listening on port 3000!

此時打開瀏覽器，進入本地服務 http://localhost:3000/daily

http://localhost:3000/time-language // time表示周期，language代表語言例如：
http://localhost:3000/daily // 代表今日可選參數：weekly,monthly
http://localhost:3000/daily-JavaScript// 代表今日的java分類可選參數：任意語言

稍微等待即可看到爬取完畢的返回數據：

[
 {
 "title": "lib-pku / libpku",
 "links": "https://github.com/lib-pku/libpku",
 "description": "貴校課程資料民間整理",
 "language": "JavaScript",
 "stars": "14,297",
 "forks": "4,360",
 "info": "3,121 stars this week"
 },
 {
 "title": "SqueezerIO / squeezer",
 "links": "https://github.com/SqueezerIO/squeezer",
 "description": "Squeezer Framework - Build serverless dApps",
 "language": "JavaScript",
 "stars": "3,212",
 "forks": "80",
 "info": "2,807 stars this week"
 },
 ...
]

More

本項目僅供爬取體驗，每次訪問都會實時爬取數據，所以數據返回速度會比較慢，實際操作應該是定時爬取數據然后將數據存進數據庫，數據從數據庫返回從而提高數據返回效率。

但項目很基礎，可以作為以上各個node模塊最基礎的練手使用，希望可以幫到大家 😀

您可能感興趣的文章:

Node
爬蟲

Node.js的模塊化機制和Buffer對象詳解
這篇文章主要為大家詳細介紹了Node.js的模塊化機制和Buffer對象，文中示例代碼介紹的非常詳細，具有一定的參考價值，感興趣的小伙伴們可以參考一下，希望能夠給你帶來幫助
2022-02-02
node.js使用zlib模塊進行數據壓縮和解壓操作示例
這篇文章主要介紹了node.js使用zlib模塊進行數據壓縮和解壓操作,結合實例形式詳細分析了node.js基于zlib模塊創(chuàng)建數據流以及壓縮和解壓縮等相關操作技巧,需要的朋友可以參考下
2020-02-02
Node.js定時任務之node-schedule使用詳解
這篇文章主要介紹了Node.js定時任務之node-schedule使用詳解，具有很好的參考價值，希望對大家有所幫助。如有錯誤或未考慮完全的地方，望不吝賜教
2022-08-08
node.js在Linux下執(zhí)行shell命令、.sh腳本的問題
很多時候需要多個命令來完成一項工作，而這個工作又常常是重復的，這個時候我們自然會想到將這些命令寫成sh腳本，下次執(zhí)行下這個腳本一切就都搞定了，下面就是發(fā)布代碼的一個腳本示例
2022-01-01
node.js多個異步過程中判斷執(zhí)行是否完成的解決方案
這篇文章主要給大家介紹了關于node.js多個異步過程中判斷執(zhí)行是否完成的幾種解決方案，文中通過示例代碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值，需要的朋友們下面來一起看看吧。
2017-12-12
nodeJS（express4.x）+vue（vue-cli）構建前后端分離實例(帶跨域)
這篇文章主要介紹了nodeJS（express4.x）+vue（vue-cli）構建前后端分離實例(帶跨域) ，具有一定的參考價值，感興趣的小伙伴們可以參考一下
2017-07-07
如何優(yōu)雅地在Node應用中進行錯誤異常處理
這篇文章主要介紹了如何優(yōu)雅地在Node應用中進行錯誤處理，文中通過示例代碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值，需要的朋友們下面隨著小編來一起學習學習吧
2019-11-11
express中間件加載機制示例詳解
中間件是一種方法,可以接收客戶端發(fā)來的請求,可以對請求做出響應,也可以將請求繼續(xù)交給下一個中間件繼續(xù)處理,下面這篇文章主要給大家介紹了關于express中間件加載機制的相關資料,需要的朋友可以參考下
2022-08-08
從零學習node.js之mysql數據庫的操作（五）
因為接觸Node.JS已經有一段時間了，最近粗略的研究了一下node.js操作數據庫的包，覺得node.js連接數據庫不錯。下面這篇文章主要給大家介紹了node.js之mysql數據庫操作的相關資料，需要的朋友可以參考下。
2017-02-02
基于Node.js實現nodemailer郵件發(fā)送
Nodemailer 是一個簡單易用的 Node.JS 郵件發(fā)送模塊（通過 SMTP，sendmail，或者 Amazon SES），支持 unicode，你可以使用任何你喜歡的字符集。Nodemailer是一個簡單易用的Node.js郵件發(fā)送組件，需要的朋友可以參考下
2016-01-01