前言
在 NodeJS 中用來創建服務的模塊是 http 核心模塊,本篇就來介紹關于使用 http 模塊搭建 HTTP 服務器和客戶端的方法,以及模塊的基本 API。
HTTP 服務器
1、創建 HTTP 服務器
在 NodeJS 中,創建 HTTP 服務器可以與 net 模塊創建 TCP 服務器對比,創建服務器有也兩種方式。
方式 1:
const http = require("http"); const server = http.createServer(function(req, res) { // ...... }); server.listen(3000);
方式 2:
const http = require("http"); const server = http.createServer(); server.on("request", function(req, res) { // ...... }); server.listen(3000);
在 createServer 的回調和 request 事件的回調函數中有兩個參數,req(請求)、res(響應),基于 socket,這兩個對象都是 Duplex 類型的可讀可寫流。
http 模塊是基于 net 模塊實現的,所以 net 模塊原有的事件在 http 中依然存在。
const http = require("http"); const server = http.createServer(); // net 模塊事件 server.on("connection", function(socket) { console.log("連接成功"); }); server.listen(3000);
2、獲取請求信息
在請求對象 req 中存在請求的方法、請求的 url(包含參數,即查詢字符串)、當前的 HTTP 協議版本和請求頭等信息。
const http = require("http"); const server = http.createServer(); server.on("request", function(req, res) { console.log(req.method); // 獲取請求方法 console.log(req.url); // 獲取請求路徑(包含查詢字符串) console.log(req.httpVersion); // 獲取 HTTP 協議版本 console.log(req.headers); // 獲取請求頭(對象) // 獲取請求體的內容 let arr = []; req.on("data", function(data) { arr.push(data); }); req.on("end", function() { console.log(Buffer.concat(arr).toString()); }); }); server.listen(3000, function() { console.log("server start 3000"); });
通過 req 對應的屬性可以拿到請求行和請求首部的信息,請求體內的內容通過流操作來獲取,其中 url 中存在多個有用的參數,我們自己處理會很麻煩,可以通過 NodeJS 的核心模塊 url 進行解析。
const url = require("url"); let str = "http://user:pass@www.pandashen.com:8080/src/index.html?a=1&b=2#hash"; // parse 方法幫助我們解析 url 路徑 let obj = url.parse(str, true); console.log(obj); // { // protocol: 'http:', // slashes: true, // auth: 'user:pas', // host: 'www.pandashen.com:8080', // port: '8080', // hostname: 'www.pandashen.com', // hash: '#hash', // search: '?a=1&b=2', // query: '{ a: '1', b: '2' }', // pathname: '/src/index.html' // path: '/src/index.html?a=1&b=2', // href: 'http://user:pass@www.pandashen.com:8080/src/index.html?a=1&b=2#hash' }
在被解析路徑返回的對象中有幾個屬性被經常使用:
我們使用 url 的 parse 方法來幫我們解析請求路徑,在真實的服務器中傳入的第一個參數為 req.url,第二個參數不傳時,query 會被解析成 a=1&b=2 的形式,第二個參數傳入 true,query 屬性的查詢字符串會被解析成對象的形式。
url 模塊中,將查詢字符串 a=1&b=2 轉換為對象 { a: '1', b: '2' } 的實現方式其實是使用正則替換實現的。
模擬查詢字符串轉換對象的核心邏輯:
let str = "a=1&b=2&c=3"; let obj = {}; str.replace(/([^=&]+)=([^=&]+)/g, function() { obj[arguments[1]] = arguments[2]; }); console.log(obj); // { a: '1', b: '2', c: '3' }
在上面代碼的 replace 方法的回調函數中參數集合的第一項為匹配到的字符串,第二項為第一個分組的值,第三項為第二個分組的值,依次類推,倒數第二項為分組匹配的索引,最后一項為原字符串。
3、設置響應信息
我們可以通過 req 來獲取請求信息,自然也可以通過 res 來設置響應信息返回給客戶端。
const http = require("http"); const server = http.createServer(); server.on("request", function(req, res) { // 設置響應頭(過去的用法),不能多次調用,見到要認識 res.writeHead(200, { "Content-Type": "text", a: "hello world" }); // 設置響應頭(現在的用法,常用),可以多次調用,每次設置一個響應頭 res.setHeader("Content-Type", "text"); // 設置狀態碼,不設置默認為 200 res.statusCode = 200; // 不發送 Date(日期)響應頭 res.sendDate = false; // 返回內容 res.write("hello world"); // 不會關閉連接 res.end("hello world"); // 將內容返回后關閉連接 }); server.listen(3000, function() { console.log("server start 3000"); });
返回給客戶端的信息主要分為兩部分,分別為響應頭和返回給瀏覽器的內容,在不設置響應頭的情況下,默認會設置響應頭 Content-Length 和 Date ,代表當前返回給客戶端的內容長度和日期。
返回給瀏覽器的內容可以通過 res 的 write 方法和 end 方法進行發送,write 方法不會斷開連接(通常在響應后需要斷開與客戶端的連接),end 方法會斷開連接,在 end 方法存在參數時,會在內部調用 write 將參數內容返回給客戶端,并斷開連接。
HTTP 客戶端
在 net 模塊中可以通過 net.createConnection 來創建客戶端,并發送請求到服務端,在 http 模塊同樣可以創建客戶端,并向 http 服務器發送請求。
// 客戶端:client.js const http = require("http"); // 發送請求的配置 let config = { host: "localhost", port: 3000, method: "get", headers: { a: 1 } }; // 創建客戶端 let client = http.request(config, function(res) { // 接收服務端返回的數據 let arr = []; res.on("data", function(data) { arr.push(data); }); res.on("end", function() { console.log(Buffer.concat(arr).toString()); }); }); // 發送請求 client.end();
在 http 模塊中通過 request 方法創建客戶端,該方法第一個參數為發送請求的配置,包含請求地址、端口號、請求方法以及請求頭等,第二個參數為回調函數,在請求被響應后執行,回調函數的參數為服務器的響應對象 res,創建的客戶端通過 end 方法將請求發出與服務端進行通信。
使用 NodeJS 實現的 “爬蟲” 其實就可以通過 http 模塊創建的客戶端來實現,客戶端幫我們向我們要抓取數據的地址發送請求,并拿到響應的數據進行解析。
同時使用 HTTP 客戶端和服務器
我們使用自己創建的客戶端訪問自己的服務端,并體會請求響應的過程,就是用上面 client.js 作為客戶端,啟動 server.js 后再啟動 client.js 查看效果。
// 服務器:server.js const http = require("http"); http.createServer(function(req, res) { console.log("The request came"); // 獲取客戶端請求信息 console.log(req.method); console.log(req.headers); // 返回數據 res.write("hello world"); }).listen(3000, function() { console.log("server start 3000"); });
簡易爬蟲
我們結合 http 模塊創建的服務端和客戶端實現一個簡易版的 “爬蟲” 去抓取百度新聞頁所有 li 標簽內的文章標題。
// 簡易爬蟲:crawl.js const http = require("http"); // 創建服務器 const server = http.createServer(); // 監聽請求 server.on("request", function(req, res) { let client = http.request( { host: "news.baidu.com", method: "get", port: 80 }, function(r) { // 接收百度新聞返回的數據 let arr = []; r.on("data", function(data) { arr.push(data); }); r.on("end", function() { // 處理數據 let result = Buffer.concat(arr).toString(); let matches = result.match(/<li class="bold-item">([\s\S*?])<\/li>/gm); // 設置返回給瀏覽器的文檔類型和編碼格式 res.setHeader("Content-Type", "text/html;charset=utf8"); // 響應瀏覽器 res.end(matches.join("")); }); } ); client.end(); }); server.listen(3000);
上面的正則匹配中 ([\s\S*?]) 代表匹配 <li class="bold-item"> 到 <\/li> 之間所有內容(多個字符、非貪婪模式),gm 代表全局并多行匹配。
上面爬取百度新聞數據的過程中,我們自己的 Node 服務器扮演了一個 “中間層” 的角色,我們通過瀏覽器訪問自己的服務器 localhost:3000 觸發 request 事件,執行了回調,在回調中創建客戶端向 news.baidu.com 發送了請求,并在客戶端的回調中處理了響應(百度新聞頁返回的數據),將處理后的內容通過我們自己 Node 服務器的 res 對象返回給了瀏覽器。
總結
相信在讀過本篇文章之后對搭建一個 Node 服務應該已經有了思路,為未來通過 Node 服務實現復雜的業務場景及數據的處理打下了一個基礎,希望初學 Node 的小伙伴在看了這篇文章后能有所收獲。
以上就是本文的全部內容,希望對大家的學習有所幫助,也希望大家多多支持億速云。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。