亚洲乱码中文字幕综合,中国熟女仑乱hd,亚洲精品乱拍国产一区二区三区,一本大道卡一卡二卡三乱码全集资源,又粗又黄又硬又爽的免费视频

教你使用Nginx限制百度蜘蛛頻繁抓取的問題

 更新時間:2022年01月23日 15:34:40   作者:ning235  
這篇文章主要介紹了使用Nginx限制百度蜘蛛頻繁抓取的問題,百度蜘蛛對網(wǎng)站的抓取頻率高和抓取量驟增導(dǎo)致服務(wù)器負載高,經(jīng)常收到警告信息,每分鐘允許百度蜘蛛抓取200次,超過頻率限制的返回503,對Nginx限制蜘蛛頻繁抓取相關(guān)知識感興趣的朋友一起看看吧

百度蜘蛛對網(wǎng)站的抓取頻率高和抓取量驟增導(dǎo)致服務(wù)器負載高,經(jīng)常收到警告信息。最終采用nginx的ngx_http_limit_req_module模塊限制了百度蜘蛛的抓取頻率。每分鐘允許百度蜘蛛抓取200次,超過頻率限制的返回503。

limit_req_zone

語法: limit_req_zone $variable zone=name:size rate=rate;

默認值: none

配置段: http

設(shè)置一塊共享內(nèi)存限制域的參數(shù),它可以用來保存鍵值的狀態(tài)。 它特別保存了當(dāng)前超出請求的數(shù)量。 鍵的值就是指定的變量(空值不會被計算)。

這里鍵值使用客戶端的agent, 使用$http_user_agent變量。 如果限制域的存儲空間耗盡了,對于后續(xù)所有請求,服務(wù)器都會返回 503 (Service Temporarily Unavailable)錯誤。

請求頻率可以設(shè)置為每秒幾次(r/s)。如果請求的頻率不到每秒一次, 你可以設(shè)置每分鐘幾次(r/m)。比如每秒半次就是30r/m。

全局配置nginx.conf

limit_req_zone $ning_spider zone=ning_spider:10m rate=200r/m;

某個server中

if ($http_user_agent ~* "baiduspider|Googlebot") {
 set $ning_spider $http_user_agent;
 }
 limit_req zone=ning_spider burst=5 nodelay;

參數(shù)說明:

指令linit_req_zone 中的rate=200r/m 表示每分鐘只能處理200個請求。

指令limit_req 中的burst=5 表示最大并發(fā)為5。即同一時間只能同時處理5個請求。

指令limit_req 中的nodelay 表示當(dāng)已經(jīng)達到burst值時,再來新請求時,直接返回503IF部分用于判斷是否是百度蜘蛛的user agent。如果是,就對變量$ning_spider賦值。這樣就做到了只對百度蜘蛛進行限制了。

測試,速率達不上可以同時開多個以下腳本測試

[root@localhost ~]# cat test.sh
#! /bin/bash  
sum=0;  
for i in {1..1000}  
do  
((sum = sum + i))  
curl -I -A "Baiduspider" http://www.hezongtianxia.com
curl -I -A "Sogou web spider" http://www.hezongtianxia.com
done  
echo $sum
tailf /home/wwwlog/access.log|grep 503

參考:http://tengine.taobao.org/nginx_docs/cn/docs/http/ngx_http_limit_req_module.html

到此這篇關(guān)于使用Nginx限制百度蜘蛛頻繁抓取 的文章就介紹到這了,更多相關(guān)Nginx限制蜘蛛頻繁抓取 內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

相關(guān)文章

  • Nginx之為已安裝nginx動態(tài)添加模塊的方法

    Nginx之為已安裝nginx動態(tài)添加模塊的方法

    本篇文章主要介紹了Nginx之為已安裝nginx動態(tài)添加模塊的方法,小編覺得挺不錯的,現(xiàn)在分享給大家,也給大家做個參考。一起跟隨小編過來看看吧
    2018-04-04
  • 詳解Nginx之Location配置(Location匹配順序)

    詳解Nginx之Location配置(Location匹配順序)

    這篇文章主要介紹了詳解Nginx之Location配置(Location匹配順序),文中通過示例代碼介紹的非常詳細,對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
    2019-11-11
  • 詳解 Nginx代理功能與負載均衡

    詳解 Nginx代理功能與負載均衡

    本篇文章主要介紹了詳解 Nginx代理功能與負載均衡,先描述一些關(guān)于代理功能的配置,再說明負載均衡詳細,有興趣的可以了解一下。
    2017-02-02
  • Nginx基礎(chǔ)學(xué)習(xí)之realip模塊的使用方法

    Nginx基礎(chǔ)學(xué)習(xí)之realip模塊的使用方法

    這篇文章主要給大家介紹了關(guān)于Nginx基礎(chǔ)學(xué)習(xí)之realip模塊使用的相關(guān)資料,文中通過示例代碼介紹的非常詳細,對大家學(xué)習(xí)或者使用Nginx具有一定的參考學(xué)習(xí)價值,需要的朋友們下面來一起學(xué)習(xí)學(xué)習(xí)吧
    2020-06-06
  • 讓Nginx支持shtml格式的配置方法

    讓Nginx支持shtml格式的配置方法

    這篇文章主要介紹了讓Nginx支持shtml格式的配置方法,shtml格式可以包含一些服務(wù)端指令,同PHP中的include功能類似,需要的朋友可以參考下
    2014-08-08
  • nginx從編譯安裝到配置文件說明中文詳細介紹

    nginx從編譯安裝到配置文件說明中文詳細介紹

    Nginx配置文件主要分成四部分:main(全局設(shè)置)、server(主機設(shè)置)、upstream(上游服務(wù)器設(shè)置,主要為反向代理、負載均衡相關(guān)配置)和 location(URL匹配特定位置后的設(shè)置)
    2018-10-10
  • win10安裝配置nginx的過程

    win10安裝配置nginx的過程

    這篇文章主要介紹了win10安裝配置nginx的過程,幫助大家更好的理解和使用nginx服務(wù)器,感興趣的朋友可以了解下
    2020-10-10
  • nginx出現(xiàn)權(quán)限問題解決(13: Permission denied)

    nginx出現(xiàn)權(quán)限問題解決(13: Permission denied)

    本文主要介紹了nginx出現(xiàn)權(quán)限問題解決(13: Permission denied),文中通過示例代碼介紹的非常詳細,對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
    2023-06-06
  • nginx如何指向本地路徑及500錯誤解決方法

    nginx如何指向本地路徑及500錯誤解決方法

    這篇文章主要為大家介紹了nginx如何指向本地路徑及500錯誤解決方法,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進步,早日升職加薪
    2023-03-03
  • Node.js站點使用Nginx作反向代理時配置GZip壓縮的教程

    Node.js站點使用Nginx作反向代理時配置GZip壓縮的教程

    這篇文章主要介紹了Node.js站點使用Nginx作反向代理時配置GZip壓縮的教程,文中演示了Node使用Express框架時的HTTP傳輸壓縮配置,需要的朋友可以參考下
    2016-04-04

最新評論