色偷偷91综合久久噜噜-色偷偷成人-色偷偷尼玛图亚洲综合-色偷偷人人澡久久天天-国内精品视频一区-国内精品视频一区二区三区

Hello! 歡迎來到小浪云!


云服務(wù)器Apache利用USER_AGENT屏蔽惡意蜘蛛


avatar
小浪云 2024-07-15 196

 

最近發(fā)現(xiàn)日志里有很多沒見過的蜘蛛UA,基本上都是國外的一些搜索引擎,或者很本不是搜索引擎,有的抓取頻率很高,剛開始設(shè)置了下robots.txt,因為他們首先都抓取了robots.txt,應(yīng)該是遵守規(guī)則的,沒想到人家只是走個過場,并沒有把robot.txt放在眼里。

 

apache可以用.htaccess文件來通過useragent來屏蔽一些訪問,搜了一下,大概可以這么做:

 

 

 

 

.htaccess

SetEnvifNoCase?User-Agent?^.*Scrapy.*?bad_bot

SetEnvifNoCase?User-Agent?^.*SemrushBot.*?bad_bot

SetEnvifNoCase?User-Agent?^.*ExtLinksBot.*?bad_bot

SetEnvifNoCase?User-Agent?^.*YandexBot.*?bad_bot

SetEnvifNoCase?User-Agent?^.*MauiBot.*?bad_bot

SetEnvifNoCase?User-Agent?^.*Python.*?bad_bot

SetEnvifNoCase?User-Agent?^.*NetcraftSurveyAgent.*?bad_bot

Deny?from?env=bad_bot

這樣當(dāng)這些匹配的useragent就會被返回403禁止訪問。

 

可是第二天發(fā)現(xiàn)有幾個useragent瘋狂的訪問robot.txt,反正都不遵守規(guī)則,那么執(zhí)著的訪問robots.txt干什么。。。。。

 

于是我換了一種方法,打算用302(301也一樣啦,對這些惡意蜘蛛沒那么講究)把他們轉(zhuǎn)走。

 

.htaccess

云服務(wù)器Apache利用USER_AGENT屏蔽惡意蜘蛛

這樣,就都被302到www.xlyVPS.com了,現(xiàn)在再看那些未知的蜘蛛基本不會在主站亂爬了。

 

另:.htaccess的正則:”^”代表字符串的開始,”.*”代表任意字符。

 

NC代表不區(qū)分大小寫,OR代表或者,L的意思是一旦有符合條件的規(guī)則就不再執(zhí)行下面的規(guī)則,所以這些語句要放在wordpress等程序默認偽靜態(tài)規(guī)則的前面。

相關(guān)閱讀

主站蜘蛛池模板: 婷婷色亚洲 | 四虎在线播放免费永久视频 | 日韩欧美在线视频一区二区 | 欧美熟夫 | 国产一区二区中文字幕 | 国产亚洲综合精品一区二区三区 | 337p日本欧洲亚洲大胆色噜噜 | 女人一级片 | 色老头在线观看精品 | 国产欧美一区二区三区免费 | 色婷婷综合缴情综六月 | 免费一级特黄 | 婷婷综合久久狠狠色99h | 狠狠色噜噜狠狠狠狠69 | 中国一级毛片国产高清 | 亚洲区第一页 | 一级毛片在线视频 | 天天操天天干天天 | 高清国产精品久久久久 | 伊人丁香狠狠色综合久久 | 国产精品夜色视频一区二区 | 狠狠色狠狠色综合人人 | 福利在线国产 | 日本又黄又硬又粗好爽视频免费 | 久久国产欧美日韩精品免费 | 久久久精品免费国产四虎 | 狠狠干天天干 | 免费看污的网站 | 日日噜噜夜夜躁躁狠狠 | 美女又美女又黄又免费网站 | 66成人 | 四虎精品免费永久在线 | 四虎网站在线播放 | 中文字幕狠狠干 | 国产三级小视频 | 久久综合九色综合77 | 国产一区二区免费视频 | 日韩区欧美区 | 国产精品欧美亚洲韩国日本不卡 | 黄色一级黄色 | 无码免费一区二区三区免费播放 |