中文字幕在线观看,亚洲а∨天堂久久精品9966,亚洲成a人片在线观看你懂的,亚洲av成人片无码网站,亚洲国产精品无码久久久五月天

何清勇:淺談百度蜘蛛“偽裝”IP的影響

2019-03-19    來源:何清勇SEO博客

容器云強勢上線!快速搭建集群,上萬Linux鏡像隨意使用

在經常分析網站日志文件的時候,總會發(fā)現(xiàn)百度蜘蛛(BaiDu Spider)IP中出現(xiàn)222.77.187.33,經查詢,該IP是位于福建省福州市電信IP,而百度蜘蛛IP是位于北京的聯(lián)通IP。在網站日志中分析該IP的抓取行為時候發(fā)現(xiàn),該IP只抓取網頁首頁,經查詢,該IP為站長工具的一個友情鏈接檢測程序,該程序默認模擬百度蜘蛛程序抓取頁面。

站長工具的友情鏈接檢測界面

該工具域名“link.chinaz.com”對應的IP為“222.77.187.33”,位于福建省福州市。

百度蜘蛛IP(根據(jù)網站日志文件統(tǒng)計)

123.125.71.* Baiduspider/2.0(百度網頁爬蟲),也包括 Baiduspider-image(百度圖片爬蟲)

61.135.186.* Baiduspider-cpro(百度聯(lián)盟爬蟲)

百度蜘蛛IP出現(xiàn)偽裝IP的影響

分析網站日志文件是必不可少的工作,因為網站日志中記錄著詳細的數(shù)據(jù),這些數(shù)據(jù)包括搜索引擎爬蟲數(shù)據(jù)、服務器運行、用戶瀏覽行為數(shù)據(jù)等等,對這些數(shù)據(jù)的分析,可以比較全面的掌握網站的情況。

對與SEO工作,針對性分析搜索引擎的爬蟲數(shù)據(jù),有助于了解這些蜘蛛的爬行習慣,進一步改進網站。

面對互聯(lián)網數(shù)以億計的網頁數(shù)據(jù),搜索引擎為了增加提高自身爬蟲的工作效率果,往往會使用多個IP或同一IP下的多個蜘蛛程序進行抓取工作,但如果這些IP段或者蜘蛛程序存在偽裝,必然會影響SEO人員對搜索引擎蜘蛛程序行為分析的判斷結果,從而可能會影響SEO決策。

何況這次偽裝的是百度蜘蛛的IP地址,抓取數(shù)量也比較多,造成的影響會更加嚴重,經過查詢,很多SEO人員在網絡上詢問:

為什么百度蜘蛛總是抓取的網站首頁?

為什么百度蜘蛛總是抓取而不是收錄我的網站?

類似以上的問題在網絡上很多,這些對于結果,對SEO人員的判斷和工作都會造成很大的影響。

來源:何清勇SEO博客

標簽: 百度蜘蛛 網站日志文件分析 搜索引擎蜘蛛 

版權申明:本站文章部分自網絡,如有侵權,請聯(lián)系:west999com@outlook.com
特別注意:本站所有轉載文章言論不代表本站觀點!
本站所提供的圖片等素材,版權歸原作者所有,如需使用,請與原作者聯(lián)系。

上一篇:談談如何快速破解百度十一位現(xiàn)象

下一篇:從網站優(yōu)化說說標題黨和seo