而人們對于蜘蛛的誤區集中在“降權蜘蛛”。由于蜘蛛抓取的網頁太多,如果只有一只蜘蛛進行抓取作業,需要的計算量太大,同時也會耗費太多的時間。所以搜索引擎引進了分布式計算的概念,把龐大的抓取作業分割成多個部分,使用合理計算的服務器承載這一任務,完成對網頁的快速抓取。現在大型搜索引擎都使用分布式計算技術,同樣,蜘蛛也會進行分布式計算,這種蜘蛛就是分布式蜘蛛,它遵循分布式計算的主要規則,根據這些規則也就可以理解“降權蜘蛛”的工作方式。 來源:黑帽工具網(/QQ號:25496334),轉載請保留出處和鏈接!
本文鏈接:http://www.sugarbabysoaps.com/fuzhuruanjian/94.html
本站內容來源于合作伙伴及網絡搜集,版權歸原作者所有。如有侵犯版權,請立刻和本站聯系,我們將在三個工作日內予以改正。
Copyright ?黑帽軟件網 All Rights Reserved.
微信:heimaowiki