Baiduspider遵守互聯(lián)網(wǎng)robots協(xié)議。您可以利用robots.txt文件完全禁止Baiduspider訪問您的網(wǎng)站,或者禁止 Baiduspider訪問您網(wǎng)站上的部分文件。 注意:禁止Baiduspider訪問您的網(wǎng)站,將使您的網(wǎng)站上的網(wǎng)頁,在百度搜索引擎以及所有百度提供搜索引擎服務的搜索引擎中無法被搜索到。
您可以根據(jù)各產(chǎn)品不同的user-agent設置不同的抓取規(guī)則,如果您想完全禁止百度所有的產(chǎn)品收錄,可以直接對Baiduspider設置禁止抓取。
以下robots實現(xiàn)禁止所有來自百度的抓取:
User-agent: Baiduspider
Disallow: /
以下robots實現(xiàn)禁止所有來自百度的抓取但允許圖片搜索抓取/image/目錄:
User-agent: Baiduspider
Disallow: /
User-agent: Baiduspider-image
Allow: /image/
請注意:Baiduspider-cpro抓取的網(wǎng)頁并不會建入索引,只是執(zhí)行與客戶約定的操作,所以不遵守robots協(xié)議。