可选择全部允许或完全禁止,具体路径规则由下方 Allow/Disallow 列表控制。
通过 Disallow 告诉爬虫不要访问哪些路径;留空表示全部可访问。
通过 Allow 明确放行可能被上层 Disallow 覆盖的路径。
为常见爬虫设置独立策略:Default=沿用全局规则,Disallow=全部禁止,Allow=完全允许。
爬虫 User-agent 策略
Google Web Googlebot
Google Image Googlebot-Image
Google News Googlebot-News
Bing Web Bingbot
Bing Preview BingPreview
Baidu Baiduspider
Yandex YandexBot
DuckDuckGo DuckDuckBot
Sogou Sogou web spider
360 Search 360Spider
并非所有搜索引擎都支持此字段,但可用来降低服务器压力。
填写完整的 sitemap 地址,帮助爬虫发现内容。