可选择全部允许或完全禁止,具体路径规则由下方 Allow/Disallow 列表控制。
通过 Disallow 告诉爬虫不要访问哪些路径;留空表示全部可访问。
通过 Allow 明确放行可能被上层 Disallow 覆盖的路径。
为常见爬虫设置独立策略:Default=沿用全局规则,Disallow=全部禁止,Allow=完全允许。
| 爬虫 |
User-agent |
策略 |
| Google Web |
Googlebot |
|
| Google Image |
Googlebot-Image |
|
| Google News |
Googlebot-News |
|
| Bing Web |
Bingbot |
|
| Bing Preview |
BingPreview |
|
| Baidu |
Baiduspider |
|
| Yandex |
YandexBot |
|
| DuckDuckGo |
DuckDuckBot |
|
| Sogou |
Sogou web spider |
|
| 360 Search |
360Spider |
|