Robots.txt 配置指南：成员页面抓取与允许例外设置的顺序规则

正在查看 0 条回复

2025年10月18日 - 下午10:28 #1293

管理员

将

Disallow: /members/

放到最前面（在所有

Allow

之前），
在 Google 上通常仍能生效，但在 Bing、Yandex、Baidu 等搜索引擎上很可能失效，
导致你指定的成员页面也被禁止抓取。

搜索引擎匹配规则

搜索引擎	匹配规则
Google	✅ 使用最长路径匹配（most specific）即使 `Disallow: /members/` 在前，只要 `Allow: /members/light/` 更具体，就优先允许。
Bing / Yandex / Baidu / 360 / Sogou	⚠️ 按规则顺序匹配，第一个匹配的生效如果 `Disallow: /members/` 在前， `/members/light/` 会先被它匹配并禁止，后面的 `Allow` 不会被读取。

Google

✅ 使用 最长路径匹配（most specific）
即使

Disallow: /members/

在前，只要

Allow: /members/light/

更具体，就优先允许。

Bing / Yandex / Baidu / 360 / Sogou

⚠️ 按规则顺序匹配，第一个匹配的生效
如果

Disallow: /members/

在前，

/members/light/

会先被它匹配并禁止，后面的

Allow

不会被读取。

User-agent: *
Disallow: /members/          ← 第1条匹配！禁止
Allow: /members/light/       ← 不再检查，已决定禁止

→ 结果：

/members/light/

被屏蔽 ❌

而 Google 会比较两条规则：
–

/members/

长度 = 10
–

/members/light/

长度 = 17 → 更具体 → 允许 ✅

User-agent: *

# 1. 先写具体的 Allow 例外（越具体越好）
Allow: /members/light/
Allow: /members/nuke_baby/
...（其他允许的成员页）

# 2. 再写通用的 Disallow
Disallow: /members/

✅ 这样：
– Google：用最长匹配 → 允许例外
– Bing/Yandex/Baidu：先看到 Allow（精确路径），匹配不上就继续；遇到 Disallow 时，未被允许的路径才被拦住。

写法 Google Bing / 其他中文引擎是否推荐

写法	Google	Bing / 其他中文引擎	是否推荐
`Disallow: /members/` 在前	✅ 可能生效	❌ 很可能失效	❌ 不推荐
`Allow: /members/xxx/` 在前	✅ 生效	✅ 生效	✅ 强烈推荐

Disallow: /members/

在前

✅ 可能生效

❌ 很可能失效

❌ 不推荐

Allow: /members/xxx/

在前

✅ 生效

✅ 强烈推荐

✅ 结论：永远把具体的

Allow

放在通用

Disallow

之前，才能确保跨搜索引擎兼容。

正在查看 0 条回复