Tip:
Highlight text to annotate it
X
马特·卡茨(MATT CUTTS): 大家好!我是马特·卡茨
今天我们要讨论的是隐藏真实内容的问题
很多人对隐藏真实内容存有疑问
比如,隐藏真实内容到底是什么意思?
Google是如何定义它的?
它为什么属于高风险行为?
等等诸如此类的疑问
我们有很多关于这方面的HTML文档
并发布了大量相关博文
我将在本视频中解释什么是隐藏真实内容
解答前面提到的一些问题
并介绍一些经验方法
确保大家远离高风险行为
我们首先介绍一下什么是隐藏真实内容
从本质上来说,隐藏真实内容是指
向用户提供不同于Googlebot获得的内容
假设您有一台网络服务器
并有用户请求访问某个网页
于是他成了您的用户
您向他提供了相应的网页
结果是皆大欢喜
现在让Googlebot也请求访问同一个网页
并且您向Googlebot提供了该网页
在大多数情况下
Googlebot和用户获得的内容是相同的
这是皆大欢喜的情况
如果您向用户提供的内容 不同于Googlebot获得的内容
就属于隐藏真实内容
这无疑是一种高风险行为
并且违反了我们的质量指南
如果您在Google上搜索我们的质量指南
就会找到一系列相关资料
其中许多辅助文档介绍了 如何判断您是否存在高风险行为
下面我们要介绍的是
为什么我们认为隐藏真实内容是不当行为
或者说,Google为什么反对隐藏真实内容
这是因为在搜索引擎问世初期
有很多人通过隐藏真实内容来欺骗或误导别人
比如,当Googlebot请求访问网页时
隐藏真实内容的网络服务器 可能会返回某个完全关于卡通的网页
比如关于迪士尼卡通的网页
而当用户访问该网页时
网络服务器可能会返回色情内容
这样一来,如果您在Google上 搜索迪士尼卡通内容
会搜索到看似是关于卡通的网页
但点击相应链接后就会转到色情网页
这无疑是非常糟糕的体验
用户会对此进行投诉
由于这会给用户带来非常糟糕的体验
因此,各种隐藏真实内容的行为 都会违反我们的质量指南
我们不支持所谓的白帽伪装 (即是合理隐藏真实内容)行为
如果某人的行为特别具有欺骗性或误导性
我们会对其进行重点关注
在这种情况下反网络垃圾小组会介入
但任何类型的隐藏真实内容行为 都会违反我们的质量指南
那么有哪些经验方法能够帮助您
远离麻烦或避开高风险行为呢?
判断是否隐藏真实内容的一种方法是
获取相应网页,比如通过Wget或cURL命令
以某种方式抓取网页后生成网页的哈希值
即获取所有不同内容并将其折算成一个数值
然后利用Googlebot用户代理假冒Googlebot
我们在Google网站站长工具中 提供了“Googlebot抓取方式”功能
以便您能够以Googlebot的身份抓取网页 并生成网页的哈希值
如果这两种情况下得到的数值不同
其中可能就有些猫腻了
这表示您可能存在高风险行为
如今的网页可能是动态的
网页中可能有时间戳之类的信息 广告也可能会变化
因此这种方法并不总是有效的
下面我们要介绍另一种 值得注意的简单试探法
具体做法是检查一下网络服务器的代码
看看是不是有些代码会特意查找
Googlebot的用户代理 或Googlebot的IP地址
如果您针对Googlebot采取 截然不同、特殊或异常的行为
不管针对的是Googlebot的用户代理 还是Googlebot的IP地址
都有可能会向Googlebot提供 不同于用户获得的内容
这种情况非常危险
请务必留意
现在有许多“白帽”用户并不想以任何方式 卷入隐藏真实内容的行为
并希望能够远离高风险行为
这些用户向我们提出了一个问题
就是对于地理定位和手机等移动用户代理
应该如何处理
好消息是,总体而言
您其实并不需要担心这种情况
下面就让我们介绍一下
为什么地理定位和处理手机 不属于隐藏真实内容
比如现在我们有一个用户
并假设这个用户来自法国
另外,我们还有一个完全不同的用户
并假设这个用户来自英国
在理想情况下 假设您有在.fr域或.uk域上提供的内容
因为您已经对这些内容进行了翻译
所以它们可能使用不同的语言
如果来自法国IP地址的用户 能获得以法语显示的内容
对他们而言会非常有帮助
他们想必也更乐意看到法语内容
地理定位的作用就是 每当有请求发送到网络服务器时
能够让您判断相应的IP地址来自哪里
如果来自法国
您可以向请求方发送法语内容
或将其转到您的.fr域
如果请求方使用的浏览器语言是英语
或者其IP地址来自美国或加拿大
那么地理定位功能就会判断出 英语版本可能是最佳选择
除非请求方来自加拿大的法语区
因此,地理定位的作用就是
根据IP地址作出决断
只要您不将Googlebot所属的特定国家/地区
设置为Googlandia之类的内容
就表示您没有对Googlebot 采取特殊或不同的行为
至少在目前,也就是我们制作这个视频时
Googlebot是从美国抓取网页的
因此您可以将Googlebot视为 来自美国的访问者
并为其提供英语版本的内容
一般情况下,我们建议您 将Googlebot视为普通的桌面浏览器
比如Internet Explorer 7
或适用于您特定网站的 任何一款常见桌面浏览器
因此地理定位
也就是查看IP地址并据此作出反应
是完全没问题的
只要您不特别针对Googlebot的 范围非常窄的IP地址做出反应就行
您应该关注的是
根据IP地址能够提供 什么样的最佳整体用户体验
同样,如果现在某个用户访问网页
我们假设该用户是通过手机访问的
比如通过iPhone或Android手机访问
您可以判断出这是一个完全不同的用户代理
该用户代理具有完全不同的功能
网络服务器完全可以对该用户代理做出回应
向其提供压缩程度更高的网站版本 或更适合较小屏幕的版本
不同之处在于 如果您将Googlebot视为桌面用户
用户代理就不会收到 您提供的任何特殊或不同内容
因此您应该是完全符合要求的
这样您所做的就是查看手机的功能
然后返回相应的自定义网页
而不要试图采取任何具有欺骗或误导性的行为
您不会根据用户代理 对Googlebot采取截然不同的处理方式
那么就应该没什么问题
下面要介绍的最后一项内容 是针对计算机高手的
有些用户会说
我不想以确切的用户代理字符串
或以Googlebot的来源IP地址范围作为区分的依据
但可能会对Cookie进行检查
如果某个用户没有响应Cookie
或者没有以相同方式处理JavaScript
那么我会挑出这个用户并对其采取不同的方式
这种情况下的检验标准就是
您是否以此为借口尝试区别对待Googlebot
或尝试以某种方式分隔Googlebot
从而使其采取完全不同的行为
再强调一次 判断是否隐藏真实内容的根本标准是
您是否以相同的方式对待用户和Googlebot
我们希望获得并返回 与用户将看到的网页大致相同的内容
也就是说我们希望 最终用户在点击Google搜索结果后
看到的内容与他们自己 直接访问相应网页时看到的内容相同
前面我们介绍了为什么 您不应该区别对待Googlebot
为什么隐藏真实内容会造成糟糕的体验 并且会违反我们的质量指南
以及为什么我们要留意这种行为
我们不支持所谓的白帽伪装 (即合理隐藏真实内容)行为
我们衷心希望能确保
用户看到的网页与 Googlebot看到的网页一致
希望这些内容能对您有所帮助
并能让您了解隐藏真实内容 以及一些简单的经验方法
如果本视频未提供您所需的其他信息
可以看看自己的网络服务器中 是否有特殊的代码
专门用于查找Googlebot的用户代理 或Googlebot的确切IP地址
并对其区别对待
如果您的网络服务器 对其采取一视同仁的处理方式
比如根据地理位置发送内容
或者查看用户代理手机
这类情况就不会有什么问题
只有当您特意查找Googlebot
并采取不同行为时
才意味着您开始涉嫌高风险行为
我们的网站上提供了更多相关文档
如果您查看本视频的元数据
就会发现我们提供了相应链接
希望这些文档能够让您了解
我们为什么这样看待隐藏真实内容 为什么我们对此非常重视
以及我们如何看待 尝试判断是否隐藏真实内容的总体效果
归根结底,我们要关注的是 给最终用户带来的效果
因此,不管网络服务器的代码是怎样的
如果向Googlebot提供的内容 不同于用户获得的内容
就可能会引起我们的关注
希望本视频能对您有所帮助