404状态码“网页不存在”在SEO中应用

谷歌官方博客及管理员中心等网站都提过404状态码的问题,今天小东北整理出一些主要的东西和大家分享一下。

404状态码“网页不存在”的原因

网站的访问者会由于多种原因在访问您的网站时碰到404“网页不存在”的情况:

输错了网址,或者复制粘贴网址时出错;

所点击的网页上或者email信息里的链接已经失效或不完整;

该网页的内容已经被移动或删除;

404状态码的困惑

在碰到404页面时,访问者可能会尝试手动纠正这个错误的网址,或者点击返回按钮,甚至会直接离开您的网站。那么你需要采取多种方法帮助网站访问者走出这个死胡同。

在网络上,我们可以看到两种404(”文件无法找到”)响应代码:”硬404代码”和”软404代码”。我们不鼓励使用所谓的”软404代码”,因为它们可能会对用户和搜索引擎造成困惑。对一个不存在的URL,那些提供”软404代码”的网站不是返回一个404响应代码,而是返回一个200响应代码。然而,伴随这种200响应代码的内容通常是该网站的首页或者是一个错误信息的页面。

一个软404代码的用户体验是怎样的呢?这里有一个软404代码的模型:这个网站对一个不存在的URL返回一个200相应代码以及这个网站的首页。

软404代码会给用户带来困惑,而且搜索引擎也会花很多时间在您的网站上爬行和索引一些并不存在、而且经常重复的URL。这会给您网站的索引覆盖率造成负面影响,由于谷歌机器人被这种代码误导并花了大量时间爬行一些并不存在的网页,您的一部分含有独特内容的网页反而有可能无法被及时发现,或者不能被经常性访问。

如果不返回一个软404代码,我应当怎么做呢?

更好的做法是返回一个404响应代码,而且向用户清晰地说明这个文件无法找到。这样做将使搜索引擎和用户都得到更愉快的体验。

返回404响应代码:向用户返回更明确的信息

我的服务器可以返回404代码,但同时向用户发送一个有帮助意义的”无法找到”的消息么?

当然可以做到!

对于返回404状态代码的网页,你们是否对网页的内容进行收录或者抓取上面的链接呢?

我们会尽可能地去了解您的网站及其内容。所以,尽管我们不想在搜索结果里向用户展示返回404状态代码的页面,但是我们可以把该页面上的内容或者链接(如果能探测到的话)作为一个线索来帮助我们更好地了解您的网站。

请记住如果您想让您的链接和内容被有效抓取和收录的话,将这些链接和内容放在一个非404页面上会更有益处。

如果返回404状态代码,然后使用meta refresh 10秒后进行页面刷新呢?

Yahoo!公司现在对于他们的404页面使用这种方法进行处理。他们返回404代码,同时其页面内容也包括:

<meta http-equiv=”refresh” content=”10;url=http://www.yahoo.com/?xxx”>

我们赞同此项技术,因为这样做可以减少对用户的困扰,用户有10秒钟时间来做一个新的选择,如果在此期间用户没有任何输入,10秒钟结束后页面就会自动跳转到主页。

我应该将网址拼写错误导致的404页面使用301永久重定向到正确的网址吗?

如果重定向/301重定向返回404代码的页面对用户有帮助(比如,不像软404代码那样让人困惑),那么这样做就是一个不错的主意。举个例子,如果您看到您的网站管理员工具的抓取错误栏里显示了一个对于拼写错误的网址返回404的抓取错误,您就可以将此拼写错误的网址301重定向到正确的网址。

比如,如果我们在抓取错误里看到这样一个404错误:

http://www.google.com/webmsters <– webmasters拼写错误

如果网站真的存在这个拼写错误的网址的话,我们可以首先纠正它,然后使用301将其永久重定向到正确的网址(因为这个无效链接可能在其它网站也存在):

http://www.google.com/webmasters

希望大家把404状态码重视起来:)

9 Replies to “404状态码“网页不存在”在SEO中应用

  1. 404 不用避免,也避免不了。我们要做的是在它出现的时候做一个对用户和搜索引擎都友好的一个处理~

发表评论