2018-06-07 17:22:52
返回码即HTTP状态码(HTTP Status Code),是用以表示网页服务器HTTP响应状态的3位数字代码。它由RFC 2616规范定义的,并得到RFC 2518、RFC 2817、RFC 2295、RFC 2774、RFC 4918等规范扩展。
由于搜索引擎的蜘蛛在对网站进行抓取和处理时,是根据HTTP协议规范来设置相应的逻辑的,因此,使用合理的返回码是很有助于优化网站SEO效果的。
常见的返回码有以下几种:
301 Moved Permanently
使用301返回码时,搜索引擎会永久重定向网站页面,当网站遇到站点迁移、域名更换和站点改版的情况时,设置301返回码能减少改版带来的流量损失。
403 Forbidden
403错误,表示资源不可用。服务器理解客户的请求,但拒绝处理它,通常由于服务器上文件或目录的权限设置导致的网站访问错误。使用403返回码时,搜索引擎会认为当前页面禁止访问,但也不会马上删除,短期内会反复访问几次,如果网页允许访问,则正常抓取,如果长期返回403,搜索引擎会认为该URL是失效链接,将会删除。
404 Not Found
404页面是客户端在浏览网页时,服务器无法正常提供信息,或是服务器无法回应,且不知道原因所返回的页面。使用404返回码时,如果网站出现死链接,搜索引擎蜘蛛爬行这类网址得到“404”状态回应时,即知道该URL已经失效,便不再索引该网页,并向数据中心反馈将该URL表示的网页从索引数据库中删除。这样一来能避免因为死链接影响网站收录,同时也能引导用户不要关闭网站,增强用户体验。
503 Service Unavailable
使用503返回码后,遇到临时的服务器维护或者过载,服务器当前无法处理请求的情况时,搜索引擎的蜘蛛会认为该网页临时不可访问,但不会把这条URL直接删除,短期内会再访问。届时如果网页已恢复,则正常抓取;如果继续返回503,短期内还会反复访问几次。但是如果网页长期返回503,那么这个URL仍会被认为是失效链接,从搜索结果中删除。