百度站长俱乐部答问录,很多关于百度的关键问题(一)

        此前,由于缺少有效的沟通渠道,使得网站站长或从事搜索引擎营销的人士很难获取到直接来自百度的信息。自 4 月 7 日百度创建站长俱乐部以来,这种局面有所改善,业内几位高人已经受邀加入俱乐部,并代表站长们提出了一些针对百度在收录、链接、权重、算法等方面的问题,这些问题大都由 Zac 与柳焕斌提出或代问,百度官方用 Lee 和 kkksuper 的 ID 陆续做了回答。

百度站长俱乐部 – 关于网站问题解答

问:使用虚拟主机的网站会不会因为同一个 IP 或同一台服务器上有其他网站作弊被处罚而受连累,也被惩罚?

答:连坐,血统论等,是在极权社会里才出现的反人类政策。一个成熟的搜索引擎,这么蛮干的可能性很小。

问:将一个旧的 URL 进行 301 重定向处理,百度反应很慢?而且旧的 URL 会在相当一段时间内还存在于百度搜索结果中,但是网页标题是新的,缺少描述。

答:对于内容迁移,我们推荐的做法就是将旧 URL 301 永久重定向到内容对应的新 URL,这样我们会把旧 URL 积累的权值转移到新 URL 上。

       为了避免种种不稳定的因素,目前我们的处理策略比较保守,新、旧 URL 会同时并存相当长的时间。最近我们意识到这样处理其实并不妥当,正在调研更迅速的处理方式,相信很快就可以完美的处理好这个问题。

问:百度对使用海外空间的中文网站有歧视吗?百度是否会抓取域名注册人的相关 whois 信息?

答:1、百度对海外站点没有歧视。但百度从国内爬出去的蜘蛛,会严格遵守国家的政策和法令,所以国内普通用户访问受限的内容,百度蜘蛛一样会搞不定。

2、任何对站点价值分析有贡献的要素,都有可能被搜索引擎使用。并且这些要素的使用方式,也不是一成不变的。至于具体有哪些要素已经被使用以及如何使用,这个无法详述。

问:百度如何看待伪原创?

答:“伪原创”就是“非原创”。对非原创的策略,同样适用于伪原创。归根结底,这是一个技术实现程度问题,而不是策略思路问题。

ZAC好多人认为他们做的所谓“伪原创”挺好,应该能骗过搜索引擎,这大概低估了搜索引擎算法。还是得回到根本,内容为王。说起来容易,做起来难,很少人会认真去做。

问:百度如何对待过期域名?谷歌对过期的域名很长一段时间还有收录, 而百度却很快就会将其清空。

答:过期域名也是域名,所以,适用于新域名的策略,也一样适用于过期域名。只是过期域名在历史上累积的与现有网站无关的权重,会被剥离掉,这也是很容易理解的。

百度站长俱乐部 – 关于百度收录问题

问:大概在 4 月 1 日前后,很多站长用 site 查看自己在百度的收录数量,发现狂降,现在好像又恢复了,那是怎么回事?

答:我们也注意到了这种说法,其实收录方面没什么变动,只是我们在上线新策略的过程中短暂影响了结果数估算算法,大家只要关注一下流量即可知道,那段时间从百度获得的流量并没有变化,如果收录数真的发生了大的变动,肯定会影响流量。

       另外,相信大家在用 site 语法查询结果数时,也看到了搜索结果最上方的“找到的相关网页数是估算值,不代表真实结果数,仅供参考的提示”的提示,我们的搜索结果数估算算法是针对正常用户的关键词检索而设计,没有针对site语法检索做过优化,它得出的搜索结果数只能做为一个参考,建议关注网站从百度获得的流量有没有变动更直接。

问:网站用 site: 查询,只有首页收录,请问是什么机制造成的?

答:两种情况:

1、新站点,具体内容还没来得及抓取和索引。

2、老站点,因为种种原因被严厉惩罚了,站长圈俗称“拔毛”。

       后者的严厉惩罚机制,我们期望逐渐演化为更合理的甄别和处理。实际上现在的状况,比之四、五年前,已经人性化多了。呵呵。

问:一般来说,网站所有者不是太希望 https 的网页被收录。如果收录了,如果处理?把 https 的网页 URL 更换成 http 形式的?还有一种情况,就是 ip 地址形式的URL被收录。

答:如果不希望被收录,常规的做法是设置 robots 文件。

       https 主要的出发点是安全,并没有太多考虑搜索引擎。从用户角度,很多采用了 https 的站点(尤其是首页),也是需要被搜索到的,比如支付宝,贝宝等。通常情况下,搜索引擎对这类网页并不做内容解析,而只是将 URL 进行索引。

       IP 地址的 URL 被收录,除了 spider 在机制上的不完善之外,通常站点设计上也有一些缺陷。一般情况下,这类问题是可以被规避的。

问:百度数据更新的周期大概是多长?

答:如果是一个变化频繁的入口索引页面,相信这个变化周期会很短;而是相对稳固的内容型页面,周期则会相对较长。站长们观察一下蜘蛛的爬取日志,发现的规律会比这边的说明更有价值。

       此外,搜索结果页上的那个时间,一直很让人confusing,我们正在考虑修改。

发表评论