您的位置:首页 > 其它

关于百度的若干问题和百度员工的回答

2006-02-22 17:16 337 查看
caoz目前认识一批这样的站长,Alexa排名都很高,最高的到前500名,1000名以内的有一批,还有不少两三千名的,这些站点的流量构成里,搜索引擎占了很大比重,通常在1/6 - 1/2 之间,有的甚至比1/2还要高,而百度作为中文搜索的老大,对这些站长的站点流量影响尤其巨大,所以耳闻了一些传言,想求证一下。
只是有点好奇,问一下,没别的意思,得罪勿怪。

1:啥叫降权?标准是啥?
最近又一个朋友,做一个访问量很高的站点,被百度降权了,每天的访问统计中,百度搜索的来访变的惨不忍睹,大约只有以前的几十分之一。前段时间也有一个朋友反映,一直遭到百度的封杀,苦等解脱之日。
没别的意思,想了解一下,降权的标准是啥? 有些站长这么反映,因为自己站点上放了3721的广告,同时也放了百度的广告,但是3721的广告位置高一些,百度就会发邮件过来警告,然后就会被降权,不知道是真是假。
现在有这样的站长已经把3721的广告撤掉了,苦苦等待百度对他们网开一面,宽大处理。不知道百度是如何处理这样一种站点和你们的沟通渠道?

2:hao123准备如何维持发展?
目前hao123在给其相关连接站点所带来的点击贡献上还是非常突出的,caoz的统计监控里,若干个站点每天通过hao123获得5000-15000的点击,其中有的站点仅仅列在一个频道里,可以这么说,凡是被列在 hao123上的站点,几乎从hao123过来的流量都能占到外部连接流量的最大比例。 那么就有些站张想知道,第一,如果想加入新站点,目前是什么政策?据说收费了?费率多少?第二,以前被收录的站点会不会有政策处理上的变化?这是他们很关心的问题。

3:又爱又恨的mp3搜索。
从浏览者角度说,baidu的mp3搜索确实方便,因为你只要搜索到了就可以直接下载,上次我给老婆推荐了一搜,但是最后她还是回到了baidu的mp3搜索,她觉得一搜搜出来的是界面,麻烦。恭喜百度。
可是从站长角度,就不这么看了,现在站长们经常讨论的一个话题是“防盗链”,站长们不怕别人和他们交换连接或者做外部的引用连接,连接越多,人气越多,对搜索引擎的spider也一直持欢迎态度,但是对于那种不经过站点界面就提取资源内容的做法,站长们一直以来是非常深恶痛绝的,特别是软件下载站,音乐站,flash站,这种情况更加突出,因为这些站点通常在主机托管费用之外还要交纳昂贵的带宽费用。而带宽被别人不劳而获,却不能带来页面价值的体现,这是不少站点所不能容忍的,那么百度mp3搜索,这种慷别人之慨,大度的一键下载,已经让很多mp3站点非常有意见,如果出现这样的抵制手段(技术上进行抵制的手段还是很容易实现的),百度该如何应对呢?
现在很多音乐站点既不敢得罪百度,怕因此失去页面搜索上的流量,却又对百度MP3搜索的不劳而获颇有微词,这个问题,不知道baidu如何看待?

:啥叫降权?标准是啥?

可以参见:http://www.baidu.com/search/spam.html#1

1. 作弊网站定义

对搜索引擎作弊,是指为了提高在搜索引擎中展现机会和排名的目的,欺骗搜索引擎的行为。
以下行为都可能被认为是作弊:
· 在网页源代码中任何位置,故意加入与网页内容不相关的关键词;
· 在网页源代码中任何位置,故意大量重复某些关键词。即使与网页内容相关的关键词,故意重复也被视为作弊行为;
· 在网页中加入搜索引擎可识别但用户看不见的隐藏文字。无论是使用同背景色文字、超小字号文字、文字隐藏层、还是滥用图片ALT等方法,都属于作弊行为;
· 故意制造大量链接指向某一网址的行为;
· 对同一个网址,让搜索引擎与用户访问到不同内容的网页(包括利用重定向等行为);
· 作弊行为的定义是针对网站而不是网页的。一个网站内即使只有一个网页作弊,该网站也被认为是有作弊行为;
· 有链接指向作弊网站的网站,负连带责任,也会被认为是作弊(但是,作弊网站上链接指向的网站,不算作弊)。

2. 作弊网站害处

根据网页的作弊情况,会受到不同程度的惩罚:
· 较轻微的惩罚,是系统在给网页排名时略为降低该网页的排名;
· 较常见的惩罚,是作弊网站的某些关键词(或所有关键词)的排名降到其它任何网站之后;
· 较严厉的惩罚,对于作弊行为和后果特别恶劣的网站,将从百度中消失;
· 特别补充,含恶意代码或恶意插件等用户极端反感内容的网页,虽然不是作弊,但只要用户投诉,一经确认也会被百度拒绝收录;

根据google 及其他搜索引擎对作弊的定义,最简单的一个衡量方法

“您是否可以坦然地向竞争对手解释您对网站所做的一切。另一个有用的测试方法则是扪心自问:"我这样做能否帮助我的用户?如果不存在搜索引擎,我是否还会这样做?" ”

我想这也适用于国内的站长们!

caoz:1:百度降权,封杀站点的标准是什么

9238:
第一,http://www.baidu.com/search/spam.html 是百度公开和唯一的标准,百度的反spam一直依此处理。就像所有其它搜索引擎一样,百度不能公开所有反spam细节,已公开的部分已经是搜索引擎中算很透明的了。
第二,在百度搜索引擎中对某些站点降权或去除的目的主要是反spam(或者叫反垃圾),反spam的唯一目的是提高用户搜索体验。百度反spam对所有网站一视同仁,不会因为任何网站是百度的客户或合作伙伴而降低惩罚标准,也不会因为任何网站与竞争对手合作或停止与百度的合作而加重惩罚。在百度中,有权限参与网站降权处理的只有了了几人,他们每一个都是极端的搜索爱好者,他们也有完全的自主权和独立性,不用关心处理哪个网站会影响流量或收入,不用给任何部门、任何同事或任何网站面子,他们唯一关心的是用户搜索体验。
第三,搜索引擎优化行为对用户体验的破坏程度是线性分布的,百度反spam是机器自动识别和人工识别互补的体系。既然有识别就有判断的阈值,无论是自动识别还是人工识别,无论把阈值定在哪里,那些阈值附近的优化行为判断总是容易引起争议的。在所有支持中文的搜索引擎中,百度也许已经是反spam做得最努力的,但中国网民在百度的搜索体验仍然每天被spam严重破坏1500万次以上(spam网页出现在搜索结果前10名)。因为中文spam面广量多,因为百度反spam打击也面广量多,即使阈值附近的争议网址只占很少的几个百分点,也可能导致每天有几十个网站有资格对于被惩罚表示异议,这不是百度愿意看到的,但现实点说,无法指望短时间内大幅度减少这种问题,也无法指望能人工一一回复每个提出异议的网站。
另外,对于加入百度搜索联盟并且达到一定搜索量的网站,我们有一个优待政策:在发现自己被降权后可以申请立即复查一次,如果复查发现网站上已没有spam行为,则可以安排尽快取消降权。但这个权利只能用一次,一旦该网站在例行检查、网友举报、或不定期复查中被再次发现spam,那么无论谁也救不了它了。

caoz:hao123的发展思路是什么?第一,如果想加入新站点,目前是什么政策?据说收费了?费率多少?第二,以前被收录的站点会不会有政策处理上的变化?这是他们很关心的问题。

9238:
详细的发展思路是商业机密,我不能在此公开。但可以回答你一个具体的问题,所谓hao123已改为收费登录那是假的,每个频道只是卖少量广告(百度对广告的控制极严,没有在hao123原有基础上增加任何flash或banner,每个频道广告链接原则上不超过5个,不达到一定质量要求的网站即使广告也不卖给它,负责hao123用户体验的员工对广告有一票否决权),但现在肯定没有全面收费,今后的一段时间内也没有这个打算。以前被收录的站点不会有处理策略的变化,hao123的用户体验或者被收录网站的质量是挑选和更新的唯一标准。

caoz:百度mp3搜索的策略与mp3音乐站长群的矛盾如何化解

9238:
迄今为止百度的mp3信息几乎都是从百度的网页库中提取出来的,而百度的spider一直遵守国际通行的robots协议,不愿意被百度收录mp3信息的站长只要写一句robots协议就能阻止百度spider再收集信息(以前收集的信息需要等一段时间被更新后才消失),在百度的用户帮助信息中提供了详细的robots协议写作教程:http://www.baidu.com/search/robots.html

caoz:不知道百度对故意重复的定义是什么,比如donews首页的标题,有大量的IT重复出现,是否算做故意重复呢?又比如前几天突然被降权的9flash.com。他在页面里所重复的“flash”关键词,是不是属于“故意”面向搜索引擎做的呢?我们可以这么测试一下,把“flash电影”和“电影”两个词比较,可以等同吗?不等同说明flash这个词在这里,是必要修饰词,把“flash音乐”和“音乐”两个词比较,可以等同吗?不等同说明flash这个词在这里,是个必要的修饰词,下面的不用解释了,我觉得这个其实很容易理解,如果在对方站点里出现的某些关键词在该站点的内容和连接表述中,属于必要修饰词,并且该关键词所出现的段落和连接有其正确的表述价值,那么这种重复,就不能说是“故意重复”,我不知道百度认同否?

9238:
反spam的唯一目的是提高用户搜索体验。我们不会为了反spam而反spam,不会对所有违反规则的网站施加相同的惩罚,关键在于,用户查看某个关键词的搜索结果时,你的网站对用户是否有价值、这个价值所否值得你排在那个位置?
即使donews对IT重复了,如果在IT这个关键词的搜索结果中没有排在非常不该排的位置,没有对用户搜索体验造成明显破坏,那么理想状态下donews仍不会受惩罚。9flash如果只对flash关键词优化,那么不太容易受到惩罚,但如果对电影关键词优化,那么很容易受到惩罚。
明白的说,网站spam与否是网站的自由,百度无权干涉也没兴趣理睬,但如果哪个网站的行为或效果破坏了中国网民在百度搜索的体验,那么百度也有升级算法、降权、直至拒绝收录这个网站的权利和兴趣。其实各位站长完全没必要把百度怎么想当一回事,站长们只要把百度的搜索用户当一回事就行了,只要你的网站对用户有搜索价值,百度急着升级算法把你排到合适的位置都来不及呢,哪里敢把你降权什么的呢。

caoz: 故意制造大量链接指向某一网址的行为。
我觉得这个条款简直可以让所有的站点纳入作弊的范畴。
百度有个联盟,把代码投放到千万个站点上,算不算“故意制造大量连接指向某一网址”?这个是个玩笑,但是事实是,所有的站长,特别是那些没有能力做大幅度广告预算的个人站点,他们的网络推广途径的重要步骤,就是和大量的不同站点交换连接,交换连接,不就是“故意制造大量链接指向某一网址的行为”吗?这是其一。如果我做了一个站点,我又申请了blog,我又申请了donews,我又申请了什么什么,我又泡论坛,那么我肯定会把我的站点连接放在每个我能放网络连接的地方告诉大家,比如论坛签名档,比如blog的连接,比如donews个人介绍,等等,有没有搜索引擎我都会这么干,站长怎么发展流量?坐等吗?这是其二。商业公司要发新闻稿,公关稿,网络时代了,网络媒体也很重视,一个稿子发新浪搜狐网易千龙天极等等等等,每个稿子上都会有这个公司的连接,又是故意制造大量连接指向同一网址。这是其三。请百度的朋友解释一下,怎么叫“不故意制造大量连接呢”,做好站点,放在那里,等别人连接或者干脆不要外部连接,也许只有国家政府机关的网站会这样。

9238:上一个回答也能用在这里吧?谁爱做链接就做吧,但别针对与自己网站内容不相关的关键词做,即使相关的关键词,也别排到特别不合适的位置去。其实,百度能自动过滤不少可疑链接,所以某些制造链接的行为根本不会受到惩罚,因为对排名不会有任何影响。

caoz:有链接指向作弊网站的网站,负连带责任,也会被认为是作弊
这个最狠,简直是连坐,大清朝倒台后好象就不兴这个了。不过互连网本身就是由大量的连接组成的,这个方式搞下去,恐怕是人人自危吧,我这么说吧,A站作弊(证据确凿,验明正身),B站上不巧给A站做了连接,那么B站被认为是作弊,那么C站上偏偏也给B站做了连接,得,既然B站已经被认定也是作弊,道理同样,C站指向作弊站点,也是作弊,D站又有C站连接,惨了,这么连下去,和百度的Spider没啥区别(相当于倒过来爬);洪桐县里没好人,互联网上没好站,大家彼此彼此。
其实百度真要这么搞也可以,每天公布一个封杀作弊站点列表,并给相关连接站点一天的取消连接的准备期,这样站长们就会每天上来看谁是最新的倒霉蛋,看看在不在自己站点的友情连接里,并且用最短的时间和对方划清界限!消除连接,以免殃及自身不是。

9238:
这条规则,是针对某些拥有一大批域名互相链接作弊的人。从百度中降权或消失对于每个中文网站都是大事,我们不会轻易的批量惩罚的,事实上只有在对某些网站之间的关系相当有把握时才会激活这个惩罚规则,而且,虽然批量链接作弊是机器自动识别的,但识别出的每一个网站在被正式惩罚前都会经过人工验证,几乎不可能误杀。
普通的友情链接再多也不会受惩罚,但仅限链接所用文字是合适的网站名,如果用关键词做链接,则很容易被识别为spam。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: