飓风算法2.0,并不是不让你采集
网站的内容怎么样,是百度排名评价网站的一个标准,但是在众多网站中,有百分之八十的网站内容是通过采集的手段而来,为此,为了营造一个绿色的网络大环境,百度推出了《飓风算法》,旨在解决这个文章的采集,影响用户体验的站点。我们先看看官方是怎么解读这个飓风算法的,以下转载于百度搜索学院:
“为了营造良好的搜索内容生态,保护搜索用户的阅读浏览体验,保障优质内容生产方在百度搜索中的权益,百度将于9月下旬对飓风算法进行升级。”
上周,我们发布了《百度搜索将推出飓风算法2.0,严厉打击恶劣采集行为》的公告,今天我们详细说明飓风算法2.0覆盖的问题以及究竟应该怎么做。
飓风算法主要包含以下四类恶劣采集行为:
类型1:采集痕迹明显
详细说明:站点存在大量从其他站点或公众号采集、搬运而来的内容,信息未经整合,排版混乱,部分功能缺失或文章可读性差,有明显采集痕迹,用户阅读感受很差。
示例:采集文章内容中存在超链接不可点、功能缺失问题,采集痕迹明显
建议:对于网站发布的内容,需注意文章的排版和布局,不应出现与文章主旨不相关的信息或不可用的功能,干扰用户的浏览。
所以,如果还在采集的你长点心吧!至少采集的内容是内容完整的,排版合格的网站吧!
类型2:内容拼接
详细说明:采集多篇不同文章进行拼接,整体内容未形成完整逻辑,存在阅读不通顺、文章不连贯等问题,无法满足用户需求。
示例:前后内容无关,逻辑不连贯
建议:我们严厉反对利用采集编辑器等工具,随意生产拼接采集内容的行为,请网站多多生产对用户有价值的原创内容。
驴头不对马嘴的内容就不要东拼西凑了!用户体验不好,没意思的文章只会劳而无功。
类型3:站点存在大量采集内容
详细说明:网站内容下多数内容均为采集,网站自身无内容生产力或内容生产能力较差,网站内容质量较低。
建议:我们鼓励站点生产原创内容,如若转载需标明出处。(如:新闻、政策类等标明出处的转载内容,不会被认为是采集内容)
重点来了:鼓励原创,并不是说不可以转载,但是必须标明原文出处。
类型4:跨领域采集
详细说明:站点依靠采集大量与本站领域不一致的内容来获取流量的行为。
示例:教育站点发布美食相关内容
建议:我们鼓励站点生产领域内的文章和内容,通过领域专注度获得更多的搜索青睐。不要尝试采集跨领域的内容来获得短期收益,这样会造成领域专注度的降低,从而影响站点在搜索中的表现。
卖花的该卖油条了!没有任何相关度,只为了博取那点流量,只能是得不偿失。
综上,飓风算法2.0旨在保障搜索用户的浏览体验,保护搜索生态的健康发展、对于违规网站,百度搜索会依据问题的恶劣程度有相应的限制搜索展现的处理。
对于第一次违规的站点,改好后解除限制展现的周期为1个月;
对于第二次违规的站点,我们将不予释放。
算法上线前,近期我们将会通过搜索资源平台向存在问题的站点发送通知,还请大家关注。
以上红色部分是泰安人才网http://www.tarczp.com评论的,重点是最粗大的那一部分:推荐原创,但是并不是不让你转载,关键是,转载你该标明出处。
阅读更多- 百度推出飓风算法,严厉打击恶劣采集
- 百度搜索将上线"飓风算法 2.0"
- 采集温度,如何处理小数点算法思路
- 金山训练营的一小题(可能我的这个算法不是太好,呵呵,不知各位还有其他的思路没)
- python算法之归并算法-使用readline而不是用readlines文件合并
- ASP.NET 2.0 网页采集方法
- 浅析Family Show 2.0的数据结构及基本算法
- [转]ASP.NET 2.0 下加密解密算法的封装
- DP(六)——多重背包的三重循环算法(效率不是很高)
- 【SD2.0大会】30日10:00 毛新生:Google不是真正的IT公司
- 算法思想 算法重要的是思维,不是程序的实现
- 选择排序、快速排序、希尔排序、堆排序不是稳定的排序算法,而冒泡排序、插入排序、归并排序和基数排序是稳定的排序算法。
- 未来属于算法,而不是代码
- 牛客网NowCoder 2018年全国多校算法寒假训练营练习比赛(第四场)A.石油采集(dfs) B.道路建设(最小生成树prim) C.求交集(暴力) F.Call to your teacher(迪杰斯特拉乱用) H.老子的全排列呢(dfs)
- poj3009 Curling 2.0 dfs+剪枝 编程不是想当然,要严谨,滴水不漏
- hadoop集群算法调用--web平台2.0
- 切换ASP.NET 的版本。如果不是2.0可以从1.0或1.1切换
- 《精通Web Analytics 2.0》书评之2:网站分析行业的经典著作,不是《精通Web Analytics 》的修订补充版。
- ASP.NET 2.0 创建母版页导致js出现“ 'document.getElementById(...)' 为空或不是对象”错误