简单分析百度中文分词技术
2012-06-15 21:18
267 查看
百度为了能在千万亿页面数据量中更快更好的为用户检索信息,因此拥有一套非常好的中文分词算法,利用好百度分词技术,通过提高关键词与搜索之间的匹配度,从而得到更多高转化率流量,对我们这些站长来说非常有用。
百度中文分词与其他中文分词一样,都分为三大分类:基于字符串匹配的方法、基于理解的分词方法、基于统计的分词方法。
1、基于字符串匹配方法:完全匹配,比如说“奥康皮鞋”,这类词百度是不进行切词的,搜索词与我们的网站标题完全匹配,而且网站在有了一定的权重之后就会有好的排名,自然也会有流量。
2、基于理解的分词方法:比如说我们搜索“奥康皮鞋加盟”,百度分词技术将“奥康皮鞋加盟”分成“奥康皮鞋”、“奥康”、“奥康加盟”、“皮鞋加盟”,除去百度知道不算之外,前三条中只有第一和第三条是与搜索词完全匹配,而第二条则是高度匹配,对于长尾关键词来说,完全匹配可能性小,都是高度匹配的页面出现在前面。如果关键词不能做到与搜索完全匹配,要认真的分析用户搜索习惯,做到关键词与搜索词高度匹配,这样获取的流量就越多。
3、基于统计的分词方法:搜索“淘宝网开店奥康皮鞋”,搜索出的结果都不完整,标题与关键词的匹配度相差很大,为什么会这样?根据笔者了解,用户在搜索某个关键词时,搜索引擎首先要检索与搜索词完全匹配的标题,再是高度匹配的标题,最后才进行模糊匹配,进行匹配之后再结合网站权重给页面排名,我们在做seo优化时可利用这点分词原理获取更多的流量。
以上是笔者分析的三种百度中文分词原理,也不全对,希望对大家理解百度中文分词有帮助。
原文地址:http://www.qingdaosem.com/xinwenzhongxin/qdseo/seojq/316.html
百度中文分词与其他中文分词一样,都分为三大分类:基于字符串匹配的方法、基于理解的分词方法、基于统计的分词方法。
1、基于字符串匹配方法:完全匹配,比如说“奥康皮鞋”,这类词百度是不进行切词的,搜索词与我们的网站标题完全匹配,而且网站在有了一定的权重之后就会有好的排名,自然也会有流量。
2、基于理解的分词方法:比如说我们搜索“奥康皮鞋加盟”,百度分词技术将“奥康皮鞋加盟”分成“奥康皮鞋”、“奥康”、“奥康加盟”、“皮鞋加盟”,除去百度知道不算之外,前三条中只有第一和第三条是与搜索词完全匹配,而第二条则是高度匹配,对于长尾关键词来说,完全匹配可能性小,都是高度匹配的页面出现在前面。如果关键词不能做到与搜索完全匹配,要认真的分析用户搜索习惯,做到关键词与搜索词高度匹配,这样获取的流量就越多。
3、基于统计的分词方法:搜索“淘宝网开店奥康皮鞋”,搜索出的结果都不完整,标题与关键词的匹配度相差很大,为什么会这样?根据笔者了解,用户在搜索某个关键词时,搜索引擎首先要检索与搜索词完全匹配的标题,再是高度匹配的标题,最后才进行模糊匹配,进行匹配之后再结合网站权重给页面排名,我们在做seo优化时可利用这点分词原理获取更多的流量。
以上是笔者分析的三种百度中文分词原理,也不全对,希望对大家理解百度中文分词有帮助。
原文地址:http://www.qingdaosem.com/xinwenzhongxin/qdseo/seojq/316.html
相关文章推荐
- 简单分析百度中文分词技术
- 深入浅出Hadoop Mahout数据挖掘实战(算法分析、项目实战、中文分词技术)
- 中文分词技术实验:百度、雅虎、谷歌大比拼
- 百度关键词算法之中文分词算法_利用分词算法来分析关键词
- 转百度(baidu)中文分词算法分析(二)
- 中文分词-简单文章分析玩出来的
- 如何通过百度快照分析中文分词和百度排名
- 如何通过百度快照分析中文分词和百度排名
- 分析埋点技术并用JS+PHP简单实现(附代码)
- 【结巴分词资料汇编】结巴中文分词源码分析(2)
- 中文分词消除歧义简单思想
- 中文分词技术
- RIA技术简单分析
- Web端服务器推送技术原理分析及dwr框架简单的使用
- asp.net 简单单点登录技术分析
- 【结巴分词资料汇编】结巴中文分词源码分析(2)
- 中科院中文分词系统ICTCLAS之NShortPath代码的详细分析
- NLP+词法系列(二)︱中文分词技术简述、深度学习分词实践(CIPS2016、超多案例)
- 搜索引擎技术揭密:中文分词技术
- 三叉搜索树(Ternary Search Trie)和中文分词原理分析