您的位置:首页 > 其它

SEO站内优化系列讲(五)之内部文章的相关性

2011-04-07 21:28 281 查看
SEO站内优化系列讲(五)之内部文章的相关性

一、什么是相关性

百度和谷歌等为了给用户提供高质量的信息,从中过滤掉匹配度不高或黑猫垃圾信息

搜索引擎如何计算

什么叫百度分词算法

搜索引擎对关键词进行规划,就是把原先的这种不公平性去掉。把他们的对比的数字变成一个可以对比的纯量。关键词次数/字数

所以不能够按照关键词出现的次数计算,这样是不合理的

二、相关性与SEO有什么关系

三、相关性如何来进行判断

搜索引擎如何判断相关性

首先了解搜索引擎分词算法技术;(搜索引擎为了辨别搜索词跟页面关键词的匹配度而进行的分词,将搜索词分解为不能再分的短语)

搜索引擎如何去判断那些网页是否相关

1)查看网页页面包含搜索词最多的;(不能按照关键词出现的次数计算,这样不合理)

2)对关键词进行规划;(对网页内关键词出现的频率进行量化)消除1)中的不公平性

那么通过网页关键词的次数除以网页的总字数,我们称之为关键词的频率

关键词频率:出现次数/总字数

关键词密度:出现字数/总字数

四、相关性我们如何去运用他让我们的站内页面获得很好的流量 和长尾关键词排名

1.“比如SEO、是、什么,在一个1000字的页面中分别出现了,SEO 15次,是出现53次,什么出现了21次。 那么他们的频率分别是 0.015 、0.053、0.021 这3个频率。我们把这3个数字相加,0.089 就是相应网页和查询“SEO是什么”相关性的一个简单的度量值。”但是“是”这个词太多了

在汉语中,应删除词还有“的”、“和”、“中”、“地”、“得”等等几十个。

那是不是这样我们就完全计算出页面的相似度了呢?如果我们再仔细的观察,我们会发现还有一个小漏洞。那就是什么这个词是一

关键词频率:出现次数/总字数

关键词密度:出现字数/总字数

1. 一个词预测主题能力越强,权重就越大,反之,权重就越小。我们在网页中看到“SEO”这个词,或多或少地能了解网页的主题。我们看到“什么”一次,对主题基本上还是一无所知。因此,“SEO“的权重就应该比“什么”这个词权重大。2. 应删除词的权重应该是零

那么我们怎样是分辨一个是主词还是副词呢?可能各位同学脑袋上还有很多很多问号?其实不难分辨,我们只需要知道我们搜索的这个短语中,去掉常规的过滤词(应删除词)外哪个词可能出现的网页数量要低于另外一个词,那个词就是主词,反之就是副词,所以这个逻辑还是非常简单的。

http://www.xieguang133.com
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: