网站流量统计时用户识别方法
2011-04-29 09:04
183 查看
1、基于IP的用户识别
IP地址是最容易获取的信息,任何的WEB日志中均会包含,但其局限性也较为明显:伪IP、代理、动态IP、局域网共享同一公网IP出口……这些情况都会影响基于IP来识别用户的准确性,所以IP识别用户的准确性比较低,目前一般不会直接采用IP来识别用户。
获取难度:★
准确度:★
2、基于IP+Agent的用户识别
同样基于最简单形式的WEB日志,我们可以增加一项——Agent,来提高单一IP方式识别用户的准确性。Agent也是WEB日志中一般都会包含的信息,通过IP+Agent的方式可以适当提高IP代理、公用IP这类情况下用户的分辨度,同时通过Agent还可以识别网络爬虫等特殊“用户”,但同样准确度也欠高。
获取难度:★
准确度:★★
3、基于cookie的用户识别
当你通过自定义Apache日志格式或者JavaScript的方法获得用户cookie的时候,其实你已经找到了一个更有效的用户识别的手段。cookie在未被清除的其前提下可以认为是跟某个访问客户端电脑绑定的(一个客户端有可能包含多个cookie),所以用cookie来标识用户其实指的是用户使用的客户端电脑,而并非用户本身。
用cookie识别用户的方法当然也存在缺陷:最常见的就是cookie被清除而导致用户无法与原先记录实现对应;同时由于客户端电脑会被共用,或者用户会在不同的电脑上访问你的网站,这个时候cookie就无法直接对应到该用户了。
获取难度:★☆
准确度:★★☆
4、基于用户ID的用户识别
基于用户ID的用户识别是最为准确,因为一般情况下用户不同共享他的用户ID,所以我们可以认为数据中的userid唯一地指向该用户,几乎不存在偏差。当然要使用用户ID来识别用户是需要一定的前提条件的:网站必须是提供用户注册登录服务的,并且可以通过一些手段在点击流数据中记录 userid。
获取难度:★★
准确度:★★★
所以对于一个需要用户ID注册登录的网站来说,用户唯一标识符的选择可以遵从以下顺序:当用户注册登录时以userid为准,当用户在未登录状态浏览时以用户的cookie为准,当用户未登录且cookie无法获取的情况下以IP+Agent为准;这样就能从最大程度上识别唯一用户。
这里推荐一个网站日志中cookie项的自定义设置方法,以便更好地识别用户。cookie是从用户端存放的cookie文件记录中获取的,这个文件里面一般在包含一个cookieid的同时也会记下用户在该网站的userid(如果你的网站需要注册登陆并且该用户曾经登录过你的网站且 cookie未被删除),所以在记录日志文件中cookie项的时候可以优先去查询cookie中是否含有用户ID类的信息,如果存在则将用户ID写到日志的cookie项,如果不存在则查找是否有cookieid,如果有则记录,没有则记为”-”,这样日志中的cookie就可以直接作为最有效的用户唯一标识符被用作统计。当然这里需要注意该方法只有网站本身才能够实现,因为用户ID作为用户隐私信息只有该网站才知道其在cookie的设置及存放位置,第三方统计工具一般很难获取。
获取用户信息的途径
通过以上的方法实现用户身份的唯一标识后,我们可以通过一些途径来采集用户的基础信息、特征信息及行为信息,然后为每位用户建立起详细的 Profile:
1) 用户注册时填写的用户注册信息及基本资料;
2) 从网站日志中得到的用户浏览行为数据;
3) 从数据库中获取的用户网站业务应用数据;
4) 基于用户历史数据的推导和预测;
5) 通过直接联系用户或者用户调研的途径获得的用户数据;
6) 有第三方服务机构提供的用户数据。
识别并获取用户信息的价值
通过用户身份识别及用户基本信息的采集,我们可以通过网站分析的各种方法在网站是实现一些有价值的应用:
* 基于用户特征信息的用户细分;
* 基于用户的个性化页面设置;
* 基于用户行为数据的关联推荐;
* 基于用户兴趣的定向营销;
* ……
IP地址是最容易获取的信息,任何的WEB日志中均会包含,但其局限性也较为明显:伪IP、代理、动态IP、局域网共享同一公网IP出口……这些情况都会影响基于IP来识别用户的准确性,所以IP识别用户的准确性比较低,目前一般不会直接采用IP来识别用户。
获取难度:★
准确度:★
2、基于IP+Agent的用户识别
同样基于最简单形式的WEB日志,我们可以增加一项——Agent,来提高单一IP方式识别用户的准确性。Agent也是WEB日志中一般都会包含的信息,通过IP+Agent的方式可以适当提高IP代理、公用IP这类情况下用户的分辨度,同时通过Agent还可以识别网络爬虫等特殊“用户”,但同样准确度也欠高。
获取难度:★
准确度:★★
3、基于cookie的用户识别
当你通过自定义Apache日志格式或者JavaScript的方法获得用户cookie的时候,其实你已经找到了一个更有效的用户识别的手段。cookie在未被清除的其前提下可以认为是跟某个访问客户端电脑绑定的(一个客户端有可能包含多个cookie),所以用cookie来标识用户其实指的是用户使用的客户端电脑,而并非用户本身。
用cookie识别用户的方法当然也存在缺陷:最常见的就是cookie被清除而导致用户无法与原先记录实现对应;同时由于客户端电脑会被共用,或者用户会在不同的电脑上访问你的网站,这个时候cookie就无法直接对应到该用户了。
获取难度:★☆
准确度:★★☆
4、基于用户ID的用户识别
基于用户ID的用户识别是最为准确,因为一般情况下用户不同共享他的用户ID,所以我们可以认为数据中的userid唯一地指向该用户,几乎不存在偏差。当然要使用用户ID来识别用户是需要一定的前提条件的:网站必须是提供用户注册登录服务的,并且可以通过一些手段在点击流数据中记录 userid。
获取难度:★★
准确度:★★★
所以对于一个需要用户ID注册登录的网站来说,用户唯一标识符的选择可以遵从以下顺序:当用户注册登录时以userid为准,当用户在未登录状态浏览时以用户的cookie为准,当用户未登录且cookie无法获取的情况下以IP+Agent为准;这样就能从最大程度上识别唯一用户。
这里推荐一个网站日志中cookie项的自定义设置方法,以便更好地识别用户。cookie是从用户端存放的cookie文件记录中获取的,这个文件里面一般在包含一个cookieid的同时也会记下用户在该网站的userid(如果你的网站需要注册登陆并且该用户曾经登录过你的网站且 cookie未被删除),所以在记录日志文件中cookie项的时候可以优先去查询cookie中是否含有用户ID类的信息,如果存在则将用户ID写到日志的cookie项,如果不存在则查找是否有cookieid,如果有则记录,没有则记为”-”,这样日志中的cookie就可以直接作为最有效的用户唯一标识符被用作统计。当然这里需要注意该方法只有网站本身才能够实现,因为用户ID作为用户隐私信息只有该网站才知道其在cookie的设置及存放位置,第三方统计工具一般很难获取。
获取用户信息的途径
通过以上的方法实现用户身份的唯一标识后,我们可以通过一些途径来采集用户的基础信息、特征信息及行为信息,然后为每位用户建立起详细的 Profile:
1) 用户注册时填写的用户注册信息及基本资料;
2) 从网站日志中得到的用户浏览行为数据;
3) 从数据库中获取的用户网站业务应用数据;
4) 基于用户历史数据的推导和预测;
5) 通过直接联系用户或者用户调研的途径获得的用户数据;
6) 有第三方服务机构提供的用户数据。
识别并获取用户信息的价值
通过用户身份识别及用户基本信息的采集,我们可以通过网站分析的各种方法在网站是实现一些有价值的应用:
* 基于用户特征信息的用户细分;
* 基于用户的个性化页面设置;
* 基于用户行为数据的关联推荐;
* 基于用户兴趣的定向营销;
* ……
相关文章推荐
- 利用Redis统计网站在线活跃用户的方法
- 11月国内网站统计:淘宝得益于双11流量直逼腾讯
- 对于大流量的网站,您采用什么样的方法来解决访问量问题?
- 50种快速提升网站流量方法!
- PHP基于cookie与session统计网站访问量并输出显示的方法
- jsp网站访问次数统计的几种方法
- 如何让用户更容易找到信息 优化网站信息架构方法谈
- 网站流量统计系统 phpMyVisites
- 改善网站用户体验的20个方法
- 网站流量的统计中的IP、PV、UV
- 网站防止用户复制的js方法
- 5款开源的PHP网站流量统计应用程序
- 8月国内网站流量统计TOP5:360安全中心季军
- jsp网站访问次数统计的几种方法(比较简单的几种)
- GDI/GDI+ 绘制网站流量统计报表 总结(5)
- Java学习之道:网站流量统计的:pv,uv,ip说明
- Facebook变更用户量统计方法 Zynga受影响
- 网站流量统计之PV和UV
- 迅速提高网站流量的方法
- 怎样在Asp.net中实现当前网站的访问用户数量统计