数据挖掘学习笔记(4)
2014-03-22 21:43
211 查看
网站日志分析相关知识:
W3C扩展日志文件格式常用属性说明表
常用服务器错误代码:
200——OK
206——Partial Content,部分内容
301——Moved Permanently,用户所访问的某个页面url已经做了301重定向(永久性)处理
302——Found,内容被暂时重定向,已经找到
304——Not Modified,未修改,采用缓存(cache)拷贝
401——Unauthorised(password required),需要密码
403——Forbidden,不可访问
404——Not Found,没有内容
408——Request Timeout,请求超时
500——Server Error,通常是服务器发生错误,比如在维护或者下线了
以上几篇数据挖掘学习笔记都摘自于谭磊的《大数据挖掘》中,由电子工业出版社出版,该书以最通俗易懂的介绍性语言来介绍数据挖掘相关概念,原理,算法以及在实际生活中的应用,所讲知识全面易懂,思路清晰,从头读到尾一点不觉得乏味,个人觉得是一本相当不错的书,极力推荐各位有兴趣的朋友去看看。
字段名 | 描述 |
客户端IP地址 | 访问服务器的任何客户端的IP地址 |
用户名称 | 访问服务器的用户名称 |
服务名 | 在客户机上运行的Internet服务 |
服务器名称 | 生成日志项的服务器名称 |
服务器IP | 生成日志项的服务器IP地址 |
服务器端口 | 商户端连接到的端口号 |
方法 | 客户端试图执行的操作(例如,GET命令) |
ServiceStatus | 简单邮件传输协议(SMTP)回复代码 |
URI查询 | 客户端试图执行的查询(如果有)。在日志中记录了客户搜索以进行匹配的一个或多个搜索字符串 |
协议状态 | 以HTTP术语表示的操作的状态 |
发送的字节数 | 服务器发送的字节数 |
接收的字节数 | 服务器接收的字节数 |
所用时间 | 操作所需的时间长短 |
协议版本 | 客户端使用的协议(HTTP, FTP)版本。对于HTTP,是HTTP1.0或HTTP1.1 |
主机 | 计算机名 |
用户代理 | 在客户端使用的浏览器 |
Cookie | 发送或接收的Cookie的内容(如果有) |
引用站点 | 将用记指向当前站点的站点 |
200——OK
206——Partial Content,部分内容
301——Moved Permanently,用户所访问的某个页面url已经做了301重定向(永久性)处理
302——Found,内容被暂时重定向,已经找到
304——Not Modified,未修改,采用缓存(cache)拷贝
401——Unauthorised(password required),需要密码
403——Forbidden,不可访问
404——Not Found,没有内容
408——Request Timeout,请求超时
500——Server Error,通常是服务器发生错误,比如在维护或者下线了
以上几篇数据挖掘学习笔记都摘自于谭磊的《大数据挖掘》中,由电子工业出版社出版,该书以最通俗易懂的介绍性语言来介绍数据挖掘相关概念,原理,算法以及在实际生活中的应用,所讲知识全面易懂,思路清晰,从头读到尾一点不觉得乏味,个人觉得是一本相当不错的书,极力推荐各位有兴趣的朋友去看看。
相关文章推荐
- SQL SERVER 2005 数据挖掘与商业智能完全解决方案---学习笔记(三)
- R语言与数据挖掘学习笔记(常用的包)
- python数据分析与挖掘学习笔记(2)-淘宝商品数据清洗及预处理
- 数据挖掘学习笔记-入门基础篇
- 数据挖掘学习笔记之人工神经网络(二)
- python数据挖掘学习笔记】十四.Scipy调用curve_fit实现曲线拟合
- 《python数据分析和数据挖掘》——ID3决策树学习笔记
- SQL SERVER 2005 数据挖掘与商业智能完全解决方案---学习笔记(三)
- 大数据学习笔记之三十九 数据挖掘算法之预测建模
- 数据挖掘学习笔记一:引论
- R语言与数据挖掘学习笔记(常用的包)
- 数据挖掘学习笔记--系统聚类法和K均值聚类法
- 数据挖掘学习笔记之人工神经网络(二)
- python数据分析与挖掘学习笔记(6)-电商网站数据分析及商品自动推荐实战与关联规则算法
- SQL SERVER 2005 数据挖掘与商业智能完全解决方案---学习笔记(二)
- 大数据学习笔记之三十八 数据挖掘算法之聚类分析
- 数据挖掘第一课学习笔记(Apriori算法和FPTree算法)
- 数据挖掘学习笔记2:数据预处理
- 小白数据挖掘学习笔记1
- 数据挖掘学习笔记(一)