<学习笔记2>数据挖掘原理与运用-sql server2008 数据库
2016-10-22 00:07
423 查看
2016/10/20
第四章
即时模式和脱机模式
即时模式:所有操作会立刻更新到数据库。
原谅我不知道书上的数据是怎么导进去的。这书面向的群众都比较牛逼可能。
107页开始有详细描述了。不错
看得懂很多所以没记笔记了增强记忆了。
命名计算和命名查询的区别
命名计算通常是在现有dsv表后附加一列(不影响实际数据源)
命名查询从图上看是独立出来的一张表。
2016/10/21
处理:利用工具在服务器上训练模型的过程称为处理(训练模型?意思是可以根据结果来进行参数调优吗?)
处理的三种状态:经过处理的,部分经过处理的,没经过处理的。
处理的选项:Process Full(挖掘结构设置时,先处理挖掘结构,然后对挖掘模型进行并行处理。挖掘模型设置时,如挖掘结构未处理则重新读取数据源)
Process Default(更改挖掘结构中的挖掘模型,不重新读取数据,而是使用已有数据)
Unprocess(删除相关数据,清除缓存,不处理挖掘模型)
Process Structure(只对挖掘结构有效,不处理挖掘结构包含的模型。)
Process Clear Structure(对挖掘结构使用时,删除缓存的源数据,不处理挖掘模型,下一次处理挖掘结构要重新读取源数据)
混乱。思考下...
整理了下图,理清一点思路,但是还是缺漏很多。
(尴尬。。。没随手保存,网页出了点问题。。记得一些都没了,剩一些照片)
问题:
解决:
问题
最终解决:
10/21 第四章完成。体会:看到后面有了整体思路以后感觉很多东西的作用就一目了然了。读书还得自上而下,先总体后细节。
本章最后介绍了Management studio中数据挖掘的用法,但是感觉并不如analysis services实用,因为并不然脱离analysis services来使用他的所谓集成功能。
2016/10/22
第五章
一个概念,数据配平(过度抽样):什么意思呢,就是假如10000人中只有20人犯罪,则犯罪率是0.2%,而我们的事务频率要求是2%,一种情况下,我们尽量将有犯罪的人的事务提取到我们抽样的表中来达到此目的。另一种情况,因为只有20人犯罪,所以我们不得不缩减我们的抽样人数到1000(减小结果集),以达到2%的事务频率。
第四章
即时模式和脱机模式
即时模式:所有操作会立刻更新到数据库。
原谅我不知道书上的数据是怎么导进去的。这书面向的群众都比较牛逼可能。
107页开始有详细描述了。不错
看得懂很多所以没记笔记了增强记忆了。
命名计算和命名查询的区别
命名计算通常是在现有dsv表后附加一列(不影响实际数据源)
命名查询从图上看是独立出来的一张表。
2016/10/21
处理:利用工具在服务器上训练模型的过程称为处理(训练模型?意思是可以根据结果来进行参数调优吗?)
处理的三种状态:经过处理的,部分经过处理的,没经过处理的。
处理的选项:Process Full(挖掘结构设置时,先处理挖掘结构,然后对挖掘模型进行并行处理。挖掘模型设置时,如挖掘结构未处理则重新读取数据源)
Process Default(更改挖掘结构中的挖掘模型,不重新读取数据,而是使用已有数据)
Unprocess(删除相关数据,清除缓存,不处理挖掘模型)
Process Structure(只对挖掘结构有效,不处理挖掘结构包含的模型。)
Process Clear Structure(对挖掘结构使用时,删除缓存的源数据,不处理挖掘模型,下一次处理挖掘结构要重新读取源数据)
混乱。思考下...
整理了下图,理清一点思路,但是还是缺漏很多。
(尴尬。。。没随手保存,网页出了点问题。。记得一些都没了,剩一些照片)
问题:
解决:
问题
最终解决:
10/21 第四章完成。体会:看到后面有了整体思路以后感觉很多东西的作用就一目了然了。读书还得自上而下,先总体后细节。
本章最后介绍了Management studio中数据挖掘的用法,但是感觉并不如analysis services实用,因为并不然脱离analysis services来使用他的所谓集成功能。
2016/10/22
第五章
一个概念,数据配平(过度抽样):什么意思呢,就是假如10000人中只有20人犯罪,则犯罪率是0.2%,而我们的事务频率要求是2%,一种情况下,我们尽量将有犯罪的人的事务提取到我们抽样的表中来达到此目的。另一种情况,因为只有20人犯罪,所以我们不得不缩减我们的抽样人数到1000(减小结果集),以达到2%的事务频率。
相关文章推荐
- <学习笔记3>数据挖掘原理与运用-sql server2008 数据库
- <学习笔记4>数据挖掘原理与运用-sql server2008 数据库
- <学习笔记5>数据挖掘原理与运用-sql server2008 数据库
- <学习笔记>数据挖掘原理与运用-sql server2008 数据库
- <学习(总)>数据挖掘原理与运用-sql server2008数据库
- 数据挖掘原理学习笔记【1】 绪论
- <转>ASP.NET学习笔记之MVC 3 数据验证 Model Validation 详解
- <hadoop学习历程>--笔记心得3-HDFS数据管理与容错
- <hadoop学习历程>--笔记心得6-MapReduce原理
- <<Python基础教程>>学习笔记 | 第13章 | 数据库支持
- 【linux学习笔记】bash学习之数据流重导向('<' 、'<<'、 '>'、 '>>'、 '2>'、 '2>>')以及双向重导向tee
- 数据、进程-云计算学习笔记---Hadoop简介,hadoop实现原理,NoSQL介绍...与传统关系型数据库对应关系,云计算面临的挑战-by小雨
- <转>cocos2d-x学习笔记(五)仿真树叶飘落效果的实现(精灵旋转、翻转、钟摆运动等综合运用)
- Accelerated C++学习笔记5—<组织程序和数据>
- LuaFramework_UGUI_学习笔记 <2>
- 【数据库学习笔记】Oracle_01_sql*plus,存储结构,用户管理,常用数据类型
- <学习CSS>第三天笔记-css外观属性(颜色、行间距、对齐、首行缩进、字间距、单词间距 、颜色半透明、阴影)快捷方式、综合案例、引入CSS样式表(内部样式表、行内式、外部样式表)、三种样式表总结
- <git教程>学习笔记
- Python学习笔记020——数据库中的数据类型
- <Python编程从入门到实践--web应用程序> 学习笔记