数据挖掘学习
2019-01-13 13:15
483 查看
数据挖掘基础环境安装与使用
- 完成数据挖掘基础阶段的所有环境安装
- 应用jupyter notebook完成代码编写运行
1.1 库的安装
学习目标
- 目标 搭建好数据挖掘基础阶段的环境
-
无
整个数据挖掘基础阶段会用到Matplotlib、Numpy、Pandas、Ta-Lib等库,为了统一版本号在环境中使用,将所有的库及其版本放到了文件requirements.txt当中,然后统一安装
新建一个用于人工智能环境的虚拟环境
mkvirtualenv -p /user/local/bin/python3 ai
matplotlib==2.2.2 numpy==1.14.2 pandas==0.20.3 TA-Lib==0.4.16 tables==3.4.2 jupyter==1.0.0
Ta-Lib安装会出现问题,需要先安装依赖库,按照以下步骤安装:
# 获取源码库 sudo wget http://prdownloads.sourceforge.net/ta-lib/ta-lib-0.4.0-src.tar.gz # 解压进入目录 tar -zxvf ta-lib-0.4.0-src.tar.gz cd ta-lib/ # 编译安装 sudo ./configure --prefix=/usr sudo make sudo make install # 重新安装python的TA-Lib库 pip install TA-Lib
使用pip命令安装
pip install -r requirements.txt
[/code]
1.2 Jupyter Notebook使用
学习目标
- 目标 学会使用Jupyter Notebook编写运行代码
-
创建文件
1.2.1 Jupyter Notebook介绍
Jupyter项目是一个非盈利的开源项目,源于2014年的ipython项目,因为它逐渐发展为支持跨所有编程语言的交互式数据科学和科学计算
- Jupyter Notebook,原名IPython Notbook,是IPython的加强网页版,一个开源Web应用程序
- 名字源自Julia、Python 和 R(数据科学的三种开源语言)
- 是一款程序员和科学工作者的编程/文档/笔记/展示软件
- .ipynb文件格式是用于计算型叙述的JSON文档格式的正式规范
1.2.2 为什么使用Jupyter Notebook?
- 传统软件开发:工程/目标明确 需求分析,设计架构,开发模块,测试
-
目的是具体的洞察目标,而不是机械的完成任务
实时运行的代码、叙事性的文本和可视化被整合在一起,方便使用代码和数据来讲述故事
对比Jupyter Notebook和Pycharm
- 画图
1.2.3 Jupyter Notebook的使用-helloworld
1 界面启动、创建文件
- 界面启动
环境搭建好后,本机输入jupyter notebook命令,会自动弹出浏览器窗口打开Jupyter Notebook
# 进入虚拟环境 workon ai # 输入命令 jupyter notebook
本地notebook的默认URL为:http://localhost:8888
想让notebook打开指定目录,只要进入此目录后执行命令即可
新建notebook文档
- notebook的文档格式是
.ipynb
- 内容界面操作-helloworld
标题栏:点击标题(如Untitled)修改文档名 菜单栏
- 导航-File-Download as,另存为其他格式
- 导航-Kernel Interrupt,中断代码执行(程序卡死时)
- Restart,重启Python内核(执行太慢时重置全部资源)
- Restart & Clear Output,重启并清除所有输出
- Restart & Run All,重启并重新运行所有代码
2 cell操作
什么是cell?
cell:一对In Out会话被视作一个代码单元,称为cell
Jupyter支持两种模式:
- 编辑模式(Enter)
命令模式下
回车Enter
或鼠标双击
cell进入编辑模式 - 可以操作cell内文本或代码,剪切/复制/粘贴移动等操作
-
按
Esc退出编辑,进入命令模式
1)鼠标操作
2)快捷键操作
- 两种模式通用快捷键
Shift+Enter
,执行本单元代码,并跳转到下一单元 Ctrl+Enter
,执行本单元代码,留在本单元
cell行号前的 * ,表示代码正在运行
- 命令模式:按ESC进入
Y
,cell切换到Code模式 M
,cell切换到Markdown模式A
,在当前cell的上面添加cellB
,在当前cell的下面添加cell双击D
:删除当前cellZ
,回退L
,为当前cell加上行号 <!--Ctrl+Shift+P
,对话框输入命令直接运行- 快速跳转到首个cell,
Crtl+Home
- 快速跳转到最后一个cell,
Crtl+End
-->
-
多光标操作:
Ctrl键点击鼠标(Mac:CMD+点击鼠标)
Ctrl+Z(Mac:CMD+Z)
Ctrl+Y(Mac:CMD+Y)
Tab键
Ctrl+/(Mac:CMD+/)
3 markdown演示
掌握标题和缩进即可
一级标题
二级标题
三级标题
四级标题
五级标题
- 缩进 二级缩进 三级缩进
相关文章推荐
- 大数据、数据挖掘、数据分析学习记录
- 有用的数据挖掘学习链接(持续更新)
- 数据挖掘学习之数据探索
- 利用 Python 学习数据挖掘
- 数据挖掘学习笔记三
- 转载:京东数据挖掘和机器学习工程师面经
- 数据挖掘的学习资源
- 免费领取 | 10G+AI人工智能/复杂系统/数据挖掘/深度学习/Python资料
- 数据挖掘学习笔记之人工神经网络(二)
- 数据挖掘学习06 - 《数据挖掘导论》导读
- python-框架-网页爬虫-文本处理-科学计算-可视化-机器学习-数据挖掘-深度学习
- 数据挖掘学习笔记-入门基础篇
- DataMining学习3_数据挖掘技术(三)——关联分析
- python数据分析与挖掘学习笔记(3)_小说文本数据挖掘part2
- 深入浅出:如何从0开始学习大数据挖掘分析?
- python数据挖掘学习】十五.Matplotlib调用imshow()函数绘制热图
- (转)如何系统地学习数据挖掘?
- 数据挖掘学习路线图
- 深入浅出:如何从0开始学习大数据挖掘分析?
- Python 数据挖掘学习 一 结巴分词