Python语言在数据挖掘上非常有优势,但它唯一的缺点你知道吗?
2017-07-21 11:19
381 查看
Python语言的优势
基于以下三个原因,选择Python作为实现数据挖掘算法的编程语言:
(1) Python的语法清晰;
(2) 易于操作纯文本文件;
(3) 使用广泛,存在大量的开发文档。
Python具有清晰的语法结构,也被称作可执行伪代码(executable pseudo-code)。
默认安装的Python开发环境已经附带了很多高级数据类型,如列表、元组、字典、集合、队列等,无需进一步编程就可以使用这些数据类型的操作。
使用这些数据类型使得实现抽象的数学概念非常简单。此外,还可以使用自己熟悉的编程风格,如面向对象编程、面向过程编程、或者函数式编程。
Python语言处理和操作文本文件非常简单,非常易于处理非数值型数据。
Python语言提供了丰富的正则表达式函数以及很多访问Web页面的函数库,使得从HTML中提取数据变得非常简单直观。
Python语言挖掘的特色
诸如MATLAB和Mathematica等高级程序语言也允许用户执行矩阵操作,MATLAB甚至还有许多内嵌的特征可以轻松地构造数据挖掘应用,而且MATLAB的运算速度也很快。
然而MATLAB的不足之处是软件费用太高,单个软件授权就要花费数千美元。
虽然也有适合MATLAB的第三方插件,但是没有一个有影响力的大型开源项目。
Java和C等强类型程序设计语言也有矩阵数学库,然而对于这些程序设计语言来说,最大的问题是即使完成简单的操作也要编写大量的代码。
程序员首先需要定义变量的类型,对于Java来说,每次封装属性时还需要实现getter和setter方法。另外还要记着实现子类,为了完成一个简单的工作,必须花费大量时间编写了很多无用冗长的代码。
Python语言则与Java和C完全不同,它清晰简练,而且易于理解,即使不是编程人员也能够理解程序的含义,而Java和C对于非编程人员则像天书一样难于理解。
Python语言是高级编程语言,可以花费更多的时间处理数据的内在含义,而无须花费太多精力解决计算机如何得到数据结果。Python语言使得很容易表达自己的目的。
Python语言的缺点
Python语言唯一的不足是性能问题。Python程序运行的效率不如Java或者C代码高,但是可以使用Python调用C编译的代码。这样,就可以同时利用C和Python的优点,逐步地开发数据挖掘应用程序。
可以首先使用Python编写实验程序,如果进一步想要在产品中实现数据挖掘,转换成C代码也不困难。
基于以下三个原因,选择Python作为实现数据挖掘算法的编程语言:
(1) Python的语法清晰;
(2) 易于操作纯文本文件;
(3) 使用广泛,存在大量的开发文档。
Python具有清晰的语法结构,也被称作可执行伪代码(executable pseudo-code)。
默认安装的Python开发环境已经附带了很多高级数据类型,如列表、元组、字典、集合、队列等,无需进一步编程就可以使用这些数据类型的操作。
使用这些数据类型使得实现抽象的数学概念非常简单。此外,还可以使用自己熟悉的编程风格,如面向对象编程、面向过程编程、或者函数式编程。
Python语言处理和操作文本文件非常简单,非常易于处理非数值型数据。
Python语言提供了丰富的正则表达式函数以及很多访问Web页面的函数库,使得从HTML中提取数据变得非常简单直观。
Python语言挖掘的特色
诸如MATLAB和Mathematica等高级程序语言也允许用户执行矩阵操作,MATLAB甚至还有许多内嵌的特征可以轻松地构造数据挖掘应用,而且MATLAB的运算速度也很快。
然而MATLAB的不足之处是软件费用太高,单个软件授权就要花费数千美元。
虽然也有适合MATLAB的第三方插件,但是没有一个有影响力的大型开源项目。
Java和C等强类型程序设计语言也有矩阵数学库,然而对于这些程序设计语言来说,最大的问题是即使完成简单的操作也要编写大量的代码。
程序员首先需要定义变量的类型,对于Java来说,每次封装属性时还需要实现getter和setter方法。另外还要记着实现子类,为了完成一个简单的工作,必须花费大量时间编写了很多无用冗长的代码。
Python语言则与Java和C完全不同,它清晰简练,而且易于理解,即使不是编程人员也能够理解程序的含义,而Java和C对于非编程人员则像天书一样难于理解。
Python语言是高级编程语言,可以花费更多的时间处理数据的内在含义,而无须花费太多精力解决计算机如何得到数据结果。Python语言使得很容易表达自己的目的。
Python语言的缺点
Python语言唯一的不足是性能问题。Python程序运行的效率不如Java或者C代码高,但是可以使用Python调用C编译的代码。这样,就可以同时利用C和Python的优点,逐步地开发数据挖掘应用程序。
可以首先使用Python编写实验程序,如果进一步想要在产品中实现数据挖掘,转换成C代码也不困难。
相关文章推荐
- Python语言在数据挖掘上非常有优势,但它唯一的缺点你知道吗?
- Python 是一门适合做数据挖掘的语言吗
- 【脚本语言系列】关于Python操作数据二进制数据,你需要知道的事情
- 【脚本语言系列】关于Python操作数据文本字符串,你需要知道的事
- 【脚本语言系列】关于 Python 数据可视化,你需要知道的事
- 【脚本语言系列】关于 Python 数据分析,你需要知道的事
- 非常全面到位的介绍与源代码地址 :Python 网页爬虫 & 文本处理 & 科学计算 & 机器学习 & 数据挖掘兵器谱
- 【脚本语言系列】关于Python网络通讯socket,你需要知道的事
- 经典的机器学习方面源代码库(非常全,数据挖掘,计算机视觉,模式识别,信息检索相关领域都适用的了)
- 【脚本语言系列】关于Python异常处理,你需要知道的事
- # 机器学习数据挖掘关联规则挖掘Apriori算法python代码实现
- 【脚本语言系列】关于Python数据库访问专用模块,你需要知道的事
- Python超过R,成为数据科学和机器学习的最常用语言
- 【脚本语言系列】关于Python持久化shelve,你需要知道的事
- python数据分析与挖掘实战-第六章拓展偷漏税用户识别
- 数据挖掘之推荐分析--python实现
- 深入分析python数据挖掘 Json结构分析
- python语言优点&缺点
- R语言数据挖掘相关包总结-转帖
- [resource-]Python 网页爬虫 & 文本处理 & 科学计算 & 机器学习 & 数据挖掘兵器谱