使用IntelliJ IDEA 编译开源的机器学习源码--Oryx
2014-03-20 19:24
525 查看
[b]What is Oryx?[/b]
大名鼎鼎的Sean Owen (http://www.linkedin.com/in/srowen) 正在 Cloudera 作为 Director of Data Science 专注投身于名为Oryx的开源机器学习项目当中。(Oryx意思是剑羚,属于非洲羚羊的一类分支)。如果您读过《Mahout in Action》这本书,您应该有印象:此书的作者之一就是Sean Owen。Oryx的开发意图在于帮助Hadoop用户构建机器学习模式并将其加以部署,这样我们就能够以实时方式查询并获取其结果——例如将其作为垃圾邮件过滤器或者推荐引擎的组成部分。
作为Hadoop当中实现机器学习模式创建的传统途径,Apache Mahout "已经走到了发展道路的尽头。"Owen如是说。
The Oryx open source project provides simple, real-time large-scale machine learning / predictive analytics infrastructure.
[b]Architecture [/b]
Oryx does two things at heart: builds models, and serves models. These are the responsibilities of two separate components, the Computation Layer and Serving Layer, respectively.[b]在 IntelliJ IDEA 中编译 Oryx[/b]
虽然我是忠实的 Visual Studio 的拥趸(老牌的Windows Phone Developer),但是在工作中不可避免也会遇到 Java 开发的工作,比如目前专注的基于机器学习算法的推荐引擎。对我而言,Eclipse 是生命中不能承受之轻(至少目前为止是如此),之前基于 Apache Mahout 所做的推荐算法是在 Eclipse 中编码和生成Jar包,遇到的问题无数。比如在 Eclipse 中导入 不管是 Mahout 还是 Oryx 的源码都出现我无法解决的编译错误。众所周知 Mahout 和 Oryx 都是基于 Maven 编译的,而在我的 Eclipse 开发环境中出现的 Maven 编译错误,花费了很多时间查找资料,但是最终还是无从解决。在得知机器学习领域的大神Sean Owen 使用 IntelliJ IDEA 开发 Oryx ,毅然决然地安装 IntelliJ IDEA Community Edition ( http://www.jetbrains.com/idea/download/ )。
在 Cloudera 的开发者社区 Data Science and Machine Learning 论坛您可发现 Owen 的足迹,耐心地为开发者解答 Apache Mahout 和 Oryx 的疑问。
在 Windows 8.1 中启动 IntelliJ IDEA,打开从 GitHub 下载的 Oryx 开源代码 (https://github.com/cloudera/oryx ) 。
在 Oryx Project 上点击鼠标右键,选择 "Maven" – "Reimport",IntelliJ IDEA 重新导入项目所依赖的 Maven Libraries。
至此,Oryx 的源码即可编译成功,研究之,学习之。
相关文章推荐
- 使用 IntelliJ IDEA 导入 Spark 最新源码及编译 Spark 源代码
- 使用 IntelliJ IDEA 导入 Spark 最新源码及编译 Spark 源代码(博主强烈推荐)
- 使用到的一些开源项目 一般根据名字都能搜出源码
- c#使用实例之命令行编译cs源码demo.cs
- Android系统源码编译之3---下载 ---- git 和 repo 使用
- Linux 下编译Android-VLC开源播放器详解(附源码下载)
- wubi安装ubuntu后,增加swap大小,优化swap的使用参数-----------让ubuntu健步如飞,为编译android源码准备
- 编译CM13源码添加来去电归属地 SudaMod开源项目,查看commit提交记录
- linux下编译Hive 源码并导入eclipse中(使用maven)
- 编译OpenSIPS使用连接源码安装的MySQL
- <04>VIM编辑器的使用和源码编译安装
- 使用vs2008编译调试apache源码
- 二维码识别开源项目zxing的使用和源码分析
- Android Studio导入第三方依赖包并且成功编译(开源框架的使用)
- 使用IntelliJ IDEA搭建kafka源码环境时遇到Output path错误解决办法
- 使用 vim + ctags + cscope + taglist 阅读源码 - bo博的个人空间 - 开源中国社区
- java源码批量编译-javac、jar、java及其ANT使用
- Mac下使用源码编译安装TensorFlow CPU版本