使用 NoSQL 数据库分析大规模数据
2012-06-08 06:49
471 查看
本文转自IBM的developerWorks,主题是关于使用NoSQL存储和处理大规模数据,文章列举了一些循序渐进的学习资料,包括了视频音频和文字材料,是一个很不错的了解、学习NoSQL的知识向导。
RDBMS 模型是传统 C/S 模式存储数据的重要基础,但是它无法实现以简单且低廉的方式进行扩展。而目前,更多的应用需求是像 Facebook 和 Twitter 一样需要拥有很强的可扩展性,所以,无模式的存储模型 – NoSQL 应运而生,提供了相应的解决方案。本学习路线图向 Java 开发人员介绍了 NoSQL 技术,以及 Apache Hadoop MapReduce 技术在处理大规模数据方面的优势。
1. NoSQL 入门 NoSQL 数据库被更多的人所关注是因为它在解决大规模数据的可扩展性上有它独到的解决方案。无模式的数据存储模型与传统的关系型数据库有着本质上的区别,但是它们并不像想象中那么难以使用。
阅读: Java 开发 2.0: NoSQL
2. 流行 NoSQL 数据库实用指南 现在,您已经对 NoSQL 有了一些基本的认识,是时候去认识一些目前流行的数据库了。学习针对 MongoDB、CouchDB、Amazon 的 SimpleDB 和 Google AppEngine 数据存储服务推出的实用指南。
阅读: MongoDB:拥有 RDBMS 特性的 NoSQL 数据存储
收听: Eliot Horowitz on MongoDB(英文)
观看: MongoDB video demo(英文)
阅读: 使用 Amazon SimpleDB 进行云存储
观看: Video demo: An introduction to Amazon SimpleDB
阅读: 通过 CouchDB 和 Groovy 的 RESTClient 实现 REST
收听: Aaron Miller and Nitin Borwankar on CouchDB and the CouchOne mobile platform(英文)
阅读: 使用 Bigtable、Blobstore 和 Google Storage 实现 GAE 存储
3. 使用 MapReduce 分析分布式数据 大规模数据解决方案中的一项重要技术就是 MapReduce,它是一个由 Google 提出的用于处理大规模、分布式数据集的编程模型以及实现。在这里了解 Apache Hadoop,一个 MapReduce 的开源实现,它在 IBM 的大规模数据解决方案中起到了重要的作用。
阅读: 用 Hadoop MapReduce 进行大规模数据分析
阅读: 用 MapReduce 解决与云计算相关的 Big Data 问题
阅读: 使用 Apache Hadoop 挖掘现有数据
下载: IBM MapReduce Tools for Eclipse(英文)
阅读: A conversation with Rod Smith, IBM’s Mr. Big Data(英文)
RDBMS 模型是传统 C/S 模式存储数据的重要基础,但是它无法实现以简单且低廉的方式进行扩展。而目前,更多的应用需求是像 Facebook 和 Twitter 一样需要拥有很强的可扩展性,所以,无模式的存储模型 – NoSQL 应运而生,提供了相应的解决方案。本学习路线图向 Java 开发人员介绍了 NoSQL 技术,以及 Apache Hadoop MapReduce 技术在处理大规模数据方面的优势。
1. NoSQL 入门 NoSQL 数据库被更多的人所关注是因为它在解决大规模数据的可扩展性上有它独到的解决方案。无模式的数据存储模型与传统的关系型数据库有着本质上的区别,但是它们并不像想象中那么难以使用。
阅读: Java 开发 2.0: NoSQL
2. 流行 NoSQL 数据库实用指南 现在,您已经对 NoSQL 有了一些基本的认识,是时候去认识一些目前流行的数据库了。学习针对 MongoDB、CouchDB、Amazon 的 SimpleDB 和 Google AppEngine 数据存储服务推出的实用指南。
阅读: MongoDB:拥有 RDBMS 特性的 NoSQL 数据存储
收听: Eliot Horowitz on MongoDB(英文)
观看: MongoDB video demo(英文)
阅读: 使用 Amazon SimpleDB 进行云存储
观看: Video demo: An introduction to Amazon SimpleDB
阅读: 通过 CouchDB 和 Groovy 的 RESTClient 实现 REST
收听: Aaron Miller and Nitin Borwankar on CouchDB and the CouchOne mobile platform(英文)
阅读: 使用 Bigtable、Blobstore 和 Google Storage 实现 GAE 存储
3. 使用 MapReduce 分析分布式数据 大规模数据解决方案中的一项重要技术就是 MapReduce,它是一个由 Google 提出的用于处理大规模、分布式数据集的编程模型以及实现。在这里了解 Apache Hadoop,一个 MapReduce 的开源实现,它在 IBM 的大规模数据解决方案中起到了重要的作用。
阅读: 用 Hadoop MapReduce 进行大规模数据分析
阅读: 用 MapReduce 解决与云计算相关的 Big Data 问题
阅读: 使用 Apache Hadoop 挖掘现有数据
下载: IBM MapReduce Tools for Eclipse(英文)
阅读: A conversation with Rod Smith, IBM’s Mr. Big Data(英文)
相关文章推荐
- 使用 NoSQL 数据库分析大规模数据
- NoSQL学习路线图 - 使用 NoSQL 数据库分析大规模数据[转]
- 使用NoSql数据库分析大规模数据【转】
- [转载] 使用 NoSQL 数据库分析大规模数据
- hadoop(为什么不能使用数据库来对大量磁盘上的大规模数据进行分析呢,为什么要用MapReduce)
- 使用 NoSQL 数据库提供云级别数据可伸缩性
- 2.非关系型数据库(Nosql)之mongodb:mongodb显示所有数据库,使用数据库,集合创建(显示和隐式创建),集合查询,初步数据的增删改查,分页
- ORCLE数据库 使用数据泵方式导入导出数据的误区分析
- noSQL数据库相关软件介绍(大数据存储时候,必须使用)
- 使用 NoSQL 数据库提供云级别数据可伸缩性
- noSQL数据库相关软件介绍(大数据存储时候,必须使用)
- 2.非关系型数据库(Nosql)之mongodb:mongodb显示所有数据库,使用数据库,集合创建(显示和隐式创建),集合查询,初步数据的增删改查,分页
- 从运维的角度分析使用阿里云数据库RDS的必要性--你不应该在阿里云上使用自建的MySQL/SQL Server/Oracle/PostgreSQL数据库
- 小白学数据分析----->数据指标 累计用户数的使用
- 使用postgreSQL DataSync 进行pg数据库升级 数据同步 升级脚本生成, postgreSQL DataSync简单教程
- 使用postgreSQL DataSync 进行pg数据库升级 数据同步 升级脚本生成, postgreSQL DataSync简单教程
- 使用SQL语句清空数据库所有表的数据
- 使用pentaho工具将数据库数据导入导出为Excel
- Java 数据库之 redredis 使用----数据结构
- 使用hadoop mapreduce分析mongodb数据:(1)