您的位置:首页 > 大数据

关于大数据和NoSQL和的一些片面认知

2013-02-26 13:30 357 查看
几次都有人像我传递大数据可能在未来的1-3年内带来更多的机会,所以就顺便查询了一些这些方面的资料。以下就说说片面的看法

这个“大数据”到底有多大才能为大呢?什么样的数量级?TB还是PB?目前来说没有一个明确的说法;
大数据必然带来存储和读取的各种高要求!!!很多人都在提大数据带来的数据分析服务,但是目前来看没有多少成功案例在这个方向上闪耀!因此这个方面到底能有多远无从得知,但是我们应该相信这里绝对存在机会;但不明朗!
对于大数据的存储,目前好像推荐的方案都是NoSQL的,所以我的标题把这两个方面扯在了一起。在NoSQL上我只是初略的了解了一下Hbase和mongodb的相关方案,未做深入研究所以本文的看法是片面的!
HBase比MongoDB晦涩,当然也有可能二者没有可比性;但是如果当你要了解或者试图了解这两个系统的时候,你会发觉MongoDB似乎安装配置更简单明鸟;而HBase得安装配置要求复杂多得多;甚至说MongoDB的数据库操作看起来也简单很多
这些NoSQL对于快速读非常好,高读取性能,高并发性能;但是对于高速写入和事务处理存在一些问题,所以如果你对于NoSQL感兴趣那么前提是你必须清晰的认知到他们的不同,什么情景用什么类型的数据库;NoSQL目前缺乏企业级支持,因此在选择的时候要慎重!出了问题无人可以解决;
只要是数据库,NoSQL一样会产生各种SQL类型的数据库要求:备份,导入导出,数据恢复等等,这些要先了解清楚,不要等需要的时候才了解:有没有对应的工具和方案;
这些NoSQL方案都伴发着分布式的要求和功能;
很多人在了解NoSQL方案的时候人云亦云,压根都没有清晰的了解那些产品或者方案提供的特性到底是干吗的!这点从各种网络上流传的资料可以看出来;
MongoDB使用了类似Json的Bson存储,但是我个人觉得xpath模式的查询似乎更方便;
对于那种用数据库存文件的做法,哥是真心不理解啊!不能他们所谓的高效和高性能有多高,哥都是不理解。哥只是知道多一个流程和环节就一定多很多事情!因此那种在MongoDB上炫耀文件存储的真心让我无语,当然有些特殊清楚的处理例外!
MongoDB好像对于各个语言的支持比较好,而HBase这个东西给我感觉是要桥接!
由于今天阅读的资料有限,对于NoSQL如何像SQL那样提供传统意义上统计分析了解实在不多,而SQL上在做有些分析的时候一定是多表关联,所以这个点上我还是存疑!
各种1,2,3。。。 。。。
对了,江湖一直传说的数据仓库啊,商业智能啊,请原谅我孤陋寡闻和觉悟低啊。这些被神话的东西似乎都没有超脱出我的认知和见解,真心寻找各种扫盲机会!
补充一点:我对于NoSQL的需求很奇怪,我需要一种轻量型但是有一定程度并发性能的单机数据库,用来代替sqlite,哈哈哈,让你们见笑了!
再补充一点:之前有资料谈到了Hadoop的大数据的高性能分析,但是为啥我今天这些资料里面没有提及类似的东西呢?另外一点如果在某一个双向可以解决的场景中,SQL和NoSQL到底有多大的差别呢!!!
2013.03.03 MongoDB 在MAC 上进行单机测试的时候发觉当记录很大需要进行文件创建时,会遇到非常明显的瓶颈现象!
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: