数据库 | 阿里云HybridDB for PostgreSQL
云数据库HybridDB for PostgreSQL(ApsaraDB HybridDB for PostgreSQL)是一种在线MPP大规模并行处理数据仓库服务。云数据库HybridDB for PostgreSQL基于Greenplum Database开源数据库项目,并由阿里云深度扩展,支持OSS外部表、JSON数据类型、HyperLogLog预估分析等功能特性。通过符合SQL2008标准查询语法及OLAP分析聚合函数,提供灵活的混合分析能力。支持行存储和列存储混合模式,提高分析性能,同时支持数据压缩技术,降低存储成本。并提供在线扩容、性能监测等服务,用户无需进行复杂的大规模MPP集群运维管理,让DBA、开发人员及数据分析师专注于如何通过SQL提高企业的生产力,创造核心价值。
课程链接:阿里云数据库HybridDB for PostgreSQL使用教程
HybridDB for PostgreSQL 基于 Greenplum Database 开源数据库项目开发,由阿里云深度扩展后,具备如下特性:
-
兼容 Greenplum,用户可以直接使用所有支持 Greenplum 的工具。
-
独有的MetaScan和SortKey技术,大幅提升了性能。
-
支持 OSS 存储、JSON 数据类型、HyperLogLog 预估分析等功能特性。
-
通过符合 SQL 2008 标准查询语法及 OLAP 分析聚合函数,提供灵活的混合分析能力。
-
支持行存储和列存储混合模式,分析性能优越。
-
支持数据压缩技术,存储成本低廉。
-
提供在线扩容、性能监测等服务,用户无需再进行复杂的大规模 MPP 集群的运维管理工作,使 DBA、开发人员及数据分析师只需专注于如何通过 SQL 提高企业的生产力、创造核心价值。
基本功能:
- 具有 Geenplum Database 的核心功能,详情参见文档说明。
- 支持独有的MetaScan和SortKey技术。
- 支持 ORCA 优化器。
- 支持通过过程语言 PL/pgSQL 和 PL/Java 进行分布式存储过程编写。
- 支持 PostGIS、MADlib、fuzzystrmatch、orafunc、pgcrypto、intarray 等插件(需使用 CREATE EXTENSION 命令创建)。
- 支持使用 OSS_EXT 插件,从阿里云对象存储 OSS(Object Storage Service)读取数据或写入数据到 OSS,并支持gzip压缩,以大幅节省外部表存储成本。
- 支持 JSON 数据类型和 HyperLogLog 类型(需使用 CREATE EXTENSION 命令创建)。
功能限制:
- 核心功能上的限制参见文档说明。
- 权限限制:HybridDB for PostgreSQL 的初始用户(称为“根用户”)有创建数据库(CREATEDB)、创建用户(CREATEROLE)的权限,但没有超级用户(SUPERUSER)权限,因此无法执行要求超级用户权限的操作。例如,执行 pg_ls_dir 等文件函数。但根用户有权限查看和修改所有其他非超级用户的数据,终止(Kill)其他非超级用户的连接等。
- 不支持 PL/R 和 PL/Java 插件。
- 支持 PL/Python 插件创建,但不支持使用 PL/Python 语言创建函数。
- 不支持 gpfdist 工具。
- 不支持 MapReduce 接口、gphdfs 存储接口以及本地外部表。
- 暂不支持自动备份和恢复功能。HybridDB 会保存两份数据,用户也可以使用 pg_dump 工具自行备份。
产品优势:
简单易用
-
兼容NoSQL,用户可直接用SQL操作JSON和XML类型的数据。
-
通过 PostGIS 插件,支持空间数据类型和相关的空间函数,实现精确的地理定位。
-
支持多种插件,用户可以轻松地通过插件满足各种应用场景的需求。
-
支持OSS云存储扩展,可实现存储空间无限扩展。
-
与阿里云的其他主流产品无缝集成,用户可轻松实现复杂的业务应用。
性能卓越
-
支持行列混合存储。在OLAP分析时,列存储的性能和行存储的性能相比,最多可提高100倍的性能。
-
支持高性能OSS并行数据导入,避免单通道导入的性能瓶颈。
-
采用基于成本的SQL查询优化器,多表关联查询性能比MySQL高数倍。
-
用户可按需进行计算单元、CPU、内存、存储空间的等比扩展,从而提高OLAP性能。
安全稳定
-
支持分布式ACID数据一致性,实现跨节点事务一致,所有数据通过双节点同步冗余,SLA保障99.9%可用性。
-
采用主备架构,实现用户无感的故障转移和容灾备份。
-
分布式部署,计算单元、服务器、机柜三重防护,提高重要数据基础设施保障。
-
支持SQL审计,身份隔离深入到字段级别;支持IP白名单防DDoS攻击。
产品优势:
- OLTP+OLAP综合解决方案
用户现有基于Greenplum Database的数据仓库可以通过多种方案导入到云数据库HybridDB for PostgreSQL,实现云端数据仓库的OLAP在线分析,用户无需进行复杂的大规模MPP集群运维管理。同时阿里云为用户提供完整的扩容及可用性保障,让DBA、开发人员及数据分析师专注于如何通过SQL提高企业的生产力,创造核心价值。通过阿里云ApsaraDB for RDS,用户可以实现高性能的OLTP应用,RDS支持MySQL、SQL Server、PostgreSQL,同时PPAS还提供了Oracle语法及PL/SQL的高度兼容特性。结合云数据库HybridDB for PostgreSQL,用户即可实现云平台下OLTP到OLAP数据库整合解决方案,为用户构建从高并发生产事务到决策分析的云数据库架构平台。
- Quick BI数据报表整合
通过阿里云数加平台的 Quick BI 报表功能,可以结合 云数据库HybridDB for PostgreSQL 直接在云上实现丰富的可视化数据展现,与此同时在 Quick BI 中所生产的报表还可以平滑嵌入到用户自有系统当中,与用户的应用软件合为一体。基于Greenplum Database开源项目的 云数据库HybridDB for PostgreSQL 具有强劲的OLAP分析能力及高性能数据库列存功能,为多维分析提供高性能保障。系统可以从百GB到百TB进行性能平滑扩展,并支持复杂SQL查询,结合阿里云深度扩展的OSS存储、JSON数据、HyperLogLog等功能特性及Quick BI,协助用户实现从数据存储、分析到展现的一体化BI云平台。
- GIS地理数据分析方案
云数据库HybridDB for PostgreSQL已经内置支持符合OpenGIS标准的空间数据库引擎PostGIS,可以实现实时的定位及路径规划。同时PostGIS也是被业界广泛支持的空间数据库引擎,支持厂商包括:ArcGIS、Intergraph、QGIS等。用户只需在应用程序中使用简单的SQL,配合GIS函数操作,即可处理复杂的空间地理数据模型(支持2D及3D处理)。得益于云数据库HybridDB for PostgreSQL的OLAP数据综合分析能力,用户更可以实现基于地理信息的海量数据分析工作,为物联网、移动互联网、物流配送、智慧出行(智慧城市)、LBS位置服务、O2O业务系统等提供强大的决策分析支持。
阿里云开发者社区全面升级,一站式体验,用得更爽:(阿里云开发者社区首页)
- 云端流计算、在线业务、实时分析 闭环设计 - 阿里云RDS、HybridDB for PostgreSQL最佳实践
- 分布式DB锁问题排查方法 - 阿里云HybridDB for PostgreSQL最佳实践
- Greenplum 空间(GIS)数据检索 B-Tree & GiST 索引实践 - 阿里云HybridDB for PostgreSQL最佳实践
- Greenplum 空间(GIS)数据检索 B-Tree & GiST 索引实践 - 阿里云HybridDB for PostgreSQL最佳实践
- 分布式DB锁问题排查方法 - 阿里云HybridDB for PostgreSQL最佳实践
- 如何更好处理数据仓库服务必然需要云数据库HybridDBforPostgreSQL
- PostgreSQL\HybridDB for PG 毫秒级多维数据透视 案例分享
- HybridDB · 最佳实践 · 阿里云数据库PetaData
- 如何检测、清理Greenplum垃圾 - 阿里云HybridDB for PG最佳实践
- HybridDB for PostgreSQL排序键使用
- 如何更好处理数据仓库服务必然需要云数据库HybridDBforPostgreSQL
- 如何检测、清理Greenplum膨胀、垃圾(含修改分布键) - 阿里云HybridDB for PG最佳实践
- 在MySQL和PostgreSQL之外,为什么阿里要研发HybridDB数据库?
- 将GitLab的数据库导入阿里云PostgreSQL RDS
- 同步和比较数据库工具dbForge Schema Compare for SQL Server
- 遍历数据库的未公开存储过程sp_MSforeachdb应用之Attach数据库
- 阿里云安装PostgreSQL无法创建数据库实例
- 阿里云自研云数据库POLARDB_未来企业的数字化答案
- Repair for Sybase SQL Anywhere (SQL Anywhere DB数据库修复工具)1.0
- 菜鸟末端轨迹(解密支撑每天251亿个包裹的数据库) - 阿里云RDS PostgreSQL最佳实践