随着企业业务的不断发展,将持续产生大量数据存储在相应的业务数据库中,新的数据不断生成,历史数据不断堆叠挤压,很容易导致系统运行速度降低。为了避免数据积压带来的负面影响,企业需要定期将历史数据从业务库中移出去,将数据进行统一存储和管理。
什么是数据仓库?
数据仓库,是为企业所有级别决策的制定过程提供全类型数据支持的战略集合。它是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合,可用于支持管理决策,为需要业务智能的企业提供指导业务流程改进、监视时间、成本、质量以及控制。
在将业务数据移入数据仓库的过程中,业务数据经过一系列的数据抽取、转换、清洗,最终支持上层应用,数据仓库里的数据作为分析用的数据源,可为后续的即席查询、分析系统、数据集市、报表系统、数据挖掘系统等提供支持。
想要快速构建数仓,一个高效的工具必不可少!
Tempo DF+BI
一站式大数据开发与应用解决方案
Tempo数据工厂平台(Tempo DF)是一款“流批一体”的大数据开发平台,在数据仓库建设过程中,Tempo DF支持全栈全域的数据接入、处理与输出,包括关系数据库、MPP、大数据查询引擎、消息队列、半结构化、时序数据库、NOSQL等,能有效帮助企业降低数据融合成本,实现全链路数据开发。
数据仓库的建设过程,往往比较关注数据分析层面(OLAP),而GreenPlum数据库重计算,对大数据集进行统计分析的OLAP类型。Tempo DF支持GreenPlum数据的接入、处理与输出,提高构建数仓能力,同时通过与Tempo BI的无缝融合,实现数据开发到应用的一站式服务,快速构建DF+BI一站式大数据解决方案。
GreenPlum数据库是业界最快最高性价比的关系型分布式数据库,它在开源的PostgreSQL的基础上采用MPP架构(Massive Parallel Processing,海量并行处理),具有强大的大规模数据分析任务处理能力,帮助客户创建数据仓库。
基于GreenPlum数据库的数据存储优势,Tempo DF能为用户提供更高效的数仓构建服务:
►查询速度快
支持大规模并行处理架构,高性能加载支持PB级别数据,快速进行查询处理。
►响应及时性高
通过准确、实时的数据加载,实现更快的响应,保障数据仓库实时更新。
►线性扩展强
在MPP架构中增加节点就可以线性提高系统的存储容量和处理能力。
►运行性能强
支持50PB(1PB=1024TB)级海量数据的存储和管理,并且在处理OLAP、BI和数据挖掘等任务时性能远超通用数据库系统。
用户可以灵活使用Tempo DF进行数据开发与应用,无需代码即可迅速完成各类流程构建,且支持多人同时在线协作,让智能应用开发过程更加敏捷、高效。并且提供多源异构数据访问、支持T级别计算能力,实现大规模数据加工计算需求,高效支持数据仓库等场景建设。
Tempo DF为用户提供一体化、自助式的大数据分析平台,降低企业级数据分析门槛,帮助企业充分利用数据价值,助力企业实现“让大数据尽在掌握”的数据文化建设,推动企业数字化转型落地。