看云栖说云栖——大数据企业服务
年兽带领动物们攻入幸福能量管理公司! ——《年兽大作战》 本文内容取自2019杭州云栖大会《大数据企业服务专场》。 分会场开场演讲的题目叫做《阿里云大数据企业服务架构》,阿里云专家研究了国内外企业大数据的需求现状得出了以下结论: 单一引擎或单一存储很难满足客户需要:数据/存储千差万别,计算引擎各种各样,开发生态各不相同,需求百花齐放。 纯线下建数据中心不符合潮流趋势:成本、异地多活、容灾、弹性扩缩容、可触达性、实时、生态。 一次性上云实施很难接受:业务中断,切换风险,总体成本,信息安全。 需要的变化:从单引擎到多引擎、单一数据源到多数据源、统一的数据管理和开发、生态。 当前最佳方式:跨引擎统一编程平台+跨数据源综合治理。 下一步就引出本次分论坛的主题了:一站式跨引擎大数据智能研发平台。 现阶段,企业用户需要的不是同统一的大数据计算引擎,而是统一的大数据智能研发平台,阿里云管这个平台叫做DataWorks。 DataWorks的官网介绍如下: DataWorks(数据工场,原大数据开发套件)是阿里云重要的PaaS平台产品,为您提供数据集成、数据开发、数据地图、数据质量和数据服务等全方位的产品服务,一站式开发管理的界面,帮助企业专注于数据价值的挖掘和探索。 DataWorks支持多种计算和存储引擎服务,包括离线计算MaxCompute、开源大数据引擎E-MapReduce、实时计算(基于Flink)、机器学习PAI、图计算服务Graph Compute和交互式分析服务等,并且支持用户自定义接入计算和存储服务。DataWorks为您提供全链路智能大数据及AI开发和治理服务。 从下图可以看到DataWorks在阿里云大数据和AI平台中的位置: (图片来自云栖社区) DataWorks起到的作用包括: 最底层的统一元数据管理。 中间层的统一调度、统一编排 […]