墨菲:你是一个奴隶,尼奥,和所有人一样,你生来即为奴,你生在一座自己感知不到的监狱,囚禁意识的监狱。
矩阵是什么是说不清的,你必须亲眼得见,这是你最后的机会,一旦作出选择,再无回头之路。
选择蓝色药丸,到此为止,你就当是睡了一觉,醒来继续过自己的日子。
选择红色药丸,继续漫游仙境,我带你见识一下这兔子洞有多深。
其实上次有关存储的话题并没有聊完,这次云栖大会和存储资源相关的论坛有两个:一个是上次的《下一代存储技术与最佳实践专场》,还有一个就是这次要聊的《数据上云与数据智能专场》,这个专场的主持人是阿里云MVP狒哥张广彬,存储行业的老前辈。
首先,阿里云巴巴研究员,阿里云智能存储产品资深总监作了《数据上云与数据智能》的演讲。
首先是一段引自IDC的报告,是有关数据存储位置的预测:
- 2020年公共云存储量将超过个人设备的总存储量,我的理解就是个人的数据都跑到公共云上去了。
- 2022年公共云存储量超过企业数据中心总存储量,我的理解是企业的数据也会都跑到公共云上去。
- 2025年公共云存储占有50%总存储量,世界上一半的数据都要存储在公共云。
为什么人们都会把数据存储在公共云,我认为是因为下面这几点:
- 存储在公共云更简单,存储的管理是一件很麻烦的事情。
- 存储在公共云更安全、更可靠,云上的多地域、多可用区、多副本架构更能保证数据的安全。
- 存储在公共云成本更低,可以按需使用,避免闲置浪费,同时围绕着存储系统管理运维的成本都将被云上所有的租户所分摊。
- 存储在公共云更有利于作数据分析,在云上可以调度更多的资源和使用更先进的技术对数据进行更高效的分析,可以加速从数据到业务价值的转换过程。
现在阿里云上有包括ESSD、SSD、高效云盘、普通云盘四种弹性块存储介质,为了让客户的使用和购买更加简单,阿里云推出了全球首个存储容量单位包。存储容量包SCU可以理解为存储世界中以PL1 级 ESSD为标准的货币体系:
- 1 TB SCU = 2.857 TB 高效云盘
- 1 TB SCU = 1 TB PL1级 ESSD云盘 (单盘IOPS性能上限5万)
- 1 TB SCU = 0.5 TB PL2级ESSD云盘 (单盘IOPS性能上限10万)
- 1 TB SCU = 0.25 TB PL3级 ESSD云盘 (单盘IOPS性能上限100万)
- 1 TB SCU = 1 TB SSD云盘
- 1 TB SCU = 3.333 TB普通云盘
SCU主要的使用场景就是用于抵扣按量使用的存储空间的费用,按照演讲者的说法使用SCU抵扣块存储费用相较于按量付费最高可节省67%的费用。未来OSS对象存储也将纳入到存储容量包的体系里。到时候不知道1 TB 的SCU能够兑换多少TB的OSS存储呢?
在这一个单元的客户案例环节,请到了新浪微博来介绍《极致弹性应对微博热点事件最佳实践》,在微博的应用场景下,热点事件所引发的系统流量可以达到正常流量的500%,第一波传播风暴留给系统平台的准备时间只有3分钟。
利用阿里云的ESSD和自动化的热点应用决策系统,微博目前可以做到的是5分钟扩容3000台服务器,并且保证扩容成功率在99%以上。
接下来,阿里云的智能存储专家做了《智能存储的视频图片处理与应用》的演讲,只要将媒体文件存储到OSS,基于阿里云的媒体处理智能引擎,可以从视频文件中挖掘出以下信息:
- 识人、包括对人的表情、年龄、眼睛、种族的识别;对同一个人物的识别聚类,可用于智能相册;监控场景下对人体的检测;人体运动状态的检测,包括行为、体态的检测。
- 断物、物体、场景、行为的检测,支持1600个标签、6级分类、95%的准确率。
- 内容理解与增强、可用于对色情、暴恐、血腥画面的识别审核;视频的自动拆条与AI编辑;视频的理解功能呢,包括明星识别、语音识别、内容理解、视频标签;视频加索引,支持基于人物进行索引、字幕识别索引、归档存储索引、音视频压缩归档等功能。
在这一单元的客户分享环节,请到了一家在线教育机构,基于阿里云智能视频理解能力对老师的授课过程进行自动化监控,对授课视频基于体态、情绪、内容、语音、语速、时长等进行数字化。
针对大班课程的学生互动、道具使用、讲师的关键语句、鼓励赞扬等进行识别和纪录。
针对小班课程对老师是否有语速过快、是否无精打采、是否有异常行为、是否情绪激动、对学生是否有打断、指责等行为进行监控记录。
接下来,阿里云专家和客户代表分别围绕数据湖、日志平台服务做了技术和案例的分享,数据湖是直接使用OSS进行大数据分析的技术,在案例分享环节,客户使用数据湖每天都要存储处理300亿条100列以上的大宽表数据,而阿里云日志平台在每年的双11中都要承受平常的122倍的压力。
再接下来的两个环节分别是《企业灾备上云之旅》和《混合云存储和生态产品新发布》,阿里云产品专家介绍了阿里云的云上容灾备份产品和解决方案:
- 混合云备份HBR、混合云备份支持对任何可联网服务器的文件备份,并支持对SQL Server 数据库和VMWare vSphere虚拟机的备份,混合云不仅支持线下服务器的备份还支持对云上服务器的备份,在云上还是SAP HANA的认证备份解决方案。混合云备份支持最大1:30的重复数据删除,可以降低数据备份的存储成本。混合云备份最新发布的版本还支持将线下VMWare vSphere 虚拟机的备份直接在云端恢复到ECS上,这算不算是一种新的整机迁移上云的解决方案呢?要把线下机房的vSphere虚拟机整体迁移到云上,只需要部署HBR混合云备份,把虚拟机整机备份上云,在云端恢复即可完成迁移。
- 混合云容灾、相对于混合云备份的以“天”为单位的备份频率,有的业务希望实现不丢失数据的连续数据保护,并希望在出现故障后能够以最快的速度在云端将业务拉起,这时候就需要另一个容灾备份服务阿里云HDR混合云容灾服务。HDR支持对物理服务器以及Hyper-V,vSphere虚拟机的整体备份和云上恢复,并可以做到秒级的数据丢失量和分钟级的恢复速度(分别对应RPO和RTO),原来这个高大上的产品需要部署一台硬件设备到线下数据中心,最新发布的HDR版本支持纯软件形式的部署,硬件设备变成了可选项。
有了这两个产品,再加上阿里云遍布全国的优质数据中心资源,只要客户能够接受公共云,还有什么理由自建灾备中心呢?
作为一个传统客户的代表,阿里云请到了中化国际信息技术部总经理来做了《企业灾备上云之旅》的经验分享。中化国际是一家成立于1950的大型央企,2019年的世界500强排名88名,灾备中心是中国国际信息化整体架构中非常重要的一部分,但考虑到灾备中心的投入大利用率低,中化国际在考察了多个备选方案后决定采用阿里云建设异地灾备中心。
中化国际使用混合云容灾HDR服务,在上海生产中心部署了一台容灾一体机,将运行在VMWare vSphere环境下的SAP、CRM等关键系统通过500M的线路备份到远在600公里以外的阿里云青岛数据中心,目前实现的效果是可以做到30秒的RPO,10分钟的RTO。
最后的时间是留给生态合作伙伴的,包括IBM、Dell EMC、NetApp、Commvault的高管和技术专家进行了分享。
IBM 分享的题目叫做《IBM Spectrum存储祝您遨游混合云》,分享人是IBM大中华区存储部总经理,总经理先生上来就说中化集团原来是他的客户,而IBM的历史比中化集团的历史更加悠久。这里的Spectrum 存储说的其实是Spectrum Scale,就是原来的IBM GPFS,这个文件系统的历史有20年了,目前还应用在很多的高性能计算和集群数据处理领域,笔者就曾经接触过一套包含上千台服务器的集群用的就是GPFS。Spectruem Scale支持阿里云是不是就意味着GPFS的用户就更容易迁移到阿里云了呢?
我到IBM的官网看了Spectruem Scale的介绍,按照官网的说法Spectruem Scale是针对云计算、大数据、分析、对象等的高级非结构化数据存储管理解决方案。遗憾的是目前我在官网云有关对象存储器支持的信息中还没有找到对阿里云提供支持的字样,可能是因为官网还没有及时更新吧。
Dell EMC分享的题目叫做《阿里云上的Dell EMC》,就像题目一样,Dell EMC就是这么的直接,上来就开始怼,说既然大家这么喜欢卖老,那么Dell EMC的历史如何如何,EMC重复数据消除的技术能够做到多高的消重比之类的。Dell EMC 的演讲人是中国研发集团上海研发中心总经理,所以讲的东西除了可以正式使用的产品外还包括一些正在和阿里云联合开发的产品。
第一个发布是有关数据备份的,在DELL EMC的数据保护产品家族中有一个组件叫做Cloud Tier,就是将备份数据归档到云中,之前是不支持阿里云的,目前正式支持阿里云,我在Dell EMC 官网找到了有关Cloud Tier支持阿里云的介绍:
(以上内容来自于Dell EMC官网)
其中的云层就是Cloud Tier,DD是Data Domain的缩写,这个产品的创始人就是一个华人,后来这个产品被EMC所收购,随着EMC 和Dell的合并又并入了Dell旗下,目前这个产品最新的名称叫做PowerProtect DD。
第二个发布是有关非结构化数据的云上存储的,DELL EMC的海量数据存储产品主力是名为ISILON的横向扩张NAS 系统,单个ISILON存储集群最大可以扩展到252 节点,可提供几十PB的存储空间。ISILON 中有一项名为CloudPools的软件,支持将数据从本地存储集群迁移到云中,目前也宣布支持阿里云。以下是我从Dell EMC 官网下载的规格文件中找到的有关对阿里云支持的介绍:
(以上内容来自于Dell EMC官网下载文档)
第三个是一个研发中的项目叫做鹦鹉螺,是一个与阿里收购的FLink有关的流式处理存储系统,说是因为这个项目与阿里云的人进行了很多的合作。
接下来NetApp和Commvault的专家也进行了分享,其中NetApp的云战略是最激进的,在NetApp的官网就有一个专门有关云的入口,NetApp的演讲嘉宾也提到了在一些项目中和阿里云有过很多的合作。Commvault强调的是对企业数据资源的统一管理,无论这些数据是存储在本地还是在云中,都能够被很好的跟踪和管理,并能够进行充分的利用。
最后,是圆桌论坛环节,这个论坛汇集了狒哥、阿里云、IBM、Dell EMC、NetApp、Commvault 的高管和专家,鉴于前面火药味十足的互怼,本来我是感觉这些老艺术家们要上演一场精彩的群口相声的,结果过程略显尴尬,大家都以广告宣传为主,我只记住了阿里巴巴研究员的两句话:
- 客户第一
- 因为信任,所以简单。
这不是新六脉神剑的内容吗?
存储要的是稳定可靠,需要长期的技术积累,人民老艺术家们只要能够与时俱进在就必然可以继续发光发热。
唯一不变的就是变化。