设为首页 | 收藏本站欢迎来到卓越网络免费免备案CDN加速,DDoS和CC攻击防御,高防CDN管理平台!

已阅读

性能爆表,金山云CDN加速提升400%的秘诀何在?

作者:cdnfine      来源:cdnfine      发布时间:2019-10-14

“张工,你快来看,咱们的系统负载又超过80%了。

“哎,还不是DMA分级缓存闹的。说到底,还是咱们现在这批SATA SSD太老了,早就该换了。

“是呀,前几天还听说采购的事儿快有眉目了,也不知道最后结果如何。你看咱们这带宽压力,眼看要突破100T,小马拉大车呀。

“我听说也快了,貌似最近正在测试英特尔的一个全新方案,说是采用第二代英特尔®至强®可扩展处理器,磁盘用的是QLC的固态盘,性能不错”。

“赶紧换了吧,再这么下去,哪天系统崩了,锅还是要扣到咱们脑袋上”

“谁说不是呢,赶紧干活儿吧。

这一幕发生在几个月前的金山云。提到金山云这个名字,熟悉中国公有云市场发展的人一定不会觉得陌生。今年8月,国际权威统计分析机构IDC发布了最新一季《2019Q1中国公有云服务市场跟踪报告》。报告显示,2019年第一季度中国公有云服务整体市场规模(IaaS/PaaS/SaaS)达到24.6亿美金,同比增长67.9%,而金山云则继续保持中国公有云IaaS市场前五、互联网云厂商前三地位。

自2016年以来,金山云已连续3年保持这一行业领先地位。不仅如此,在IDC发布的《全球公有云服务市场(2018下半年)跟踪报告》中,金山云更与阿里云、腾讯云一道跻身全球十大公有云IaaS厂商,位居中国云计算产业第一阵营。此外,在赛迪顾问发布的《2018年中国云计算市场研究年度报告》中,金山云同样位列中国公有云厂商前三。

保持行业领先地位,实现快速增长,这与金山云具备洞察行业发展趋势,把握行业发展契机的能力息息相关。相关数据显示,今年金山云实现了2013年以来年均复合增长率超过200%的超高速增长,2019年Q1更以同比100%强劲增长态势,继续保持领先地位。

迅猛的业务发展对于后端数据中心的服务与支撑能力也带来了前所未有的挑战。CDN业务是金山云提供的特色业务之一,其中直播和点播更为用户所青睐。但是巨大的用户量和频繁的使用率,也对于金山云的设备服务能力提出了更高的要求。尤其是在点播环境中,每一个存储在数据中心后端的视频调取,都会对存储介质造成巨大的压力,这也才有了我们文章开头的这一幕。

想解决这个问题,最好的办法就是选择全新的技术解决方案。但是众所周知,云服务是一种时时在线的服务模式,与水、电、燃气一样不可或缺。普通家庭停水一天都会造成极大的不便,如果是企业、工厂停水一天,就会造成巨大的损失。而对于云服务来说,如果因为系统升级换代有所中断,也会对客户业务带来不可估量的损失。为金山云这样庞大的服务商提供新平台服务,其难度之高无异于“空中换引擎”。

性能爆表,金山云CDN加速提升400%的秘诀何在?

但是英特尔做到了。与其他方案“头痛医头,脚痛医脚”的单一模式不同,英特尔对于金山云的难题给予了多个维度的支持。首先在整体平台的选型上,英特尔采用的是今年4月刚刚发布的第二代英特尔®至强®可扩展处理器,它基于最新一代14nm工艺的英特尔® 至强® 可扩展处理器,提供最高56个物理核心能力,并且在硬件层面对于人工智能应用进行了加强,从铂金到铜牌的四大系统50余款产品也可以满足金山云不同阶段的需求。

在解决了基础的计算能力之后,面对金山云在磁盘I/O能力寻求突破的问题上,英特尔提供了采用QLC技术的D5-P4320固态盘作为主打产品。相对于传统SATA SSD来说,采用NVMe架构的D5-P4320固态盘在性能上有了质的飞跃,并且在容量上也与之前金山云所采用的8TB硬盘产品相吻合,实现了近乎1:1 的替换模式。更重要的是,QLC固态盘的性价比非常出色,相对于自家的傲腾系列和其他竞品来说更具优势。

于是就有了国内首家CDN应用的组合——第二代英特尔® 至强® 可扩展处理器+QLC固态盘。从8月底,金山云就开始了相关的测试,并且延续至今。“目前我们的服务能力提升了4倍,达成了一个小目标。但即便是这样的情况下,依然没有达到硬件的上限,我们预估离上限还有30%的距离”,金山云CDN首席架构师周超勇在采访中提到。从最初的满负载运行到目前4倍性能提升,QLC固态盘的表现有目共睹,金山云负责测试的相关工程师们为之雀跃。

在谈到性能表现的时候,金山云CDN首席架构师周超勇对此分外满意。“传统SATA HDD的吞吐能力大概是在40MB/s左右,金山云采用的SATA SSD混合读写能力大约为150MB/s。但是对于英特尔QLC固态盘来说,理想状态混合读写情况下,读盘能力是3GB/s,写盘能力是1GB/s”。这简直是一个难以置信的数字,也说明了为什么在实际应用中能够获得如此巨大的性能提升。

当然,硬件性能也只是提供了一个基础的保障。正如周超勇所说,目前QLC固态盘的性能峰值还有待挖掘,而要想充分利用好这款产品,还需要软件层面不断的优化与调整,而这一点同样也是英特尔为金山云量身打造的核心竞争力。

许多人都知道英特尔生产芯片、生产处理器,就很自然的认为英特尔是一家硬件公司。但是鲜为人知的是,为了让自家的处理器产品发挥最高的效能,英特尔还拥有多达15,000人的软件工程师团队,即便是在专业的软件公司中,这也是一个令人咂舌的数字。相应的,这些技术专家不但可以对自己的硬件进行优化,还可以根据客户的需求提供定制化的优化服务。

在与金山云的这次合作中,英特尔还为金山云提供了一款名为SPDK(Storage Performance Development Kit )的开发套件。所谓SPDK,中文翻译成“存储性能开发套件”,为编写高性能的、可扩展的、用户态存储应用提供了一套工具和库函数。SPDK之所以能实现高性能,是因为所有必要的驱动被挪到了用户空间运行,使用轮询模式代替了中断模式,从而避免了内核上下文切换和消除了中断处理开销。

“现在我们还没有来得及用,它对于上层应用来说还是有一定的技术门槛的,我更认为我们需要做一些铺垫,但是迟早我们会把SPDK给用上”,金山云CDN首席架构师周超勇表示。其实最近英特尔恰好有来自美国的专家团队来中国走访,而代表团的一项重要内容就是与金山云的技术团队共同探讨SPDK的使用问题。而除了SPDK之外,包括英特尔编译器在内的各种工具、资源都对金山云开放,而金山云也针对第二代英特尔® 至强® 可扩展处理器进行了很多优化,包括AVX-512等等,取得了很好的效果。

从硬件到软件,英特尔为金山云提供了全套的定制化服务,自然也取得了理想中的成果。不过在我们看来,最关心的还是性价比问题,毕竟金山云采用的是最新一代英特尔®至强®可扩展处理器,恐怕也是售价不菲。那么对于用户来说,这种全新的产品,他们的接受程度如何呢?

“硬件产品再贵,也就是一次性的投资,可以分摊到后续的几年当中”,周超勇说。由于金山云的CDN任务特性,因此不仅仅要关注到单机吞吐量能力、性价比提高了多少,还要考虑综合成本要素。就业务模式来说,如果客户在进行CDN访问的时候一次命中,就会直接读取数据;但是如果没有命中,需要从上游源站当中调取数据,这时候就会产生昂贵的带宽成本。周超勇认为:“硬件成本毕竟是一次性的,但是网络带宽流量产生的成本是每时每刻都存在的,所以这方面的节省对于我们更有意义”。

在数据中心领域,我们特别强调过一个词,叫做——全生命周期成本,即从立项、采购、部署、维护、保养等等多个环节。以金山云为例,虽然采购英特尔®至强®可扩展平台的确价格不菲,但是首先它获得了至少4倍的性能提升(还有进一步提升的空间),而且还有来自英特尔专家团队的软件优化支持,更包括了后期的运维、管理等等。如此算下来,其实金山云全生命周期成本相对于以往并没有太多的变化,受益良多。

“我的期望就是这套存储能够在线稳定服务3年,我也相信三年时间之内,英特尔一定会有更好的盘,不管是成本还是使用寿命上都会有提高。我也希望未来可以看到更好的产品出来,可以进一步提高寿命,缩短磁盘响应时间,这就是我对英特尔的期望”,周超勇总结到。

金山云和英特尔不仅仅“立足当下”,也会针对之后一年、三年,甚至未来的技术发展方向进行深入探讨。提供第二代英特尔®至强®可扩展处理器加上QLC的组合是英特尔与金山云深度合作实现创新的一个极佳案例,但绝不是唯一的案例。在各个方面,包括边缘计算、云游戏、视频云,即使抛开CDN视频、边缘计算相关的,在存储计算网络、大数据、人工智能方面双方都在深度合作。接下来英特尔会和金山云将共襄义举,共同研究更多的新产品演进,坚持以客户为中心的服务理念,提供安全,可靠,稳定,高品质的云计算服务,助力中国企业数字化升级。 

Keywords: 免费CDN加速 免备案CDN加速 高防CDN加速