独家解读:阿里云原生应用的布局与策略

作者 | 杨丽

受访人 | 丁宇

出品 | 雷锋网产业组

进化到这一阶段,云原生使得客户的数字化转型路径不断缩短。如果说云原生时代一切是以客户视角为出发点,那么进一步拆解就是围绕客户的业务场景、系统架构,而不再是过去堆人、费力的方式。如何正确引导客户共同享受到云原生的技术红利?丁宇,花名叔同,阿里巴巴研究员、阿里云智能云原生应用平台负责人,他所看到且给出的,也许不是客户数字化转型的唯一方案,但却是经过阿里云多年实践得出的对某类问题的最优解。

回顾过去十五年,阿里巴巴的云原生实践伴随着集团业务规模和支撑场景复杂度的与日俱增。对内,阿里淘宝作为全球最大的电商交易平台,每年双11电商业务带来的都是极大的技术挑战;对外,阿里云支撑了全球300万的企业客户数,帮助客户解决问题的同时也会关注其业务的发展。实际上,每一阶段不同问题的出现,也是阿里自身产品技术突破的创新引擎。

如果对这十五年的阿里云原生实践变迁做个拆解,那么一定离不开这个逻辑:自研-自用-上云开放。

  • 第一阶段:2006年-2011年,淘宝商城从集中式架构切换到微服务分布式架构,核心解决高可用性和稳定性的问题。

  • 第二阶段:2011年-2015年,开始投入做容器,以解决成本和运维效率的问题。

  • 第三阶段:2015年-2019年,推进产品技术的全面商业化,全面拥抱云原生的标准。

  • 第四阶段:2019年-至今,从支撑双11核心系统全面上云,到支撑核心系统全面云原生化。

可以说,阿里巴巴赶上了两个红利,一是互联网规模经济的红利;二是云计算的红利。通过不断解决在这些红利中遇到的问题,才有可能让阿里巴巴打造这些产品,并有机会全面升级下一代云原生技术,不断反哺给客户。

然而,并非所有的企业都有机会和时间(窗口期)来接触和塑造自身业务的云原生能力。

“没有云原生之前,只有能力极强的企业可以解决这个问题,但随着云原生的出现,每家企业都可以实现对云和极致弹性能力的调取,这是一个普适性红利的释放。”丁宇说道。

目前,阿里云有300+款云原生产品,上千个解决方案,为企业数字创新提供全方位能力支撑。 以容器技术为代表,因与云的结合,能够向下屏蔽基础设施的差异性,成为云服务调用的新界面,向上又可以支撑各类产品。

那么我们该如何进一步理解云原生,以及什么样的先进性企业能率先一步走出云原生实践的路子?

独家解读:阿里云原生应用的布局与策略

丁宇,阿里巴巴研究员、阿里云智能云原生应用平台负责人

这次访谈中,丁宇向我们分享了阿里云原生十五年实践的演进路线,以及对云计算领域的观察和对业务未来发展的思考,对于云原生企业和从业者有不少可借鉴之处。以下将是此次独家访谈的完整总结。

两个“30%”

外界有太多的技术或厂商视角下的云原生解读,这次我们尝试从客户视角来看云原生带来了哪些改变。

云原生本身在整个行业的市场接受度和落地成熟度越来越高。这源自于云原生给企业带来的两个直观感受。

  • 一是成本和资源的优化。很多企业购买了一个月的云资源,但实际可能只用了一周。企业上云、弹性用云的能力不强,只能通过时间换空间,多买点时间以解决能力不强的问题。但云原生解决了这个问题,能够让用户随用随取、用完即还,这本身就是一种非常强的资源优化。

去年疫情期间,在线教育行业客户通过阿里云的支撑,提升了近50%~60%的资源利用率。客户可以向下管理资源,向上管理AI、大数据、数据库、音视频等各项任务,通过灵活调度、混合部署、以及对任务全生命周期的管理、DevOps等,实现全生命周期的优化。

  • 二是研发效率的优化。企业的研发效率往往取决于架构的先进性。云原生实现了发布、上线、运维,以及开发工具等全栈优化,提升了研发人员单位生产的吞吐能力。

一项数据显示,核桃编程利用云原生可观测性产品ARMS减少了30%运维工作量,缩短了60%的故障定位平均耗时。

“我们一定会做一点,就是只要企业来试了,就会喜欢并且愿意继续使用。阿里云提供的云原生技术和产品在业界具有很好的通用性和先进性,是在企业数字创新发展趋势的主线上。尽管对企业客户来讲,可能会存在一定理念上的学习成本,但这种实打实的效率提升、成本降低,对于企业未来五年、十年甚至更长远的发展是非常有价值的。”

在此之前,阿里云通过云原生技术和产品带来了两个“30%”的提升,即提升30%研发效率,降低30%的IT成本,希望通过自身实践实现对外赋能数百万企业进行云原生改造。

在跟各行业的客户接触过程中,丁宇感触很深:

“云原生的优势反馈到客户侧会有很明显的改变,但这种改变并不是客户最关心的。客户更关心的是如何实现业务的成功,帮助自身实现数字化转型,这些是核心问题。阿里云会从这个角度出发,根据客户的需求提供相应的产品解决方案。这些本质上都是云原生的体系,只是产品形态和层次会有所不同。”

云原生里的“二八原则”

正如上文提到的,阿里巴巴在2019年提出并完成了核心系统全面上云,2020年又提出核心系统全面云原生化,通过云原生产品全面支撑集团双11大促。云原生并非一蹴而就,尤其对于阿里巴巴这样庞大的体系,它是一个循序渐进的过程,但是我们会从一些新兴业务里快速看到云原生带来的改变。

对于阿里巴巴而言,云原生的终态大概会是二八状态,即至少20%仍是自建,80%的业务会实现云原生化,不会做到100%的云原生化。

原因在于,在企业上云时代,更多讲的是IaaS上云。规模效应下,云计算的成本可以像水煤电一样做到成本足够低,从自建机房到租赁式服务,让企业客户直观感受到成本的大幅下降。但到了PaaS这个层次,会涉及不同的角色和场景、工具和服务,PaaS的差异性开始凸显出来,比如企业开发工具、运维工具、企业云管平台,以及内部IT系统等,这部分很长一段时间内都没有完全云原生化。

阿里巴巴的自身业务体量非常大,如果全面云原生化意味着要做很多的定制服务,这并非最优解。未来实现80%的云原生化,其实也代表着阿里自身对于投入云原生技术的决心,甚至可以浪费掉一些成本,以解决遗留资产的问题。

在2016年,阿里巴巴就实现了100%的容器化,以新一代的容器化方式替换原有的业务构建方式。这在互联网企业里可以说是绝无仅有。

相比之下,很多云原生时代的新兴势力,可能最大的优势就是不存在20年前阿里所面临的遗留资产问题,它们实现100%的云原生化就容易很多。

以零售行业为例。这个行业的竞争态势决定了企业必须要走在前列,积极拥抱数字化转型手段,利用数据驱动业务,打通跟客户的连接,实现门店管理、营销数字化等。

零售行业的全渠道营销等新业务往往是100%云原生的,但是一些存量的业务板块,企业可能不会有太大的动力、精力和能力实现云原生化。

丁宇提到,“我们要认清一个矛盾点,我们可以解决企业最核心的业务数字转型问题,但不能做一套方案来满足企业的所有系统。云原生并不是万能钥匙,帮助企业解决全部的问题。”

独家解读:阿里云原生应用的布局与策略

一股“新兴势力”

对于云原生带来的先进生产力,各行各业都会存在一定的需求。只不过那天有没有到来,仍取决于所在行业和客户的成熟度。

容器+Kubernetes已经成为云计算的新界面,可以对上游的业务包括大数据、AI、区块链、边缘计算等新兴负载进行支撑。站在这一层面,云原生是不分行业的,它是根据场景和技术平台的特点来决定的。

但这并不意味着不同客户对云原生技术应用的需求会是相同的。实际上,不同行业对方案的接受度、喜好的差别是较为明显的。

比如,政企、金融等线下实体行业比较喜欢平台级的PaaS产品,希望体验好、门槛低、稳定性高、可迭代;而互联网企业就不太接受PaaS,他们更希望是模块化、可组装的,具备一定的灵活度和开放性,这类企业往往技术实力较强,也有自己把控的想法。

此外,互联网企业对Serverless的偏好是非常明显的。Serverless将云的界面大幅上移,降低了对开发人员的精力消耗。在阿里集团内部,像闲鱼、高德等业务板块,就率先于阿里集团使用了Serverless的技术。

“说不好哪个业务会走到前面,业务对新技术的渴求是一样的,但是不同业务板块会根据自身的能力和所处的阶段,做一些新的领域和产品的尝试。”

标准和开源加速了云原生

单讲概念,云原生直到2013年前后才有一个大致标准的定义,到2018年又被CNCF继续诠释。但实际上,阿里云对云原生也有自己的理解。

在阿里云看来,云原生有狭义和广义理解之分。狭义理解上,云原生是从容器而来,企业的IT架构要跟云结合,才会有更好的优势。云原生的优势在于能够充分发挥云的能力,利用云的优势,构建弹性、可扩展、易管理、易维护的系统。

同时,云自身也在发生变化、升级。比如神龙服务器的升级,跟容器进行软硬一体的协同优化,使得性能、弹性各方面指标都能得到很大的提升;数据库跟云原生结合,能够将数据库跑在容器上,做存储计算分离,数据库的弹性自动化运维。

云实际上改造了技术的实现方式。

广义理解上,云原生的内涵可能更为丰富,因云而生、为云变化,云上生、云上长,这种实践方式已经远远超过了容器化所带来的意义。

以丁宇所负责的阿里云云原生应用平台为例,不同于之前我们所理解的容器服务、中间件等产品,云原生应用平台是一个丰富、牵涉多元角色体系的平台。它既不是容器平台,也不是PaaS,却需要连接很多核心的第三方SaaS服务商、PaaS服务商,开放兼容性接口给客户。那么,标准与开源可能是完善未来商业化体系的方向之一。

比如,阿里联合微软在社区推出的一款用于构建和交付云原生应用的标准规范OAM(Open Application Model),其核心理念即“以应用为中心”。原因在于,过去五年的云原生技术,主要是向下解决问题,而今它向上可以支撑很多工作任务,却缺乏对模型管理的标准化。

原来,开源走商业化非常难,但今天的情况不同,大量的开源软件可以在云上提供服务,无论容器还是大数据、音视频服务,都可以开发符合标准规范的应用,以云的方式触达客户。

这种拥抱开源的方式也最终影响了软件的开放标准,形成阿里云原生应用平台的最核心特征。

独家解读:阿里云原生应用的布局与策略

开源仍在路上

在阿里巴巴内部有这样一句话叫做“因为相信,所以看见”。无论最终结论导向了哪一方,你为之All In的全过程,其实就是在证明你的愿景。

相比过去,开源因云计算订阅模式的改变,形成了一条新的商业路径。目前阿里云的开源项目已经超过了2600个,Star数超百万,这是过去难以想象的事情。

以容器技术的发展为例。2011年至2016年期间,很多容器服务厂商就出现了这样一个标准的踏空。阿里云也是在2016年才替换掉自己的容器技术,选择了当时已经成为业界事实标准的Docker。

这无疑就回到一个问题:对技术的选择,是自研,还是使用开源技术?

对于阿里而言,采用开源或第三方产品根本支撑不了其规模和体量,如果能够支撑的话,成本也是非常高的。如果企业全是自研的话,会同时带来一个问题,企业不一定容易招人,从语言到平台、框架、架构全是自研,人才培训就是问题,人才离开后也不一定好找工作。

所以最后导向一点,就是一定要有标准。这个标准能够面向行业普适性,这样人才好招,同时还可以吸收外面的力量,自研的东西也有机会形成商业化。

如今来看,经过过去多年的实践,阿里云成为了很多事实标准(如Dubbo、RocketMQ),也跟随业界的趋势,采用了很多行业的标准(如Kubernetes )。

阿里云一直希望可以做标准化的技术,跟社区的标准、行业的标准进行打通,这样对于阿里云的客户而言,简化了很多流程,其具备的能力也是未来的主流。

与伙伴的“被集成”

如今,大量的传统软件厂商、独立软件服务商、渠道伙伴希望通过自身的转型升级,对最终客户提供更多的价值创新。他们其实不缺乏大量经过验证的交付能力,也不缺乏好的想法,但难题在于就拥抱互联网新技术,很难短时间内突破自我。

今天有老的SaaS厂商,也有新的SaaS厂商。不同之处在于,新SaaS厂商会因为成本、对生产力追求比较极致,会完全通过云的方式进行开发。这些厂商生于云计算时代之后,如果不享受这个时代的红利,跟老的SaaS厂商相比,根本没有优势的积累,所以更应该抓住技术先进性的优势。

日前,阿里云与APM厂商博睿数据在可观测领域展开合作,借助阿里云原生技术产品实现博睿在SaaS交付产品云拨测的布局,实现互联网方式的规模化发展。

对此丁宇提到,“博睿希望跟阿里云一起渗透到SaaS领域,向云计算架构靠拢,因为博睿看到未来更多的客户会在云上,它也希望能够快速挺进这一市场。现阶段,就需要通过理念、案例,通过技术的前瞻性,将可观测带入一个新的发展阶段。”

尽管目前来看,业界对云原生的理解和实践进程仍是参差不齐的,但阿里云希望能在云原生的市场心智建设阶段,通过“自证预言”,带动更多的企业加入到云原生中来。

当下,各行业都在拥抱云计算,这就要求云厂商需要持续对云基础包括服务器、网络、计算、存储等方面不断夯实,从而形成非常强的技术优势;同时,企业数字化转型的发生一定会依赖云计算,想要获得云的红利,就一定需要依赖云原生技术。

这种趋势下,云原生数据库、云原生大数据、云原生中间件、云原生安全等服务,也在因为云而悄悄发生改变。(雷锋网)

雷锋网雷锋网