6月18日凌晨即将到来的又一次大考,对于京东云来说是一场练兵,也是一次超大规模的技术创新、产品迭代和服务升级。京东云千余名工程师驻场守护,为亿万级流量洪峰保驾护航!
Round1:资源调度与全链路压测
京东云面对618大促流量洪峰时的自信,一方面来自于海量的资源储备和调度管理能力,另一方面也来自于准确的评估与不断的测试。京东云云圭全链路压测平台可提供多协议、复杂场景的全链路压测能力,在大促到来之前准确预估资源峰值,用最低的成本实现最大化的业务支撑。
“应对极限挑战,对京东云来说不再是惊心动魄的过程,而是慢慢变成一种寻常。在京东,每年都会做针对618的技术演练。多轮次、多链路、全业务场景高保真压测全覆盖,一切都是真实场景再现。”,在京东云工作多年的系统架构师已经将一系列压测保障视作规范化的操作。
Round 2:故障注入与高可用演练
618大促保障的第一目标是平稳,不放过任何一个可能造成系统波动的细节。对Region故障、AZ故障、机架故障、机器故障、流量峰值风险、多种峰值叠加等各类风险进行评估,设定系统化的故障演练模型。组织云平台全系统破坏性演练、大客户业务可用区切换演练等十余项故障注入和应急演练,支持全平台、局部链路、单系统等各维度故障注入,通过模拟真实故障实现对系统的高可用和应急能力的检验。
京东云为应用系统提供最高等级的业务可持续性技术保障,与业务方及上下游制定联动机制及预案。利用在线双流双活,启动灾备预案联动,确保全程0卡顿、0故障。
Round 3:平台防护与安全保障
京东云打造了一套完整的全链路立体式安全运营中心,基于云原生运营与管理平台通过安全可视、安全预防、威胁检测、调查响应等安全能力,实现安全运营闭环,保障了京东体系中上百万个应用的平稳运行。在618大促活动开启之前,京东云实施多轮红蓝对抗测试和DDoS攻击防护演练,精准地判断攻击流量和异常行为。通过智能风控平台,实时防护垃圾注册、活动作弊、信用欺诈等风险,确保每一笔交易都由“对的人”完成。
全员值守,静待618亿万级流量洪峰!
京东618,全球最复杂场景的云原生实践
京东在每年的 618都会面临海量数据和流量增长,从前端网站、订单、结算、支付、搜索、推荐,到后端的仓储、配送、客服、售后各种业务系统都面临着前所未有的挑战。作为全球容器化最彻底的云计算平台之一,京东云自2018年建成全球最大规模的Docker集群、Kubernetes集群,以及最复杂的Vitess集群之一,基本实现了“All in Native”,是目前云原生落地最彻底的企业之一。基于云原生技术理念京东云打造了丰富的云原生产品矩阵,通过618这种极端环境对平台的技术和新产品进行验证,京东云不断沉淀和打磨,将云上的技术能力提供给客户,将云原生的实践赋能千行百业。