Container周报第120期:日本雅虎靠2种角色管530个K8s丛集阿里云则有独家破万K8s丛集管理策略
日本雅虎KaaS平台怎么管?靠2种角色管530个K8s丛集
日本Yahoo内部KaaS团队一位K8s工程师藤江贵司最近接露了自家K8s建置现况。日本雅虎从2015年11月就开始研究新一代架构,2017年4月开始导入KaaS(Kubernetes as a Service),第一个导入K8s的服务是Zubatok,2018年10月开始全面导入到Yahoo内部应用,目前K8s丛集数达到530多个,已有140项产品或服务部署在K8s环境,所用容器数量高达7万个。
儘管花了2年多扩大导入,日本雅虎到2019年11月底时,仍然只有3成应用容器化,2020年的目标是,将内部应用中规模最大的广告业务相关平台全部都搬上KaaS平台,来扩大导入规模。藤江贵司指出,管理K8s的成本,其实非常高,所以才採用KaaS服务,透过自动化K8s管理,来支援大规模的K8s环境部署。主要透过Kubernetes Controller来建立自动化管理的机制。
另一方面,日本雅虎从2019年4月开始,大力培训自家工程师的K8s成立,新近工程师或中阶工程师全部要接受培训,学习基本的Docker知识和部署方式,来降低使用K8s的门槛。日本雅虎目前採用的K8s版本是2019年9月释出的1.16版本,主要原因是看上客製化资源配置功能,可以让开发者或产品团队自己定义需要的运算资源配置。
日本雅虎还设立了一个专门维运KaaS的团队,目前约20人,来负责管理530个K8s丛集,支援140款产品的运作。KaaS团队还进一步分成两组角色,一事CRE(顾客可靠性工程师)和SRE(服务可靠性工程师)。CRE的任务是负责协助内部用户(内部使用KaaS的产品部门)提高生产力,处理内部用户的问题和跨平台整合工作,另外还要负责内部教育训练和内部KaaS社群的管理。
而SRE则是负责维护KaaS,尤其是KaaS採用了大量开源软体,SRE团队要负责维运、升级、建立自动化管理平台。为何要分成两种角色?藤江贵司解释,原本只有KaaS维运工程师角色,但一方面要维护系统,又要掌握用户使用情况,两者的优先顺序很难安排或兼顾,导致负责CRE工作的工程师,很难专注在维运工作,所以,后来,日本雅虎决定,将这两类职务分成两个团队,让SRE团队只专注于KaaS平台维运任务就好。
#K8s维运 #当机侦测VMware开源释出K8s丛集当机监控工具
虚拟化龙头VMware最近全力布局K8s市场,除了预告下一版vSphere将改用K8s重新打造之外,也陆续释出自己开发的K8s工具,来卡位云端原生市场。最近VMware就开源释出了一款K8s丛集当机监控工具Crash-Diagnostics,这是属于Vmware Tanzu专案中的其中一项小专案。Crash-Diagnostics可以用于K8s丛集当机事件的分析、事故调查或除错,而且可以提供自动化侦测机制,一旦丛集出现停滞或当机情况,就自动蒐集事故机器状态或同一个丛集中其他节点的资讯,也会将这些资料保留。未来版本的目标是可以进一步提供自动化的当机分析能力。
#机器学习 #跨云部署抢攻跨云需求,Domino Data Lab机器学习平台开始支援K8s部署
主推企业级资料平台的Domino Data Lab,最近开始将自家资料平台产品开始支援K8s原生部署,来抢攻跨云资料科学应用的需求。新版平台可以支援跨云资料科学政策的管理,例如在私有云或公云上套用同一套K8s自动扩充政策,来执行机器学习训练任务。另外,这个工具的目标是希望可以做到也提供了一个效能评估工具,可以来衡量机器学习模型的
#超大规模丛集管理 #K8s管理1万套K8s丛集有四大难题,阿里巴巴如何克服?
阿里巴巴从2015年就开始推出了云端K8s服务ACK,目前是阿里云成长最快的产品。阿里巴巴内部应用也用了ACK来执行各种内部应用。阿里巴巴曾发表过1万个K8s节点的最佳管理实践,但在,现在他们遇到了更大的挑战,1万丛集的管理。超大规模K8s丛集管理主要有四大挑战,首先是异质丛集管理的统一(标準版、无伺服器版、边缘运算版和Windows版K8s丛集),其次是丛集大小差异很大,从1千个规模到1万个规模都有,第三个挑战是ACK会持续升级或扩充新元件,最后一项资安和法规如何落实到所有丛集上。
ACK按全球20个地区的服务来建立各自的丛集群(Meta Cluster),来降低複杂度,并用K8s来管理K8s丛集的扩建。阿里巴巴将这个作法称为KoK架构,并设计了新的云端原生网路来提高同一个丛集群内的节点、Pod和服务的沟通效率。另外,针对不同规模大小的丛集,还设计了不同类型的配置档等级,分成小型、中型和大型三种。每一种runtime搭配的部署配置档,都会再细分出这三种规模的配置设计。
在K8s元件管理上,阿里巴巴则开发出一个集中式的外挂式元件管理平台,可以用来注册和管理所有的K8s元件,并且搭配了健康监控服务,在元件升级前后都会检查,来掌握用到这些元件的丛集是否有影响。另外,还用邦联式Prometheus建立了一套全球规模的分级式监控架构,来监控分散在20个地区的K8s丛集群。
责任编辑/王宏仁
更多Container相关动态
HashiCorp推出K8s整合工具vault-k8s,来强化自家资安产品与K8s的串接
免责声明:本文由用户上传,如有侵权请联系删除!
猜你喜欢
最新文章
- 中国好声音如果没有你李昊瀚(山野中国好声音李昊瀚唱的那么好为什么淘汰)
- 被套的尺寸是多少(被套尺寸一般是多少简介介绍)
- 怪物x联盟复刻版攻略(怪物x联盟复刻祥云马)
- 阳历是快的还是慢得(快的和慢的哪个是阳历简介介绍)
- 英雄联盟赵信特战先锋(特战先锋德邦总管赵信)
- 凤凰传奇有一首歌叫什么(凤凰传奇有一首歌歌词有)
- 为什么腾讯视频看不了直播(腾讯lpl视频看不了怎么办)
- Blue(Da(Ba Dee) 歌词)
- 联想z475开机黑屏(联想Z475开机超慢怎么回事)
- 吴建豪舞林大会跳的舞(2011舞林大会吴建豪怎么没有看见进复赛)
- 海清结婚了吗现在怎么样了(海清结婚了吗)
- 开十字绣店到哪里进货(开十字绣店在哪里进货怎么进货呢)
- 卫庄大战六剑奴是哪一集(卫庄哪集说的六剑奴是值得一战的对手)
- 微信六年来第一次开始“变脸”为什么
- iphone怎么看已连接wifi密码(iPhone怎么越狱啊)
- 求K233次列车(15车厢的座位号)
- 能链综合能源港里的充电站为何成为香饽饽
- 鸡蛋怎么做比较有营养(鸡蛋怎么做比较好吃)
- lol手游霞怎么出装(LOL新英雄霞与洛逆羽霞如何出装霞怎么出装)
- 穿越火线什么时候上架(穿越火线什么时候能玩)
- 北比臼舅怎么读(北比臼日怎么读)
- 创世之柱任务有什么用(创世之柱任务怎么做)
- 徐磊的歌曲(写给你的歌 徐磊乐演唱作品)
- 广州市经济适用住房准购证明怎么办理(如何取得广州市经济适用住房准购证明)