1. 确定问题范围,明确问题解决目标;2. 收集信息:监控、告警、事件、日志、服务状态、网络链路等; 3. 问题分析:结合问题分析信息,逐步缩小排查范围,解决问题。
资源监控prometheus、 grafana(展示) 链路追踪skywalking、 zipkin
容器云平台相关安全方向:系统安全
镜像安全
运行时安全
平台安全
网络安全
监控方向:系统监控
平台监控
应用监控实现方案:prometheus
很好的问题,本人参与过国内大客户的一些云平台的自研,自研的话首先是需要有个专门的团队针对平台进行开发和运维,另外需要有些团队进行平台的推广和项目的迁移工作,以为Kubernetes社区是一个比较活跃,同时涉及的技术面相对比较广泛的社区,需要对底层的OS技术,网络技术以及存储...
1.传统核心应用的拆分。目前看需要用绞杀模式慢慢做。新的应用不存在这个问题。2.私有云为主,少量的应用用公有云。金融行业安全最重要,毋庸置疑。银行怎么可能把核心数据放公有云上?...
等保2.0有具体的要求,需要将其细化成容器云的配置。对于企业容器云方案如OpenShift,本身就有一些安装时候的最佳实践,按照这个方式安装本身就符合要求。
商业方案可以参考农行、招行。工行的容器云是自研的。
首先要搭建一个容器镜像的制品库,可以使用商业的jfrog artifactory,redhat quay; 也可以用开源的harbor.然后将制品库和单位的用户权限体系、研发流程和投产流程打通。根据流程流转结果,对制品库的目录、repo等进行联动配置,以达到镜像的权限隔离目的。...
我认为主要是开发和运维的边界划分问题。例如运维部分负责到容器云K8S层还是负责容器云的宿主机OS?如果只负责到OS,那和传统运维区别不大。如果负责到容器云平台层(不负责上面的应用),那就需要重点考虑容器云的可视化监控和日志体系构建。...
首先要打通开发和运维之间的隔阂。此外,团队每个技术人员重点发展一两方面的技能,做到技能互补。