阿里云控制台首页(阿里云服务网格 ASM 集成 SLS 告警)

1. 前言

随着微服务的普及,微服务架构也在不断演进,以Spring Cloud和Dubbo为代表的微服务开发框架也得到普及和落地。在云诞生的时代,非侵入式服务网格开始成熟。与传统的微服务架构相比,服务网格具有三大优势:可观察性、流量控制和安全性。服务网格把以前服务治理的复杂性从应用中分离出来,放到服务代理中,包括流量控制、断开连接、服务发现、安全性、可观测性等等。在开发应用的时候,我们只需要关心业务功能的实现,这样责任划分就更加清晰了。

阿里云服务网格是阿里云提供的全托管服务网格平台,兼容Istio。在可观测性方面,与SLS的深度集成,提供了日志采集、可视化、报警的一站式可观测性解决方案。本文主要介绍了服务网格新引入的控制平面日志收集和告警配置,也涵盖了数据平面访问日志的收集和可视化。未来会针对数据平面的访问日志的告警引入更多的内置告警规则,实现SLS上的一站式告警管理。

2. 阿里云服务网格(ASM)介绍

阿里云服务网格(简称ASM)提供全托管服务网格平台,兼容社区Istio开源服务网格,用于简化服务治理,包括服务调用之间的流量路由和拆分管理、服务之间通信的认证安全和网格可观测性,从而大大减少开发和运维的工作量。



ASM中的控制平面组件完全由阿里云托管,并兼容Istio,用户只需挂住业务应用的开发和部署即可。针对ACK托管集群、专有集群、无服务器集群、混合云或多云场景,提供一致的流量控制、安全性和可观测性管理,控制平面的核心组件由阿里云托管,可以最大限度降低用户资源开销和运维成本。

在可观察性方面,ASM支持使用SLS控制平面和数据平面的日志,并提供内置的仪表盘和警报。未来还会增加更多内置报警的内置报警规则。借助SLS强大的告警管理和通知功能,用户可以更好地了解ASM的运行状态,及时得到告警通知,以便进行下一步操作。

3. SLS告警介绍

Service SLS是云原生观测分析平台,为日志、度量、Trace等数据提供大规模、低成本、实时的平台服务。日志服务提供一站式数据采集、处理、查询分析、可视化、报警、消费和交付等功能。

SLS报警是集报警监控、降噪、事务管理、通知分发于一体的一站式智能运维平台。SLS的核心功能组件主要包括数据存储、报警监控、报警管理、动作管理和开放报警子系统。

SLS报警来源主要包括用户自定义报警、内置报警和开放报警。各种报警源产生报警后;警报将被发送到警报管理系统;用户可以通过它进行合并等处理;压抑和沉默。然后警报会发送到通知管理系统。在通知管理中,可以设置根据不同的告警属性,将通知分配到不同的通知渠道。



4. ASM可观测性日志采集及可视化

ASM可观测性日志主要包括控制平面和数据平面的日志:

  • 平面计程仪ASM提供基于SLS的报警功能;
  • 数据平面日志主要包括门户网关日志和特使访问日志,其中ASM提供了基于SLS的内置仪表盘功能。
  • 4.1。数据平面入口网关日志收集和可视化

    数据平面接入网关日志可以参考服务网格接入网关日志。主要包括日志服务组件的安装和集合配置。收集完成后,在ASM控制台中嵌入三个仪表板,即门户网关概述、门户网关访问中心和门户网关监控中心。







    4.2。特使访问日志收集和可视化

    对特使访问日志的访问可以参考用于收集数据平面网关日志的日志服务。主要步骤包括安装日志服务组件和收集配置。收集完成后,您可以在ASM控制台中查看访问日志监控中心和访问日志的详细记录。





    4.3。控制平面日志收集和报警

    ASM支持向SLS收集控制平面日志,然后根据日志配置警报。接下来,重点介绍如何打开控制平面日志收集和警报。

    4.3.1打开ASM控制台中的警报

  • 在ASM控制台中,找到相关的服务网格实例,点击回车,启用控制平面日志收集的开关,如图所示:


  • 点击报警设置,在报警弹出框中选择一个动作策略。默认情况下,你可以选择“SLS服务网格内置动作策略”,然后开启报警。


  • 4.3.2在SLS控制台中配置报警通知器

  • 在SLS控制台主页上,找到页面顶部的日志应用程序,然后单击“报警管理中心”


  • 单击全局配置。


  • 在左侧菜单中,找到用户管理-& gt;用户组管理,点击右边的修改按钮,在SLS服务网关内置的用户组中添加相应的联系人,在告警产生后接收通知。




  • 告警管理中心是基于SLS下服务的统一智能告警运维平台,可全局配置。>:通知策略-& gt;在动作策略中找到“SLS服务网关内置动作策略”,点击修改可以查看其告警通知接收方、通知模板等。

    阿里云控制台

    接到报警后,可以根据报警的内容提出一些建议。

    错误消息

    处理建议

    内部错误:添加/更新监听程序0.0.0.0_443时出错:无法从& lt内嵌& gt,仅支持P-256 ECDSA证书

    警报消息表明数据平面集群不支持您为数据平面配置的证书,当前仅支持P-256 ECDSA证书。您需要重新配置证书。有关详细信息,请参考通过服务网关启用HTTPS安全服务。

    内部错误:添加/更新监听程序0.0.0.0_443时出错:无效路径:****

    警报消息表明您为数据平面配置的证书路径错误或证书不存在。您需要检查证书安装路径是否与网关中配置的路径一致。有关详细信息,请参见通过服务网关启用HTTPS安全服务。

    内部错误:添加/更新监听程序0.0.0.0_xx时出错:发现重复的监听程序0.0.0.0_xx

    警报消息表明您为网关配置的监控端口是重复的。请检查您的网关并删除重复的端口。

    内部错误:添加/更新监听程序时出错192.168.33.189_15021:没有& # 39;找不到名为& # 39;的注册实现。***'

    该警报消息表明在Sidecar和Ingressgateway中找不到通过EnvoyFilter在监听器修补程序15021的配置中引用的* * *,您需要删除该引用。

    内部错误:添加/更新侦听器时出错0.0.0.0_80: V2(和自动)xDS传输协议版本在grpc_service中已过时***

    警报消息表明您的数据平面的XDS V2协议将很快被放弃,这通常是由您的数据平面侧柜和控制平面之间的版本差异引起的。升级数据平面的Sidecar可以解决这个问题。您需要删除Pod,它会在自动重新创建后自动注入最新版本的Sidecar。

    5。总结本文主要描述了如何在阿里云服务网格中打开数据平面访问日志和控制平面日志,并简单介绍了数据平面日志中内置仪表盘和控制平面日志的告警配置。有了SLS告警,用户可以一站式管理告警,可以有效提高运维效率。目前SLS支持ASM控制平面日志告警。未来,在ASM数据平面日志收集和可视化的基础上,SLS将提供更多内置的报警规则。在ASM控制台中,可以一键打开内置的告警规则,提高服务网格的可观测性闭环。用户还可以在SLS上实现统一的告警管理。敬请关注。

    原文链接:https://developer.aliyun.com/article/807772? UTM _ content = g _ 1000309144

    本文为阿里云原创内容,未经允许不得转载。

    您可以还会对下面的文章感兴趣

    使用微信扫描二维码后

    点击右上角发送给好友