快看：【prometheus】-02 一张图彻底搞懂Prometheus服务发现机制

首页 > 热点 > > 内容

快看：【prometheus】-02 一张图彻底搞懂Prometheus服务发现机制

发表时间：2023-03-24 19:11:53 来源：腾讯云

概述

Prometheus是基于Pull模式抓取监控数据，首先要能够发现需要监控的目标对象target，特别Prometheus最开始设计是一个面向云原生应用程序的，云原生、容器场景下按需的资源使用方式对于监控系统而言就意味着没有了一个固定的监控目标，所有的监控对象(基础设施、应用、服务)都在动态的变化。而对于Prometheus而言其解决方案就是引入一个中间的代理人（服务注册中心），这个代理人掌握着当前所有监控目标的访问信息，Prometheus只需要向这个代理人询问有哪些监控目标控即可，这种模式被称为服务发现(service discovery)。

(资料图片仅供参考)

如上图，SD模块专门负责去发现需要监控的target信息，Prometheus去从SD模块订阅该信息，有target信息时会推送给Prometheus，然后Prometheus拿到target信息后通过pull http协议去拉取监控指标数据。

Prometheus支持的服务发现协议是非常丰富的，目前已支持多达二十多种服务发现协议：

服务发现原理图

上图描述Prometheus服务发现协议比较笼统，Prometheus服务发现实现原理大致如下图：

如上图所述，Prometheus服务发现机制大致涉及到三个部分：

1、配置处理模块解析的prometheus.yml配置中scrape_configs部分，将配置的job生成一个个Discoverer服务，不同的服务发现协议都会有各自的Discoverer实现方式，它们根据实现逻辑去发现target，并将其放入到targets容器中；

2、discoveryManager组件内部有个定时周期触发任务，每5秒检查targets容器，如果有变更则将targets容器中target信息放入到syncCh通道中；

3、scrape组件会监听syncCh通道，这样需要监控的targets信息就传递给scrape组件，然后reload将target纳入监控开始抓取监控指标。

配置处理部分会根据scrape_configs部分配置的不同协议类型生成不同Discoverer，然后根据它们内部不同的实现逻辑去发现target，discoveryManager组件则相当于一个搬运工，scrape组件则是一个使用者，这两个组件都无感知服务发现协议的差异。

下面分别来分析下配置处理、discoveryManager组件和scrape组件在服务发现方面的具体实现流程。

配置处理

上节分析Prometheus启动流程，有个配置加载组件通过reloadConfig加载解析prometheus配置文件后，在reloader中循环调用各个组件的ApplyConfig(cfg map[string]Configs)方法处理配置，这其中就包括discovery/manager.go:

reloader中定义如下：

{name:"scrape_sd",//从配置文件中提取Section:scrape_configsreloader:func(cfg*config.Config)error{c:=make(map[string]discovery.Configs)for_,v:=rangecfg.ScrapeConfigs{c[v.JobName]=v.ServiceDiscoveryConfigs}returndiscoveryManagerScrape.ApplyConfig(c)},}

那下面就从discovery/manager.go中定义的ApplyConfig()方法分析。

1、根据配置注册provider：

forname,scfg:=rangecfg{//根据配置注册providerfailedCount+=m.registerProviders(scfg,name)discoveredTargets.WithLabelValues(m.name,name).Set()}

其中关键的是m.registerProviders(scfg, name)，继续跟踪：

d,err:=cfg.NewDiscoverer(DiscovererOptions{Logger:log.With(m.logger,"discovery",typ),})

2、然后将所有注册到m.providers数组中的provider进行启动：

for_,prov:=rangem.providers{//启动服务发现实例m.startProvider(m.ctx,prov)}

跟踪到m.startProvider(m.ctx, prov)方法中：

updates:=make(chan[]*targetgroup.Group)//执行run 每个服务发现都有自己的run方法。gop.d.Run(ctx,updates)//更新发现的服务gom.updater(ctx,p,updates)

发现这里主要是启动两个协程，它们之间使用updates通道类型变量进行通信。

总结来说(见下图)：

1、每个Config都会对应创建一个Discoverer实例，并被封装到provider存储在m.providers数组中；

2、然后遍历providers数组进行启动操作，启动操作启动了两个协程：

a、Discoverer.Run协程逻辑中主要根据发现协议发现targets；

b、然后通过通道传递给discovery/Manager.updater协程中，将其存放到m.targets集合map中；

配置处理这里还有个比较关键的：Discoverer会根据不同协议实现发现target，它是如何实现的呢？

首先，我们来看下Discoverer实例创建：d, err := cfg.NewDiscoverer()，它是一个接口定义：

typeConfiginterface{Name()stringNewDiscoverer(DiscovererOptions)(Discoverer,error)}

每种服务发现协议都在自己的SDConfig中实现了各自的NewDiscoverver()方法，这样就可以将服务发现逻辑封装到Discovererver实现中：

discoveryManager组件

上节《Prometheus启动流程》一节分析过会启动discoveryManagerScrape组件通过通道将targets数据信息传递给scrapeManager组件(见下图)：

1、discoveryManagerScrape组件启动入口：

g.Add(func()error{err:=discoveryManagerScrape.Run()level.Info(logger).Log("msg","Scrapediscoverymanagerstopped")returnerr},func(errerror){level.Info(logger).Log("msg","Stoppingscrapediscoverymanager...")cancelScrape()},)

2、一直跟踪会进入到sender()方法中，配置处理模块说过，有个协程会将Discoverer组件发现的targets信息存储到m.targets集合map中，然后给m.triggerSend发送信号，sender方法中就是启动定时周期触发器监听m.triggerSend信号：

func(m*Manager)sender(){//周期性定时器定时触发任务，这里是5s触发一次ticker:=time.NewTicker(m.updatert)deferticker.Stop()for{select{case<-m.ctx.Done():returncase<-ticker.C://Somediscovererssendupdatestoooftensowethrottlethesewiththeticker.select{case<-m.triggerSend:sentUpdates.WithLabelValues(m.name).Inc()select{casem.syncCh<-m.allGroups():default:delayedUpdates.WithLabelValues(m.name).Inc()level.Debug(m.logger).Log("msg","Discoveryreceiver"schannelwasfullsowillretrythenextcycle")select{casem.triggerSend<-struct{}{}:default:}}default:}}}}

监听到m.triggerSend信号，则执行m.syncCh <- m.allGroups()，我们来看下m.allGroups()干了什么？

func(m*Manager)allGroups()map[string][]*targetgroup.Group{m.mtx.RLock()deferm.mtx.RUnlock()tSets:=map[string][]*targetgroup.Group{}forpkey,tsets:=rangem.targets{varnintfor_,tg:=rangetsets{//Evenifthetargetgroup"tg"isemptywestillneedtosendittothe"Scrapemanager"//tosignalthatitneedstostopallscrapeloopsforthistargetset.tSets[pkey.setName]=append(tSets[pkey.setName],tg)n+=len(tg.Targets)}discoveredTargets.WithLabelValues(m.name,pkey.setName).Set(float64(n))}returntSets}

其实就是将m.targets数据发送到m.syncCh通道上，所以，discoveryManager组件比较简单，就是一个搬运工。

scrape组件

scrapeManager组件启动：scrapeManager.Run(discoveryManagerScrape.SyncCh())，通道syncCh是被scrapeManager组件持有的，跟踪进入Run方法中：

func(m*Manager)Run(tsets<-chanmap[string][]*targetgroup.Group)error{gom.reloader()for{select{//通过管道获取被监控的服务(targets)casets:=<-tsets:m.updateTsets(ts)select{//关闭ScrapeManager处理信号//若从服务发现(serviceDiscover)有服务(targets)变动，则给管道triggerReload传值，并触发reloader()方法更新服务casem.triggerReload<-struct{}{}:default:}case<-m.graceShut:returnnil}}}

通过case ts := <-tsets获取到syncCh通道上传递过来的targets数据，然后调用m.updateTsets(ts)将targets数据存储到scrapeManager.targetSets中，然后给m.triggerReload发送信号。

这个方法中go m.reloader()启动了一个协程，进入reloader()方法中：

func(m*Manager)reloader(){//定时器5sticker:=time.NewTicker(*time.Second)deferticker.Stop()for{select{case<-m.graceShut:return//若服务发现(serviceDiscovery)有服务(targets)变动，就会向管道triggerReload写入值，定时器每5s判断一次triggerReload管道是否有值，若有值，则触发reload方法case<-ticker.C:select{case<-m.triggerReload:m.reload()case<-m.graceShut:return}}}}

也是通过定时周期触发任务监听m.triggerReload信号，执行m.reload()将targets加载进来。

总结

前面分析了服务发现运行机制，可以看下面图梳理下前面流程逻辑：

标签：

快看：【prometheus】-02 一张图彻底搞懂Prometheus服务发现机制

概述

服务发现原理图

配置处理

discoveryManager组件

scrape组件

总结

快看：【prometheus】-02 一张图彻底搞懂Prometheus服务发现机制

世界最新：新车 | 增量不增价，广汽丰田全新雷凌重磅上市

环球看热讯：日暖春寒小说_日暖春寒

世界即时：首都机场从3月26日起正式执行夏航季航班计划

2020年什么时候数伏多少天伏 今日热门

THG精彩亮相德国法兰克福ISH展

“赔了夫人又折兵”？！千亿银行系公募刚没了副总，又丢了爱将 热文

新华全媒＋丨大山教师“夫妻档” 坚守初心三十载|当前时讯

即时焦点：3月24日生意社麦冬基准价为143.33元/公斤

中国人停车为啥都把方向盘打正，而美国人却打歪？原因很简单 今日播报

热门看点：榆钱窝窝头的做法

全球报道:Jio推出新的足球世界杯国际计划

闪耀暖暖西域沙漠非凡套装复刻预告异域风情的沙漠舞娘再来袭

高铁电气: 中信建投证券股份有限公司关于中铁高铁电气装备股份有限公司使用部分暂时闲置募集资金进行现金管理的核查意见

圣斗士卡妙介绍_圣斗士卡妙介绍简述

一种罕见真菌在美国蔓延！会引发全球大范围传播吗？

天天信息:自动档车怎样驾驶

【天天新要闻】破茧而出的这处城市文化新地标，正式对外亮相！

焦点播报:刚刚！安徽省考分数线公布

“未提前对外公布”！英媒：威廉王子突访波乌边境，还将见波兰总统

人教版语文四年级那片绿绿的爬山虎课堂笔记知识点

中升控股(00881)发布年度业绩，归母溢利66.68亿元，同比下降19.9% 独家

有限责任公司能进行破产清算吗

双面人什么意思_今亮点

拉齐奥官方：身穿“希特勒之子”球衣的球迷，终身禁止进入主场 环球热消息

资讯推荐:教育部公布2023年新增的153个国控专业点

中级管理会计师考试科目有哪些_中级管理会计师考试科目

奋进新征程 建功新时代丨 “助企宣讲团”，定制服务护航企业发展

天天信息:晚上睡不着觉有什么药吃吗_晚上睡不着觉有什么好办法

ln1等于多少

快看：【prometheus】-02 一张图彻底搞懂Prometheus服务发现机制

世界最新：新车 | 增量不增价，广汽丰田全新雷凌重磅上市

环球看热讯：日暖春寒小说_日暖春寒

世界即时：首都机场从3月26日起正式执行夏航季航班计划

2020年什么时候数伏多少天伏 今日热门

广西靖西市两地调整为中风险地区

苏州市多地调整为中风险地区

云南2月14日新增无症状感染者6例

实体书店为什么接二连三遭遇危机？生存之道在哪

卜卦、占星、看手相…… 为什么有的年轻人总想算一卦

一言不合放火烧家 任性女子被判刑

新疆阿克苏地区库车市发生3.4级地震 震源深度7千米

应急管理部：1月全国接报生产安全事故死亡超1100人

江苏省省长：苏州市要把疫情防控作为头等大事、第一要务

广西新增确诊病例降至1例 百色市有序解除管控

2020年什么时候数伏多少天伏今日热门

“赔了夫人又折兵”？！千亿银行系公募刚没了副总，又丢了爱将热文

中国人停车为啥都把方向盘打正，而美国人却打歪？原因很简单今日播报

拉齐奥官方：身穿“希特勒之子”球衣的球迷，终身禁止进入主场环球热消息

奋进新征程建功新时代丨 “助企宣讲团”，定制服务护航企业发展

2020年什么时候数伏多少天伏今日热门

一言不合放火烧家任性女子被判刑

新疆阿克苏地区库车市发生3.4级地震震源深度7千米

广西新增确诊病例降至1例百色市有序解除管控