解读Mesos(解读虎牙2024年Q1财报)
haoteby 2025-05-08 18:31 9 浏览
Mesos是Apache下的开源分布式资源管理框架,今天的介绍主要有以下几个方面:
1. Why Mesos
2. What is Mesos
3. Mesos Internal
4. Mesos Scheduling
5. Compare to Others
1. Why Mesos?
现今公司里的微架构很多,组件也越来越多,使得系统越来越复杂,工作量越来越大。有长期运行的服务,也有批处理任务。
为了更好的管理这些服务,采取了很多措施,如下图:
公司里把相似的软件放在同一个服务器上,同时预留出很多空间给突发或特殊事件(比如双十一)。这样存储空间被静态划分,需要人力来维护这些服务器。
此外,集群的利用率很低,如下图:
图中三个集群Hadoop,Pregel和MPI。横坐标为时间,纵坐标为集群利用率。
下图为Docker的模型,虽然它能利于软件的自动部署,但是无法解决数据中心静态划分问题。
我们所希望的是各种工作能放在共享集群上,软件更加紧密。
2. What is Mesos
Mesos是一个开源的集群管理框架,它可以将数据中心/集群放在一台电脑里运行,对外提供简单的API,同时隐藏内部的很多复杂架构。它由UC Berkeley的Benjemin Hinderman,Andy Konwinski和Matei Zaharia开发,后来在Twitter里发展成熟,并很快成为Apache基金会的顶级项目。
3. Mesos Internal
Mesos是一个分布式的架构,具有主从关系,master和slave。Zookeeper能做到首领选举(选mesos的master)等功能。要注意的是zookeeper也需要选举master。应用程序跑在frameworks上,它也是分布式的软件,包括scheduler和executor。图中蓝色部分是mesos本身,白色部分是需要自己开发的framework。这些需要自己开发的framework也需要考虑高可用性的问题,这算是mesos的缺点之一。Mesos使用protocol buffer和libprocess来进行通信。
1)zookeeper做为leader election。每个master起来的时候都要向zookeeper的quorum注册znode。
2)master主要用于管理slave node的状态,知道slave在哪儿,有哪些资源,同时知道各个框架的信息。比如Hadoop和MPI框架的基本信息。master还可以发resource offer。如果master down了,zookeeper可以马上从standby master里面选一个。因为几个master里面共享的东西很少,不需要数据的同步。
3)slave负责运行任务,同时不断的向master发消息,报告可用资源和在运行的任务的状态。这两种消息并不相同,报告任务状态的消息保证一定delivery,而其他消息并不保证。
4)framwork是一个分布式的应用,包括scheduler和executor。其中scheduler部分要和master紧密通信,接受master发送的offer,scheduler收到offer后决定是不是要跑某个task。executor真正的去执行任务。Offer的发送由master决定。
4. Mesos Scheduling
图中红色部分是具体的例子。比如第一个表示资源具有24个虚拟CPU等等。
Mesos使用两层调度,如下图:
Mesos的愿景是能跑所有类型的workload,但是这很难实现。
Mesos master里面有Application module,负责具体的分配算法。这个模块本身有默认算法设置,也可以自己实现。
首先slave向master报告自己的资源信息,比如4个CPU等等,在application module计算之后发给框架1,框架1里面有task queue,比如图中有两个Job,scheduler分配给不同task不同的资源,把信息发给master,master再返还给对应的slave去跑task。这就是two level scheduling,one level scheduling是指slave直接和scheduler通信。
Two level scheduling的好处在于:
Application module默认的算法实现是DRF:
DRF强调的是公平性。如果在使用Mesos时不在意公平性,DRF并不适用。Yarn里面也有DRF。下图是个具体的关于公平性的例子:
假设我们有个10块pizza,不同的人想要不同数量的pizza,如何实现公平分pizza。下图是作者提供的解决方案:
这个方案的思路是:先平均分,每个人2.5份。从资源要求最少的人开始(Ted),抽取多余的资源(Ted多了1.5,Barney多了0.5)分给剩下资源不够的人。这是单一资源情况下的分配情况。当资源多样化时,情况不同,如下图:
1)如果一个人得到的资源少于平均分配,那么他可以选择不share。所以这个算法是鼓励分享,不能出现这种情况。
2)这个算法不能因为个别人的欺骗行为而影响整体分配。
3)不同用户之间不能妒忌。如果一方任务完成,不能再领取额外资源。需求大的用户要获得大于或等于需求小的用户的资源。
4)这个算法应最大化资源利用率。
假如总共的资源是9个CPU,18个内存。最开始资源分配都为0,随机选择Framework 2(F2)分配资源。F2要了3个CPU,1个内存,dominant share为33%。现在F2的dominant share大于F1,下次分资源时先分配F1。依次类推,每次比较domiant share进行资源分配。
5. Compare to Others
Yarn和Mesos发展时间差不多,并且也是为了克服资源利用率方面问题而产生。区别在于Yarn是一个monolithic scheduling,不需要写framwork。整体来说,Yarn和Mesos的差别不大。
本文作者:Shaoke Xu,
更多精彩内容,欢迎访问官网 BitTiger.io 或关注 “论码农的自我修养” 微信公众号:bit_tiger
相关推荐
- 网站seo该怎么优化
-
一、网站定位在建设一个网站之前,我们首先要做的就是一个网站清晰的定位,会带来转化率相对较高的客户群体,我们建站的目的就是为了营销,只有集中来做某一件事,才会更好的展现我们的网站。在做SEO优化的同时...
- 3个小技巧教你如何做好SEO优化
-
想半路出家做SEO?可是,怎么才做的好呢?关于SEO专业技术弄懂搜索引擎原理,咱们做搜索引擎排名的首先就是要了解搜索引擎的工作原理,对SEO优化有更深入了解之后再来做SEO,你就能从搜索引擎的视点...
- SEO指令分享:filetype指令
-
filetype用于搜索特定的文件格式。百度和谷歌都支持filetype指令。比如搜索filetype:pdf今日头条返回的就是包含今日头条这个关键词的所有pdf文件,如下图:百度只支持:pdf...
- 网站seo优化技巧大全
-
SEO在搜索引擎中对检索结果进行排序,看谁最初是在用户的第一眼中看到的。实际上,这些排名都是通过引擎的内部算法来实现的。例如,百度算法很有名。那么,对百度SEO的优化有哪些小技巧?下面小编就会说下针对...
- 小技巧#10 某些高级的搜索技巧
-
由于某些原因,我的实验场所仅限百度。1.关键词+空格严格说来这个不能算高级,但关键词之间打空格的办法确实好用。我习惯用右手大拇指外侧敲击空格键,这个习惯在打英文报告时尤其频繁。2.site:(请不要忽...
- MYSQL数据库权限与安全
-
权限与安全数据库的权限和数据库的安全是息息相关的,不当的权限设置可能会导致各种各样的安全隐患,操作系统的某些设置也会对MySQL的安全造成影响。1、权限系统的工作原理...
- WPF样式
-
UniformGrid容器<UniformGridColumns="3"Rows="3"><Button/>...
- MySQL学到什么程度?才有可以在简历上写精通
-
前言如今互联网行业用的最多就是MySQL,然而对于高级Web面试者,尤其对于寻找30k下工作的求职者,很多MySQL相关知识点基本都会涉及,如果面试中,你的相关知识答的模糊和不切要点,基...
- jquery的事件名称和命名空间的方法
-
我们先看一些代码:当然,我们也可以用bind进行事件绑定。我们看到上面的代码,我们可以在事件后面,以点号,加我们的名字,就是事件命名空间。所谓事件命名空间,就是事件类型后面以点语法附加一个别名,以便引...
- c#,委托与事件,发布订阅模型,观察者模式
-
什么是事件?事件(Event)基本上说是一个用户操作,如按键、点击、鼠标移动等等,或者是一些提示信息,如系统生成的通知。应用程序需要在事件发生时响应事件。通过委托使用事件事件在类中声明且生成,且通过...
- 前端分享-原生Popover已经支持
-
传统网页弹窗开发需要自己处理z-index层级冲突、编写点击外部关闭的逻辑、管理多个弹窗的堆叠顺序。核心优势对比:...
- Axure 8.0 综合帖——新增细节内容
-
一、钢笔工具与PS或者AI中的钢笔工具一样的用法。同样有手柄和锚点,如果终点和起点没有接合在一起,只要双击鼠标左键即可完成绘画。画出来的是矢量图,可以理解为新的元件。不建议通过这个工具来画ICON图等...
- PostgreSQL技术内幕28:触发器实现原理
-
0.简介在PostgreSQL(简称PG)数据库中,触发器(Trigger)能够在特定的数据库数据变化事件(如插入、更新、删除等)或数据库事件(DDL)发生时自动执行预定义的操作。触发器的实现原理涉及...
- UWP开发入门(十七)--判断设备类型及响应VirtualKey
-
蜀黍我做的工作跟IM软件有关,UWP同时会跑在电脑和手机上。电脑和手机的使用习惯不尽一致,通常我倾向于根据窗口尺寸来进行布局的变化,但是特定的操作习惯是依赖于设备类型,而不是屏幕尺寸的,比如聊天窗口的...