解读Mesos(解读虎牙2024年Q1财报)
haoteby 2025-05-08 18:31 25 浏览
Mesos是Apache下的开源分布式资源管理框架,今天的介绍主要有以下几个方面:
1. Why Mesos
2. What is Mesos
3. Mesos Internal
4. Mesos Scheduling
5. Compare to Others
1. Why Mesos?
现今公司里的微架构很多,组件也越来越多,使得系统越来越复杂,工作量越来越大。有长期运行的服务,也有批处理任务。
为了更好的管理这些服务,采取了很多措施,如下图:
公司里把相似的软件放在同一个服务器上,同时预留出很多空间给突发或特殊事件(比如双十一)。这样存储空间被静态划分,需要人力来维护这些服务器。
此外,集群的利用率很低,如下图:
图中三个集群Hadoop,Pregel和MPI。横坐标为时间,纵坐标为集群利用率。
下图为Docker的模型,虽然它能利于软件的自动部署,但是无法解决数据中心静态划分问题。
我们所希望的是各种工作能放在共享集群上,软件更加紧密。
2. What is Mesos
Mesos是一个开源的集群管理框架,它可以将数据中心/集群放在一台电脑里运行,对外提供简单的API,同时隐藏内部的很多复杂架构。它由UC Berkeley的Benjemin Hinderman,Andy Konwinski和Matei Zaharia开发,后来在Twitter里发展成熟,并很快成为Apache基金会的顶级项目。
3. Mesos Internal
Mesos是一个分布式的架构,具有主从关系,master和slave。Zookeeper能做到首领选举(选mesos的master)等功能。要注意的是zookeeper也需要选举master。应用程序跑在frameworks上,它也是分布式的软件,包括scheduler和executor。图中蓝色部分是mesos本身,白色部分是需要自己开发的framework。这些需要自己开发的framework也需要考虑高可用性的问题,这算是mesos的缺点之一。Mesos使用protocol buffer和libprocess来进行通信。
1)zookeeper做为leader election。每个master起来的时候都要向zookeeper的quorum注册znode。
2)master主要用于管理slave node的状态,知道slave在哪儿,有哪些资源,同时知道各个框架的信息。比如Hadoop和MPI框架的基本信息。master还可以发resource offer。如果master down了,zookeeper可以马上从standby master里面选一个。因为几个master里面共享的东西很少,不需要数据的同步。
3)slave负责运行任务,同时不断的向master发消息,报告可用资源和在运行的任务的状态。这两种消息并不相同,报告任务状态的消息保证一定delivery,而其他消息并不保证。
4)framwork是一个分布式的应用,包括scheduler和executor。其中scheduler部分要和master紧密通信,接受master发送的offer,scheduler收到offer后决定是不是要跑某个task。executor真正的去执行任务。Offer的发送由master决定。
4. Mesos Scheduling
图中红色部分是具体的例子。比如第一个表示资源具有24个虚拟CPU等等。
Mesos使用两层调度,如下图:
Mesos的愿景是能跑所有类型的workload,但是这很难实现。
Mesos master里面有Application module,负责具体的分配算法。这个模块本身有默认算法设置,也可以自己实现。
首先slave向master报告自己的资源信息,比如4个CPU等等,在application module计算之后发给框架1,框架1里面有task queue,比如图中有两个Job,scheduler分配给不同task不同的资源,把信息发给master,master再返还给对应的slave去跑task。这就是two level scheduling,one level scheduling是指slave直接和scheduler通信。
Two level scheduling的好处在于:
Application module默认的算法实现是DRF:
DRF强调的是公平性。如果在使用Mesos时不在意公平性,DRF并不适用。Yarn里面也有DRF。下图是个具体的关于公平性的例子:
假设我们有个10块pizza,不同的人想要不同数量的pizza,如何实现公平分pizza。下图是作者提供的解决方案:
这个方案的思路是:先平均分,每个人2.5份。从资源要求最少的人开始(Ted),抽取多余的资源(Ted多了1.5,Barney多了0.5)分给剩下资源不够的人。这是单一资源情况下的分配情况。当资源多样化时,情况不同,如下图:
1)如果一个人得到的资源少于平均分配,那么他可以选择不share。所以这个算法是鼓励分享,不能出现这种情况。
2)这个算法不能因为个别人的欺骗行为而影响整体分配。
3)不同用户之间不能妒忌。如果一方任务完成,不能再领取额外资源。需求大的用户要获得大于或等于需求小的用户的资源。
4)这个算法应最大化资源利用率。
假如总共的资源是9个CPU,18个内存。最开始资源分配都为0,随机选择Framework 2(F2)分配资源。F2要了3个CPU,1个内存,dominant share为33%。现在F2的dominant share大于F1,下次分资源时先分配F1。依次类推,每次比较domiant share进行资源分配。
5. Compare to Others
Yarn和Mesos发展时间差不多,并且也是为了克服资源利用率方面问题而产生。区别在于Yarn是一个monolithic scheduling,不需要写framwork。整体来说,Yarn和Mesos的差别不大。
本文作者:Shaoke Xu,
更多精彩内容,欢迎访问官网 BitTiger.io 或关注 “论码农的自我修养” 微信公众号:bit_tiger
相关推荐
- Chrome OS 41 用 Freon 取代 X11_chrome os atom
-
在刚发布的ChromeOS41里,除了常规的Wi-Fi稳定性提升(几乎所有系统的changelog里都会包含这一项)、访客模式壁纸等之外,还存在底层改变。这一更新中Google移除...
- 苹果iPad Pro再曝光 有望今年六月发布
-
自进入2015年以后,有关大屏iPad的消息便一直不绝于耳,之前就有不少媒体猜想这款全新的平板电脑将会在三月发布,不过可惜的是我么只在那次发布会上看到了MacBookPro。近日@Ubuntu团队便...
- 雷卯针对香橙派Orange Pi 5 Max开发板防雷防静电方案
-
一、应用场景高端平板、边缘计算、人工智能、云计算、AR/VR、智能安防、智能家居、Linux桌面计算机、Linux网络服务器、Android平板、Android游戏机...
- Ubuntu Server无法更新问题解决_ubuntu server not found
-
上周老家的一台运行UbuntuServer的盒子无法连接上了,中秋这两天回来打开,顺手更新一下发现更新报错。提示`E:Releasefileforhttps://mirrors.aliyun...
- 虚幻引擎5正式版发布:古墓丽影&巫师新作采用、新一代实时渲染
-
机器之心报道编辑:杜伟、陈萍虚幻引擎5的目标是「助力各种规模的团队在视觉领域和互动领域挑战极限,施展无限潜能」。...
- AMD Milan-X双路霄龙7773X平台基准测试曝光 CPU缓存总量超1.5GB
-
OpenBenchmarking基准测试数据库刚刚曝光了AMDMilan-X双路霄龙7773X平台的跑分成绩,虽然很快就被撤下,但我们还是知晓了高达1.6GB的总CPU缓存。早些时...
- 全网最新的Dify(1.7.2)私有化离线部署教程(ARM架构)
-
Hello,大家好!近期工作中有涉及到Dify私有化离线部署,特别是针对于一些国产设备。因此特别整理了该教程,实测有效!有需要的小伙伴可以参考下!本文主要针对Dify1.7.2最新版本+国产操作系...
- 在ubuntu下新建asp.net core项目_创建ubuntu
-
本文一步步讲述在ubuntu下用visualstudiocode创建asp.netcore项目的过程。step1:环境操作系统:virtualbox下安装的lubuntu。请不要开启“硬件...
-
- 在晶晨A311D2处理器上进行Linux硬件视频编码
-
在KhadasVIM4AmogicA311D2SBC上,我更多的时间是在使用Ubuntu22.04。它的总体性能还不错,只不过缺少3D图形加速和硬件视...
-
2025-08-26 17:22 haoteby
- Nacos3.0重磅来袭!全面拥抱AI,单机及集群模式安装详细教程!
-
之前和大家分享过JDK17的多版本管理及详细安装过程,然后在项目升级完jdk17后又发现之前的注册和配置中心nacos又用不了,原因是之前的nacos1.3版本的,版本太老了,已经无法适配当前新的JD...
- 电影质量级渲染来了!虚幻引擎5.3正式发布:已开放下载
-
快科技9月8日消息,日前,Unrealengine正式发布了虚幻引擎5.3,带来了大量全方位的改进。...
- 2025如何选购办公电脑?极摩客mini主机英特尔系列选购指南
-
当下,迷你主机的性能越来越强,品类也越来越多。但是CPU是不变的,基本都是AMD和英特尔的。有一个小伙伴在评论区提问,我应该如何在众多机器中选购一台符合自己的迷你主机呢?那今天我们优先把我们的系列,分...
- ubuntu 20.04+RTX4060 Ti+CUDA 11.7+cudnn
-
ububtu添加国内源sudocp/etc/apt/sources.list/etc/apt/sources.list.backupsudovim/etc/apt/sources.lis...
- Linux Mint 18将重新基于Ubuntu 16.04 带来更好硬件支持
-
项目负责人ClementLefebvre在本月6日披露了关于LinuxMint18“Sarah”操作系统的大量信息,包括带来全新扁平化体验的Mint-Y主题。而现在,这款将于年底之前上线的操作...