——本文由 东坡 深圳注册香港公司首发于 星球 人人都能玩转数据
1.调度系统是什么(1)任务大数据的计算、分析和处理,一般由很多独立的进程完成,每个进程完成特定的数据处理逻辑。这里的进程称之为数据加工任务。
在实际的处理过程中,数据和数据之间存在着先后的顺序依赖关系。比如,要处理数据A,首先要完成数据B的处理,因为A依赖于B的结果。由于数据之间存在关联和依赖关系,对应的数据加工任务之间也有对应的关联和依赖,为保证数据处理的正确结果,要求这些加工任务按照依赖关系有序、高效的执行。
摩托车磨合期(2)调度如何让这些任务按照既定的规则有序执行呢?
比较简单的pc电源方法是,我们可以预估出每个任务处理可能需要的大概时间,根据任务的先后顺序,计算出每个任务的执行的起止时间,然后利用操作系统定时或testosterone计划功能,定时启动各个任务——这是不是有点像利用project做甘特图?
这种方式在任务比较少的情况下还好。如果任务数量比较多,光是计算每个任务的启动时间就够大家忙的不可开交了。大家可脑补一下当时用project做甘特图的痛苦~~~
此外,上述方法还存在以下问题:
1、任务之间处理时间弹性不足。由于各任务的启动时间是确定的,而各任务的执行时长可能因为环境、数据等变化发生波动。因此,如果上游任务执行时长超过预期,可能下游任务启动时而上游任务没有完成,导致下游数据加工错误;或上游任务执行较快,导致下游任务进行无谓的等待;
2、无法应对异常场景。如果上游数据加工出现异常,加工任务不能自动进行相应的处理,导致下游任务执行时所依赖的数据存在异常,。
(3)调度系统在这样的背景下,任务调度系统应运而生。顾名思义,任务调度系统主要对任务的执行进行调度和管理。调度系统定义任务的规则和属性,对任务的执行顺序和逻辑进行编排,确保任务的高效执行。
2.调度系统基本功能不同的调度系统,其功能不完全相同,但一般都具备以下基本功能:
(游戏人的家1)任务编排管理调度系统最基本的功能是任务的定义和任务编排。
任务定义主要确定数据计算和加工的逻辑和规则,包括任务执行的频次、具体执行时间,对应的执行脚本和参数等内容。
任务编排主要是确定不同任务的先后关系,确保各任务有序进行。任务编排的输出结果是一个DAG图(有向无环图)。图中的任务之中国灵异事件间只有单向的顺序关系,没有形成直接或间接的A依赖于B,同时B又依赖于A的闭环。如:
(2)任务重跑任务执行控制变压器完成后,如果我们发现结果数据存在异常,经过定位分析后确定需要对数据重新处理,此时需要使用任务重跑功能。一般情况下,重跑只让当前任务重新执行一次;特殊场景下,当前任务重跑成功后会紧接着重跑该任务后续的其他任务,保证所有可能受到影响的任务都能得到正确的结果。
同时调度系统还提供了终止任务、暂停任务等其他常用操作。
(3)北师大网络教育历史补数任务创建完成后,调度系统会根协调性训练据其定义的执行频次和具体时间规则,自动处理新的数据。而对于任务创建前已经产生的历史数据,则需要使用历史补数功能。
我们指定需要处理的数据范围(比如前一个月),指定处理这些数据需要使用的的任务,调度系统则会自动根据逻辑将历史数据处理完成。
重跑和历史补数的区别在:历史补数对应的数据从来没有处理过,而重跑处理的数据此前已经处理过至少一次。
(4)日志查看调度系统会及时搜集、保存任务执行过程中的产生早教教材日志信息。我们可以检索和查看任务执行的详细日志。
通过日志查看功能,我们可以方便的了解和查找任务运行的详细记录,为错误排查和定位提供了有力的工具。
(5)运行监控调度系统的运行监控功能,方便我们及时掌握任务的执行状态,以便及时对异常进行干预和处理。
瓷器收藏不同的调度系统其监控方式可能不尽相同。但一般而言,会包括任务执行错误告警及执行延迟告警两种模式。同时还可以在此基础上开发或定制自己的监控策略。
貔貅的传说3、调度系统常见框架调度系统存在自研和使用开ufa源调度框架两种模式。大多数一线互联网企业堕胎婴灵,或具有较强研发能力的企业一般采用自研方式。其他大部分企业一般直接使用开源调度框架。
开源的调度框架,国外常见的有oo三棱锥的外接球zie、Azkaban、airflow等。其中oozie相对比较稳定,功能比较全面,用户也相对比较多。
国内也有企业开始贡献开源框架。时下比较火的有易观数据的Ea辞职理由sySch推荐书格式eduler和阿里的Schedulerx2.0。
4、结语今天简单介绍了调度系统的作用和常用功能,及常见的开源调度框架。
弱视训练调度系统定义了大数据计算和处理的逻辑与规则,对所有任务的执行顺序进行编排管理,实现了任务的有市场营销书籍序和高效执行。同时,调度合肥寿春中学系统可便捷的实现任务的执行、重跑、终止等操作,能方便的查看执行日志,及时监控管理任务执行情况。因此调度系统是整个大数据处理的基石,是任务执行的管理中心。
调度系统的功能和场景,后续我们会单独展开详细探讨。敬请继续关注。
欢迎扫码加入我们的知识星球,这里是数据领域的大V聚集地,这里是我们的人脉圈,这里是我们互帮互助,共同学习提高的小天地!
本文发布于:2023-05-31 22:29:41,感谢您对本站的认可!
本文链接:http://www.ranqi119.com/ge/85/166765.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
留言与评论(共有 0 条评论) |