Airflow学习笔记

news/2024/5/19 13:57:00/文章来源:https://blog.csdn.net/zhangliushi/article/details/127120790

CSDN话题挑战赛第2期
参赛话题:学习笔记

  • 项目中解决的问题

使用airflow调度hive脚本跑批任务

  • 视频教程上整理知识点

学习视频:https://www.bilibili.com/video/BV1V7411K7Gy?p=40&vd_source=b002288652bae647c598ddf77f79a7b8

  1. Airflow基本概念
    Airflow是Airbnb内部发起的一个工作流管理平台。使用Python编写实现的任务管理,调度,监控工作流平台。Airflow的调度依赖于crontab命令,与crontab相比Airflow可以方便查看任务的执行状况(执行是否成功、执行时间、执行依赖等),可追踪任务历史执行情况,任务执行失效使可以收到邮件通知,查看错误日志。对管理调度任务有很大的帮助。
    Airflow官网
  2. 涉及名称解释
    (1)DAG:有向无环图(Directed Acyclic Graph),DAG用于描述数据流的计算过程。
    (2)Operators:描述了DAG中一个具体task要执行的任务,如BashOperator为执行一条bash命令,EmailOperator用于发送邮件,HTTPOperator用于发送HTTP请求,PythonOperator用于调用任意的Python函数。
    (3)Task:是Operator的一个实例,也就是DAG的一个节点。
    (4)Task Instance:记录task的一次运行。Task Instance有自己的状态,包括“running”、“success”、“failed”、“skipped”、“up for retry”等。
    (5)Triggher Rules:指task的触发条件。
  3. 主要功能模块
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
  4. 工作流调度之DAG脚本参数配置
    (1)depends_on_past:是否依赖上游任务,即上一个调度任务执行失败时,该任务是否执行。可选项包括“True”和“False”,False表示当前执行脚本不依赖上游执行任务是否成功。
    (2)start_date:表示首次任务的执行日期。
    (3)email:设定当任务出现失败时,用于接受失败告警邮件的邮箱地址。
    (4)email_on_failure:当任务执行失败时,是否发送邮件。可选项包括“True”和“False”,True表示失败时发送邮件。
    (5)retries:表示执行失败时是否重新调起任务执行,1表示会重新调起1次。
    (6)retry_delay:表示重新调起执行任务的时间间隔。
    (7)priority_weight:权重,越大则代表在所有dag中执行的优先级越高。
    (8)schedule_interval:调度时间间隔,下图’30 2,4,18 * * *'表示2点30分,4点30分和18点30分各调度1次。

在这里插入图片描述

  • 生产中的注意点
  1. 需要单独跑某个任务时,可以选择该任务后点击Ignore All Deps,再选择Run,参考下图。
  2. DAG脚本中start_date与schedule_interval相互联系,如果改了schedule_interval,脚本会从start_date的日期开始执行,如果不需要从头跑,记得要一起改start_date。
  3. schedule_interval参数为crontab执行时间,一般有五个*,第一个*代表分钟,第二个*代表小时,*号之间以空格隔开。可以使用小工具转译 https://www.iamwawa.cn/crontab.html

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_20727.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【VUE2开发20221004】-day1.0

目录测试案例1:Vue常见指令:1、插值表达式2、v-bind指令v-bind指令注意事项简写v-bindv-bind属于单向绑定(JS修改->HTML修改)3、v-model指令v-model常用标签4、v-for指令5、v-on事件前端开发教程链接 vuejs官方教程 框架&…

刷题笔记-栈帧

例题1 阅读如下C代码片段(其中Y表示代码指令地址): void overflow(char* pShellcode, int iLen) { Y1:char buffer[8]; Y2: memcpy(buffer, pShellcode, dwLen); Y3: „„ } Y4: int main() { Y5: „„ Y6: overflow("123…

多处理机的基本概念

本文内容是作者在进行计算机组成原理复习的时候,用王道的视频做笔记或者保存图的内容。后续如果看了其他书或者有其他理解会进行增加内容。 SISD(单指令流数据流) 特性:各指令序列只能并发、不能并行,每条指令处理一…

Prophet算法

Prophet简介 Prophet是FaceBook公司在2017年开源的一款时间序列建模工具。Prophet的方法是将时间序列看成是关于t的一个函数,用你和函数曲线的方法进行预测,所以这和传统的时间序列模型有本质上的区别,他更倾向于机器学习的建模方式。 Prop…

PO/PI

典型集成场景 PI总体架构

浅学设计模式(二)

目录: (1)工厂模式 简单工厂: 工厂方法模式: (2)抽象工厂模式 (1)工厂模式 简单工厂: 原来的方式使用new: 需要关心细节,如何创建对…

独家分享 圆梦阿里之后,我得到了这份SpringCloud Alibaba源码文档

Spring Cloud Alibaba为分布式应用开发提供了一站式解决方案。它包含开发分布式应用程序所需的所有组件,可以轻松地使用Spring Cloud开发应用程序。 使用Spring Cloud Alibaba,只需添加一些注解和少量配置,即可将Spring Cloud应用连接到Alib…

Spring 4 IOC 相关内容 4.2 bean 实例化 3 实例工厂实例化

Spring 【黑马程序员2022新版SSM框架教程_SpringSpringMVCMaven高级SpringBootMyBatisPlus企业实用开发技术】 4 IOC 相关内容 文章目录Spring4 IOC 相关内容4.2 bean 实例化4.2.5 实例工厂与FactoryBean4.2.6 bean 实例化小结4.2 bean 实例化 4.2.5 实例工厂与FactoryBean …

Python学习笔记(四)——字符串与文本处理2

目录 字符串函数大合集 两端删除函数strip() 删除空白字符 删除两端指定字符 右端删除函数rstrip() 左端删除函数 字符串对齐 返回指定宽度字符串center() 原字符串居中对齐、左对齐、右对齐 字符串开始或结束符判定startswith()、endswith() 内置函数eval()&#x…

web期末作业设计网页 html+css+js制作非物质文化遗产坝漆国漆 2页

🌩️ 精彩专栏推荐👇🏻👇🏻👇🏻 💂 作者主页: 【进入主页—🚀获取更多源码】 🎓 web前端期末大作业: 【📚HTML5网页期末作业 (1000套…

鉴源论坛丨民用飞机机载软件是如何表明适航符合性的

作者 | 蔡喁 上海控安可信软件创新研究院副院长 版块 | 鉴源论坛 观擎 01 机载软件的基本特征 机载计算机在现代飞机各组成部分中占有举足轻重的位置,是现代航空电子系统的基础和核心,其研制、生产和应用水平已成为衡量飞机先进性的重要标志。机载计…

【面试题】Java基础 2

若你困于无风之地,我将为你奏响高空之歌 文章目录一、int 和 Integer 对象1. int 和 Integer 对象的区别2. 变量比较问题:二、反射1. 反射机制定义2. 反射的使用步骤3. 一个小栗子4. 反射的应用一、int 和 Integer 对象 1. int 和 Integer 对象的区别 …

css 特效实现方法

背景渐隐 通过 before 线性渐变遮盖掉一部分图片 视察滚动实现方式: 监听浏览器滚动事件改变各个层的top值 环形进度条 svg circlestroke-dasharray 环绕边框动画 四个单向运动的动画父框overflow: hidden;设置延迟可表现循环 一些旋转曲线的图形 inset背景扩…

一维无界的自由波动问题-达朗贝尔行波解

回顾 第一个例子 表示热能的扩散,在空间有不同的取值,随空间和时间而变化,左端是跟一个恒温为0的热源接触,我们表示为,这个叫恒温条件。右端我们跟一个绝热的材料接触,傅里叶发现了热传导规律,K叫做热传导…

Java学习笔记 --- 面向对象之多态

一、基本介绍 方法或对象具有多种形态,是面向对象的三大特征,多态是建立在封装和继承之上的 二、多态的具体体现 1、方法的多态: 重写和重载就体现多态 案例演示: package com.javase.poly_;public class PloyMethod {publi…

最新案例 | 昇思MindSpore携手信大网御推出中原AI反诈骗创新解决方案,为全民反诈筑牢防火墙

近日,河南信大网御科技有限公司的中原人工智能反诈骗创新解决方案与华为Atlas 800训练服务器和全场景AI框架昇思MindSpore完成兼容性测试。该方案基于昇腾AI基础软硬件平台,能够在短时间内对涉诈网址/APP进行识别,识别准确率高达99%。 据2021…

嵌入式开发为什么用C语言

有了解过嵌入式开发的人都会想要多去了解一些嵌入式方面的信息,那么既然是嵌入式开发肯定是要你会代码的,至于这些可能你还不是很了解,下面可以一起来了解下嵌入式开发为什么用C语言吧。 点击获取1V1嵌入式学习规划,现在还送100G精…

牛客网刷题-两个队列实现栈

✅作者简介:嵌入式入坑者,与大家一起加油,希望文章能够帮助各位!!!! 📃个人主页:rivencode的个人主页 🔥系列专栏:《牛客网刷题》 💬推…

字节跳动测试岗面试挂在2面,我复盘总结了失败原因,决定再战一次

先说下我基本情况,本科不是计算机专业,现在是学通信,然后做图像处理,可能面试官看我不是科班出身没有问太多计算机相关的问题,因为第一次找工作,字节的游戏专场又是最早开始的,就投递了&#xf…

Chain of Responsibility(责任链模式)

责任链模式一、概述二、结构三、适用场景四、优缺点五、实例一、概述 描述:如组长不能处理的金额,需要向经理请求,经理不能请求的需要向老板请求,这样就现成了一条链,每个级别都能处理这金额。而不是直接组长向老板请…