2.airflow参数简介
比较重要的参数:
| 参数 | 默认值 | 说明 |
|---|---|---|
| airflow_home | /home/airflow/airflow01 | airflow home,由环境变量$AIRFLOW_HOME决定 |
| dags_folder | /home/airflow/airflow01/dags | dag python文件目录 |
| base_log_folder | /home/airflow/airflow01/logs | 主日志目录 |
| executor | SequentialExecutor, LocalExecutor, CeleryExecutor | executor方式,分别为序列、本地、队列 |
| sql_alchemy_conn | sqlite:////home/airflow/airflow01/airflow.db | 数据库连接方式 |
| sql_alchemy_pool_size | 5 | 数据库线程池 |
| sql_alchemy_pool_recycle | 3600 | 数据库idle连接回收时间 |
| parallelism | 32 | executor的并行度,即同时在一个executor上同时运行的task instance个数 |
| dag_concurrency | 16 | 调度器同时可以运行的task instance个数(跟上个参数啥关系?) |
| max_active_runs_per_dag | 16 | 不懂~ |
| load_examples | True | 是否载入示例 |
| default_impersonation | 当不设置task的用户时,以此用户执行 | |
| security | 安全验证类似,如kerberos | |
| default_owner | airflow | operator 绑定的默认用户名 |
| default_cpus | 1 | operators 使用的cpu |
| default_ram | 512 | operators 使用的内存 |
| base_url | http://localhost:8080 | webserver的URL |
| web_server_host | 0.0.0.0 | webserver的IP |
| web_server_port | 8080 | webserver的端口 |
| web_server_ssl_cert | webserver的certificate路径 | |
| web_server_ssl_key | webserver的key路径 | |
| web_server_worker_timeout | 120 | gunicorn webserver和worker的超时时间 |
| worker_refresh_batch_size | 1 | webserver每次检测worker的个数。发现新的worker并杀死旧的worker |
| worker_refresh_interval |30 | webserver检测的时间间隔 | |
| access_logfile | - | webserver日志位置,-指标准输出 |
| error_logfile | - | webserver日志位置,-指标准输出 |
| expose_config | False | 是否在页面上显示配置信息 |
| authenticate | False | webserver是否开始权限验证 |
| filter_by_owner | False | 通过名称过滤dag,需要开启权限验证。 |
| smtp_host | localhost | smtp主机 |
| smtp_user | smtp上的用户 | |
| smtp_password | 密码 | |
| smtp_starttls | True | 使用tls协议 |
| smtp_ssl | False | 使用ssl协议 |
| smtp_port | smtp端口 | |
| smtp_mail_from | 发邮件的账户 | |
| celeryd_concurrency | 16 | |
| broker_url | sqla+mysql://airflow:airflow@localhost:3306/airflow | celery broker url |
| celery_result_backend | db+mysql://airflow:airflow@localhost:3306/airflow | celere result |
| job_heartbeat_sec | 5 | Task instances接收外部kill信号(来自cli或者webserver)的时间时隔 |
| scheduler_heartbeat_sec | 5 | scheduler和task之间的心跳间隔(应该是跟executor) |
| scheduler_zombie_task_threshold | 300 | 检测僵尸task的时间间隔 |
| catchup_by_default | 不懂~ |
parallelism = number of physical python processes the scheduler can run
dag_concurrency = the number of TIs to be allowed to run PER-dag at once
max_active_runs_per_dag = number of dag runs (per-DAG) to allow running at once* parallelism = number of physical python processes the scheduler can run
- dag_concurrency = the number of TIs to be allowed to run PER-dag at once
- max_active_runs_per_dag = number of dag runs (per-DAG) to allow running at once
其它:
https://cwiki.apache.org/confluence/display/AIRFLOW/Common+Pitfalls
2.airflow参数简介的更多相关文章
- mqtt------ mosca服务器端参数简介
一:服务器端 为什么使用mosca:mosca是基于node.js开发,上手难度相对较小,其次协议支持完整,除了不支持Qos 2,其它的基本都支持.持久化支持redis以及mongo.二次开发接口简单 ...
- 【ABAP系列】SAP abap dialog screen屏幕参数简介
公众号:SAP Technical 本文作者:matinal 原文出处:http://www.cnblogs.com/SAPmatinal/ 原文链接:[ABAP系列]SAP abap dialog ...
- HOG参数简介及Hog特征维数的计算(转)
HOG构造函数 CV_WRAP HOGDescriptor() :winSize(64,128), blockSize(16,16), blockStride(8,8), cellSize( ...
- VM参数简介
http://www.cnblogs.com/yuzhaoxin/p/4083612.html block_dump Linux 内核里提供了一个 block_dump 参数用来把 block 读写( ...
- 【转载】va_list 可变参数 简介 va_copy vprintf
[说明]本文转载自 smart 的文章 http://blog.sina.com.cn/s/blog_590be5290100qhxr.html 及百度百科 va_list是一个宏,由va_star ...
- vue路由对象($route)参数简介
路由对象在使用了 vue-router 的应用中,路由对象会被注入每个组件中,赋值为 this.$route ,并且当路由切换时,路由对象会被更新. so , 路由对象暴露了以下属性: 1.$rout ...
- Flask 参数简介
我们都知道学习了Flask的时候它里面的参数是有很多种的参数 都是需要相互进行调用传递的 今天就简要分析一些常见的参数 首先导入Flask之后看 源码 from flask import Flas ...
- logging.basicConfig参数简介
通过logging.basicConfig函数对日志的输出格式及方式做相关配置 import logging logging.basicConfig(level=logging.DEBUG, form ...
- HackRF One硬件架构及参数简介
本文内容.开发板及配件仅限用于学校或科研院所开展科研实验! 淘宝店铺名称:开源SDR实验室 HackRF链接:https://item.taobao.com/item.htm?spm=a1z10.1- ...
随机推荐
- 在VSCode使用Markdown绘制UML图
在VSCode使用Markdown绘制UML图 需要插件 Markdown All in One Markdown Preview Enhanced PlantUML markdownlint Mar ...
- Xquery的初步学习(一次Lab作业的总结)
Task 1: Open countries.xml, compose the following XQueries: 1. Return the area of Mongolia. 2. Retur ...
- Redis之Redis消息订阅发布简介
概念: Redis消息订阅发布是进程间的一种消息通信模式,发送者pub发送消息,订阅者sub接收消息. 使用须知: 需要先订阅后发布,才能接收到消息.在订阅时,相当于创建了可供发布的频道. 案例: ( ...
- 利用.htaccess文件将多个子域名解析至对应的子目录
对于不支持子域名解析但是支持 .htaccess 的主机来说,这个功能就非常有用了 假设有主域名 ppios.com,子域名 yspx.ppios.com 和 ask.ppios.com,设置结果为访 ...
- Java实例 Part3:流程控制
目录 Example01:判断某一年是否为闰年 Example02:验证登录信息的合法性 Example03:判断用户输入月份的季节 Example04:使用while循环语句与自增运算符循环遍历数组 ...
- docker swarm实现java项目的发布/滚动更新/回滚/镜像管理
使用docker swarm滚动更新java项目,部署集群,这一切的前提是使用Jenkins+maven进行项目打包,分发等功能 具体可以参考我的另外三篇文章 https://www.cnblogs. ...
- 虚拟机内安装Centos7步骤
下面就来看看怎么安装centos7,首先就是要准备一个虚拟机了 简称VM,当然虚拟机的安装步骤,我也不再多说,我用的Workstation 15 Pro的版本,我们直接打开虚拟机,打开界面如下: 在安 ...
- HTML5新增元素,标签总结
总是遇到h5新标签的笔试题目,就查阅了资料来总结一下: 1.form相关: (1)form属性:在HTML5中表单元素可放在表单之外,通过给该元素添加form属性来指向目标表单(form属性值设为目标 ...
- R语言学习笔记—朴素贝叶斯分类
朴素贝叶斯分类(naive bayesian,nb)源于贝叶斯理论,其基本思想:假设样本属性之间相互独立,对于给定的待分类项,求解在此项出现的情况下其他各个类别出现的概率,哪个最大,就认为待分类项属于 ...
- Could not connect to '192.168.80.145' (port 22): Connection failed的解决办法(远程连不上xshell)
问题状况表现1 这个问题一般是你 的什么配置影响了虚拟机的网卡网关设置!!!. 问题状况表现2 这个问题一般是你 的什么配置影响了虚拟机的网卡网关设置. 解决办法 网上的那些解决方案,我都试过,比如. ...