比较重要的参数:

参数 默认值 说明
airflow_home /home/airflow/airflow01 airflow home,由环境变量$AIRFLOW_HOME决定
dags_folder /home/airflow/airflow01/dags dag python文件目录
base_log_folder /home/airflow/airflow01/logs 主日志目录
executor SequentialExecutor, LocalExecutor, CeleryExecutor executor方式,分别为序列、本地、队列
sql_alchemy_conn sqlite:////home/airflow/airflow01/airflow.db 数据库连接方式
sql_alchemy_pool_size 5 数据库线程池
sql_alchemy_pool_recycle 3600 数据库idle连接回收时间
parallelism 32 executor的并行度,即同时在一个executor上同时运行的task instance个数
dag_concurrency 16 调度器同时可以运行的task instance个数(跟上个参数啥关系?)
max_active_runs_per_dag 16 不懂~
load_examples True 是否载入示例
default_impersonation 当不设置task的用户时,以此用户执行
security 安全验证类似,如kerberos
default_owner airflow operator 绑定的默认用户名
default_cpus 1 operators 使用的cpu
default_ram 512 operators 使用的内存
base_url http://localhost:8080 webserver的URL
web_server_host 0.0.0.0 webserver的IP
web_server_port 8080 webserver的端口
web_server_ssl_cert webserver的certificate路径
web_server_ssl_key webserver的key路径
web_server_worker_timeout 120 gunicorn webserver和worker的超时时间
worker_refresh_batch_size 1 webserver每次检测worker的个数。发现新的worker并杀死旧的worker
worker_refresh_interval |30 webserver检测的时间间隔
access_logfile - webserver日志位置,-指标准输出
error_logfile - webserver日志位置,-指标准输出
expose_config False 是否在页面上显示配置信息
authenticate False webserver是否开始权限验证
filter_by_owner False 通过名称过滤dag,需要开启权限验证。
smtp_host localhost smtp主机
smtp_user smtp上的用户
smtp_password 密码
smtp_starttls True 使用tls协议
smtp_ssl False 使用ssl协议
smtp_port smtp端口
smtp_mail_from 发邮件的账户
celeryd_concurrency 16
broker_url sqla+mysql://airflow:airflow@localhost:3306/airflow celery broker url
celery_result_backend db+mysql://airflow:airflow@localhost:3306/airflow celere result
job_heartbeat_sec 5 Task instances接收外部kill信号(来自cli或者webserver)的时间时隔
scheduler_heartbeat_sec 5 scheduler和task之间的心跳间隔(应该是跟executor)
scheduler_zombie_task_threshold 300 检测僵尸task的时间间隔
catchup_by_default 不懂~

parallelism = number of physical python processes the scheduler can run

dag_concurrency = the number of TIs to be allowed to run PER-dag at once

max_active_runs_per_dag = number of dag runs (per-DAG) to allow running at once* parallelism = number of physical python processes the scheduler can run

  • dag_concurrency = the number of TIs to be allowed to run PER-dag at once
  • max_active_runs_per_dag = number of dag runs (per-DAG) to allow running at once

其它:

https://cwiki.apache.org/confluence/display/AIRFLOW/Common+Pitfalls

2.airflow参数简介的更多相关文章

  1. mqtt------ mosca服务器端参数简介

    一:服务器端 为什么使用mosca:mosca是基于node.js开发,上手难度相对较小,其次协议支持完整,除了不支持Qos 2,其它的基本都支持.持久化支持redis以及mongo.二次开发接口简单 ...

  2. 【ABAP系列】SAP abap dialog screen屏幕参数简介

    公众号:SAP Technical 本文作者:matinal 原文出处:http://www.cnblogs.com/SAPmatinal/ 原文链接:[ABAP系列]SAP abap dialog ...

  3. HOG参数简介及Hog特征维数的计算(转)

    HOG构造函数 CV_WRAP HOGDescriptor() :winSize(64,128), blockSize(16,16), blockStride(8,8),      cellSize( ...

  4. VM参数简介

    http://www.cnblogs.com/yuzhaoxin/p/4083612.html block_dump Linux 内核里提供了一个 block_dump 参数用来把 block 读写( ...

  5. 【转载】va_list 可变参数 简介 va_copy vprintf

    [说明]本文转载自 smart 的文章 http://blog.sina.com.cn/s/blog_590be5290100qhxr.html  及百度百科 va_list是一个宏,由va_star ...

  6. vue路由对象($route)参数简介

    路由对象在使用了 vue-router 的应用中,路由对象会被注入每个组件中,赋值为 this.$route ,并且当路由切换时,路由对象会被更新. so , 路由对象暴露了以下属性: 1.$rout ...

  7. Flask 参数简介

    我们都知道学习了Flask的时候它里面的参数是有很多种的参数  都是需要相互进行调用传递的  今天就简要分析一些常见的参数 首先导入Flask之后看 源码 from flask import Flas ...

  8. logging.basicConfig参数简介

    通过logging.basicConfig函数对日志的输出格式及方式做相关配置 import logging logging.basicConfig(level=logging.DEBUG, form ...

  9. HackRF One硬件架构及参数简介

    本文内容.开发板及配件仅限用于学校或科研院所开展科研实验! 淘宝店铺名称:开源SDR实验室 HackRF链接:https://item.taobao.com/item.htm?spm=a1z10.1- ...

随机推荐

  1. Python基础 条件判断和循环

    pyhton if 语句 if 语句后接表达式,然后用: 表示代码块. age = 20 if age >= 18: print 'your age is', age print 'adult' ...

  2. Win10 64位+VS2015+Opencv3.3.0安装配置

    Win10 64位+VS2015+Opencv3.3.0安装配置 1.我们首先下载VS2015.OpenCV3.3.0. 1.1 VS2015下载 在官网https://visualstudio.mi ...

  3. archLinux 学习笔记--mlocate的安装与使用

    locate - 查找文件的简单方法 locate 程序会执行一次快速的路径名数据库搜索,并且输出每个与给定子字符串相匹配的路径名. 使用时却发现archlinux出现 bash: locate:未找 ...

  4. 一个数据仓库时代开始--Hive

    一.什么是 Apache Hive? Apache Hive 是一个基于 Hadoop Haused 构建的开源数据仓库系统,我们使用它来查询和分析存储在 Hadoop 文件中的大型数据集.此外,通过 ...

  5. php (zip)文件下载设置

    普通下载头大概意思,文件输出的地方二选一,小文件下载.如文件较大时注意执行时间与内存使用.可以看php大文件下载 $filename = $_GET['filename']; $pathname = ...

  6. 2.6 USB摄像头驱动之USB描述符

    学习目标:分析USB摄像头驱动的描述符: 一.USB设备描述符 在usb设备驱动分析那一节,也用到了usb描述符. usb描述符可分为: USB设备描述符(usb_device_descriptor) ...

  7. ruby rspec+jenkins+ci_report持续集成生成junit测试报告

    1.加载ci_report gem install ci_reporter_rspec 2.给测试工程编写rakefile require 'ci/reporter/rake/rspec' requi ...

  8. Python--通过索引excel表将文件进行文件夹分类的脚本+读取指定目录下所有文件名的脚本

    1.通过索引excel表将文件进行文件夹分类的脚本,此脚本由于将ip和id对应并生成对应id的文件夹将文件进行分类,也可以任意规定表格内容,通过vul_sc_ip.txt和xlsx文件进行索引. # ...

  9. [转]Web登录中的信心安全问题

    1. 一个简单的HTML例子看看用户信息安全 标准的HTML语法中,支持在form表单中使用<input></input>标签来创建一个HTTP提交的属性,现代的WEB登录中, ...

  10. scala (5) 可变序列和不可变序列

    /** * 序列分为可变长和不可变长,序列其实就是list,底层是链表结构 * 特点:插入有序,可重复,增加和移除元素很快,查询慢 * 不可变长序列:List * 可变长序列:ListBuffer * ...