小编djo*_*hon的帖子

如何运行简单的气流DAG

我对Airflow完全不熟悉.我想在指定的日期运行一个简单的DAG.我很难在开始日期,执行日期和回填之间做出改变.运行DAG的命令是什么?

这是我以后尝试过的:

airflow run dag_1 task_1 2017-1-23
Run Code Online (Sandbox Code Playgroud)

我第一次运行该命令时,任务执行正确,但是当我再次尝试时它没有用.

这是我跑的另一个命令:

airflow backfill dag_1 -s 2017-1-23 -e 2017-1-24
Run Code Online (Sandbox Code Playgroud)

我不知道这个命令会发生什么.DAG每天会从23点到24点执行吗?

在运行上面的两个命令之前,我这样做了:

airflow initdb
airflow scheduler 
airflow webserver -p 8085 --debug &
Run Code Online (Sandbox Code Playgroud)

这是我的DAG

from airflow import DAG
from airflow.operators.bash_operator import BashOperator
from datetime import datetime, timedelta
default_args = {
    'owner': 'airflow',
    'depends_on_past': False,
    'start_date': datetime(2017, 1, 23, 12),
    'email': ['airflow@airflow.com'],
    'email_on_failure': False,
    'email_on_retry': False,
    'retries': 1,
    'retry_delay': timedelta(minutes=5),
}

dag = DAG(
    'dag_1', default_args=default_args, schedule_interval=timedelta(1))

t1 = BashOperator(
    task_id='create_clients',
    bash_command='Rscript /scripts/Cli.r',
    dag=dag)

t2 = …
Run Code Online (Sandbox Code Playgroud)

python airflow

14
推荐指数
2
解决办法
3万
查看次数

如何指定诗歌的存储库分支?

我的项目 A 带有这样的 pyproject 文件

[tool.poetry]
name = "projectA"
version = "2.0"
description = "Package gathering for project A"
repository = "https://git.saas.tech/project-a"
[tool.poetry.dependencies]
Package B = "1.0"
Run Code Online (Sandbox Code Playgroud)

我想测试一个功能。我如何告诉诗歌查看特定的分支?这可能吗 ?

repository = "https://git.saas.tech/project-a/my-feature"   
Run Code Online (Sandbox Code Playgroud)

python python-poetry

7
推荐指数
1
解决办法
9516
查看次数

有没有一个Python模块可以用pyarrow读取avro文件?

我知道有 pyarrow.parquet 用于将镶木地板文件读取为箭头表,但我正在寻找 avro 的等效项?

apache-arrow pyarrow

5
推荐指数
1
解决办法
2568
查看次数

Spark SQL是否区分大小写?

看起来spark sql对于“ like”查询区分大小写,对吗?

spark.sql("select distinct status, length(status)  from table")
Run Code Online (Sandbox Code Playgroud)

退货

Active|6

spark.sql("select distinct status  from table where status like '%active%'")
Run Code Online (Sandbox Code Playgroud)

无值返回

spark.sql("select distinct status  from table where status like '%Active%'")
Run Code Online (Sandbox Code Playgroud)

退货

 Active
Run Code Online (Sandbox Code Playgroud)

sql apache-spark apache-spark-sql

2
推荐指数
1
解决办法
1889
查看次数