non*_*ono 16 airflow apache-airflow
我的问题:
fer*_*sjp 10
我也想与其他人一起对文件夹结构进行基准测试。也许这取决于您使用Airflow的用途,但我会与您分享我的情况。我正在做数据管道以建立数据仓库,因此从高层次上讲,我基本上有两个步骤:
今天,我将文件组织到三个主要文件夹中,这些文件夹试图反映上述逻辑:
??? dags
? ??? dag_1.py
? ??? dag_2.py
??? data-lake
? ??? data-source-1
? ??? data-source-2
??? dw
??? cubes
? ??? cube_1.sql
? ??? cube_2.sql
??? dims
? ??? dim_1.sql
? ??? dim_2.sql
??? facts
??? fact_1.sql
??? fact_2.sql
Run Code Online (Sandbox Code Playgroud)
这或多或少是我的基本文件夹结构。
我用这样的东西。
示例树:
????dags
? ????common
? ? ????hooks
? ? ? pysftp_hook.py
? ? ?
? ? ????operators
? ? ? docker_sftp.py
? ? ? postgres_templated_operator.py
? ? ?
? ? ????scripts
? ? delete.py
? ?
? ????project_1
? ? ? dag_1.py
? ? ? dag_2.py
? ? ?
? ? ????sql
? ? dim.sql
? ? fact.sql
? ? select.sql
? ? update.sql
? ? view.sql
? ?
? ????project_2
? ? dag_1.py
? ? dag_2.py
? ?
? ????sql
? dim.sql
? fact.sql
? select.sql
? update.sql
? view.sql
?
????data
????project_1
? ????modified
? ? file_20180101.csv
? ? file_20180102.csv
? ?
? ????raw
? file_20180101.csv
? file_20180102.csv
?
????project_2
????modified
? file_20180101.csv
? file_20180102.csv
?
????raw
file_20180101.csv
file_20180102.csv
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
5104 次 |
| 最近记录: |