ワークフローオーケストレーション入門
![](https://s3.ap-northeast-1.amazonaws.com/wraptas-prod/layerx/d958d411-8cf0-4b0f-ac4d-2abac03763d7/9be8a5d483f20a97d377dd5c21e1c9e6.png)
概要
- 123ページの大作
- ワークフローオーケストレーションの歴史的な話もあって面白かった
- cron → RDB → DWH → Hadoop, DataLake → Hadoopのオーケストレーションツール登場 → モダンデータスタック
- モダンデータスタック
- 従来の課題を解決しようとする技術トレンドの総称
- ワークフローツールの機能
![](https://s3.ap-northeast-1.amazonaws.com/wraptas-prod/layerx/164eccc9-088b-415d-ad7f-09f8a045bff8/b7aeddf3d7880476028cf60d875e74e6.png)
- 6つのワークフローツールを比較している
- AirFlow、PREFECT、digdag、dagster、argo 、AWS Step Functions
- 実装コード例、UIなども書かれている
- DigDagからPrefectに移行した事例も
- ML系タスクをDigDagやStep Functionsで書こうとすると巨大yamlやjsonを見ることになるので、認知負荷高いのは分かりみが深かった