DWHにおけるデータモデル 定番から最新トレンドまで

 

概要

  • データモデリングについて歴史的背景から最新までを詳しくまとめられている
  • ファクトテーブルとディメンションテーブルに分けるスタースキーマなど
    • 難しい言葉を使っているが、要するに購買履歴とかだったら、historyテーブルとmeta情報のテーブル分けましょうねみたいな話
  • 最近だと全部が結合された状態にして扱いやすくするワイドテーブルがあったりする
    • 現代だとストレージ費用は安い。JOINが発生しないのでパフォーマンスがいい。ユーザ理解が高い。これの情報どっから取ってきてどう結合するんですか?みたいな余分なコミュニケーションが生まれない。
  • ワイドテーブルの拡張性とかをどう担保するか的な話がData Vault
    • dbtが基本的にこの思想