読もうと思ったきっかけは忘れましたが、[2020-12-20-1] の『データマネジメントが30分でわかる本 』のゆずたそさんが共著者だったのもあって購入しました。
この 2 年半、ひとりで広告データ基盤を作ってきた答え合わせや整理が出来た気がしました。
例えば、用語としては知っていたデータレイク、データウェアハウス、データマートが、自分が作ったデータ基盤にも当てはまっており、それほど変な設計ではなかったこと。
規模が大きくないので気にしてなかったけど、Data Lake は https://t.co/H09g5qhlT2、Data Warehouse は BigQuery、Data Mart は Looker になってた / 他14件のコメント https://t.co/IOdFoHOA6J “データ基盤の3分類と進化的データモデリング - 下町柚子黄昏記 by @yuzutas0” https://t.co/8ydWiIXUy3
— マスタカ (@masutaka) November 16, 2022
今の会社のデータ活用成熟度が、どの程度なのかも分かりました。(レベル1でした)
ついでに Airflow がよく使われていると知ったので、ローカルの Docker 環境と GCP の Cloud Composer を少し使ってみるなど。
https://github.com/masutaka/trial-airflow
ひとりもしくは少人数で日々奮闘している人こそ、読むと発見がある本かも知れません。