データ基盤では「大量のデータを集める」ことよりも「正しいデータを維持する」ことが最重要です。Databricksでは NOT NULL, CHECK, UNIQUE といったSQL標準の制約に加え、Expectation句(DLTの品質ルール) を利用してデータ品質を担保できます。 NOT NULL:必須項目 ...
SQLのJOINが複雑になる構造的な理由と、それを解決するセマンティックデータグラフという新しいアプローチ データモデリングツールの「分断問題」――BIツールでは便利なのにSQLユーザーが恩恵を受けられない矛盾と、その解決策 Shute, J., Zheng, C., & Kudtarkar, R.