データ品質管理の具体的な成果物

昨今、データ利活用によって新たな価値を創出することや、コロナ禍で対面での業務が難しくなりアフターコロナ、ウィズコロナのデジタル化された働き方が求められる中で、データ品質=「データが使える状態であること」がますます重要になってきています。

一方で、DMBOKでは、幅広く考え方やアクティビティが記載されているものの、成果物サンプルが少ないため、具体的なイメージが掴みづらい…という声を聞くことがあります。

データモデルなど、手法が確立している(統一されているわけではなくとも)分野はまだ良いとしても、一般的なシステム開発/運用で、あまり馴染みのないデータ品質管理はなかなかイメージがつきづらい分野の一つです。

DAMA日本支部:第8分科会(データ品質に関する研究会)では、実際に手を動かす一助となることを目指して、DMBOKに沿って進めるならどういう成果物を作って行けばよいのか議論しており、2019年に、DMBOK1に基づいた成果物として、データ品質管理を進めるためのワークシートを完成しました。
※下記のリンク先で公開しているので、ご興味のある方は是非ダウンロードいただければと思います。

http://www.dama-japan.org/PublishedMaterials.html

ワークシートの内容についてはDAMA日本支部の会員には総会などでも報告・共有していますが、公開資料としてももう少し解説があるとよいかなと考えており、この場を借りて、少しワークシートの概要を紹介したいと思います。

DQワークシートの概要

ワークシートは4つのシートで構成されています。DMBOK1アクティビティとワークシートの対応関係は下図の通りです。

図:DMBOK1アクティビティとワークシートの対応関係

DMBOK1アクティビティを踏まえて、各シートで記載すべき項目を定義しています。各シートに項目説明がありますのでそちらを参照ください。各シートの概要は下記の通りです。

①ビジネスニーズ整理ワークシート
ビジネスニーズを5W1Hの観点で纏める。ここでは、対象となるデータセットの特定には踏み込まずビジネス視点で必要な情報とその情報に求められる品質要件を纏める。

②DQ管理対象検討ワークシート
具体的に対象データセットを決めて、実データを見た上で、データ品質管理対象を絞り込む。

③DQチェック精緻化ワークシート
データ品質のチェック方法を精緻化して、チェック結果が意図したものになるかビジネス部門とIT部門で確認・合意する。

④検査・レポート運用整備ワークシート
モニタリングとアラート検知時の運用方法を決める。

今後のブラッシュアップ

現在のワークシートVer.1.0はDMBOK1に沿ったものなので、今後は、DMBOK2に沿って、ワークシートをブラッシュアップしていこうとしています。

また、ワークシートを使ってみて、良かった点、改善点などありましたら、フィードバックいただけると嬉しいです。今後に活かしていきたいと思います。どうぞ宜しくお願い致します。