DQMワークシート チュートリアル資料のご紹介

DQMワークシートのチュートリアル資料とは

第8分科会では、DMBOKのデータクオリティマネジメントについて、「DMBOKのアクティビティに沿って活動すると具体的な成果物イメージはどうなるのか?」ということで、成果物としてのワークシートを整備してきました。
成果物の公開ページ

こちらについては、以前のブログで概要と一部のシートについてご紹介しています。よろしければご参照ください。
データ品質管理の具体的な成果物
データ品質管理の具体的な成果物(その2)

ワークシートの整備自体は数年前に完了しましたが、「どう埋めていくのかわかりづらいのでは?」という声もあり、最近の第8分科会ではワークシートのチュートリアル資料を整備してきました。 今回はそのチュートリアル資料をご紹介したいと思います(資料自体はワークシートと同じ 成果物の公開ページ からダウンロード可能です)。

チュートリアル資料の内容

チュートリアル資料の目次とワークシートは下図のように対応しています。
冒頭のオーバービューでの全体説明以降は、DQMワークシートと対応した章立てになっています。

Step1~4の各章では、それぞれのワークシートの概説として、作業概要や項目間のインプット-アウトプットの関係を示してから、作業ブロック(1つのタスクで検討する項目群)について、どのような検討を行い、どのような観点で項目を記載するのかを解説しています。
資料の基本的な構成は下記の通りです。

チュートリアル資料を見ながらワークシートに沿って検討を進めることで、ワークシートだけで見るよりも前作業とのつながりや検討上の注意点が分かりやすくなっているのではないかと思います。

また、各作業に関わる考慮点や検討内容のイメージなどをTipsとして盛り込んでいます。
例えば、Step4の運用整備に関するTipsとしては下記のようなフローのイメージを付けています。

もちろん、このTipsについては、組織によって役割分担や責任範囲の考え方が違うのであくまでも例となりますが、こうしたTipsはデータクオリティマネジメントに取り組む際の検討のヒントになるのではないかと考えています。

是非ご活用ください!

今回ご紹介したチュートリアル資料とワークシートは、DAMA日本支部のHPで無料公開しています。 DMBOKだけではつかみづらい具体的な成果物イメージを整理してきていますので、 これからデータクオリティマネジメントに取り組まれようとされている方に是非ご活用いただければ幸いです。

最後に、この場を借りて、今回のチュートリアル資料作成にご協力いただいた第8分科会のメンバーの方々に感謝をしたいと思います。
ありがとうございました!

EDW2022が無料オンライン開催に

オミクロン株が引き続き猛威を振るっています。国際的なデータマネジメントのカンファレンスであるEnterprise Data World(EDW)もパンデミックの影響で今年はオンライン開催となりました。

ご存知の方もいらっしゃるかと思いますが、EDWは例年3-4月に5日間程度、シカゴやオースティンなどのアメリカの各都市でローテーションして開催されている1000人規模のカンファレンスです。今年は3月下旬にサンディエゴでの開催が予定されていました。が、パンデミックでリアル開催を断念せざるを得ず、4/19-20の2日間のオンライン開催となりました。しかも無料です。

一刻も早いパンデミックの収束を願うばかりですが、一方で日本から参加しやすい状況ではあります。

リアルタイムでは日本時間だと23:00-翌6:00と深夜から朝にかけての視聴しづらい時間帯かもしれません。しかし、登録ページによると、無料登録するとレコーディングを視聴することもできるようなので、費用やスケジュール上、今まで参加を諦めていた方にもチャンスだと思います。元々のプログラムからは縮小されるものの、それでも40ほどのセッションがあります(スポンサーセッションも含む)。

下表にオンライン開催のプログラムで予定されているセッション数をトラックごとに集計してみました。今回のセッション数が絞られているので単純比較はできませんが、参考までに2020,2021と並べてみています。

比べてみると、引き続きデータガバナンス、データストラテジー、メタデータが上位に入っています。また、2020で上位に入っていたデータリーダーシップも再び順位を上げています(データリーダーシップについてはこちらの過去記事で紹介されています)。

そして、2022の特徴としてはデータリテラシーが順位を上げて2番目に入っていることが分かります。データリテラシーと一口に言っても、セッション内容はデータの見せ方やデータのビジネスコンテキストの理解、組織的な変化の必要性とバラエティがありそうです。ですが、根底としてはデータをどう価値に変えていくか、戦略やガバナンスが重要なのはもちろんのこととして、データの理解や扱いに関してもっと成熟する必要がある、という意識が強くなってきているような印象を受けます。

無料ですし、オンライン開催なので1週間休みをとるのは厳しい、、、という方にも敷居が低くなっているのではないかと思います。良い機会なので、興味のあるセッションがないか、ちょっとプログラムを覗いてみてはいかがでしょうか?

ちなみにDAMA日本支部の林会長のセッションは、4/20 7:00-7:50(日本時間だと4/20 23:00-23:50)に予定されています。
是非、視聴をご検討いただければと思います。

DAMA日本支部の学生会員

今回はDAMA日本支部の学生会員について書きたいと思います。

まだまだあまり利用されていないのですが、実はDAMA日本支部では学生の会員は会費無料です。支部規約ではこんな風に決められています。

———————-
8.会費
4. 個人会員の年会費を、10,000円とする。ただし、学生は無料とする。ここで言う学生とは、未就労の大学院生以下を指す。
(DAMA日本支部規約の全文はコチラ
———————-

もともとの支部規約では学生向けの優遇措置は特にありませんでした。しかし、理事会で会員のダイバーシティを促進するための議論があり、2019年度に規約が改定されました。これから社会人になっていく学生にデータマネジメントに触れる機会、「こういう分野があるんだ」と知る機会としてもっとご活用いただきたい制度です。

2020年度からプログラミング教育が小学校でも必修となりましたが、そのねらいはIT業界で働く人材を増やすというよりも、どんな職業でもITを使いながら課題解決を図る力としてプログラミング的思考を育成するというものです。
今後、どんな職業であってもデータを活用しながら課題解決をしていくと考えると、データマネジメント的な思考も間違いなく必要になってくるのはないかと思います。

以前、データガバナンスの導入にあたって、会社としてのデータに対する基本的な考え方、関係者の方向性を合わせるためにデータマネジメント方針の策定をご支援したことがあります。その方針の中では、データは自分の業務だけで使えれば良いのではなく、他の領域や横断的な判断のために活用できることを意識する、またIT側だけの話ではなく業務側も含めた話であるという考え方を込めて「データマネジメントはみんなの務めである」という趣旨の記載を含めることになりました。実際にデータマネジメント施策を推進、普及、定着させていくには専門家はもちろん、様々な立場の人が携わっていくことになります。

現在、企業等にデータマネジメントが段々と普及していっています。学生の間にこの分野に触れることによって、データマネジメントを担う人材がもっと増えていってほしいと思います。さらに将来的には専門家だけでなくデータマネジメント的な思考を持つ人が増え、組織横断的なデータマネジメント施策の推進もしやすくなっていくということを期待したいと思います。

やや話を広げすぎたかもしれませんが、もし、データマネジメントに興味がある学生のお知り合いがいらっしゃいましたら、ぜひ入会の検討を勧めていただければ幸いです。

ESGとデータマネジメント

昨今、ESG(環境(Environment)、社会(Social)、ガバナンス(Governance))への取り組みを強化する企業が増えてきています。

今まで、ESGとデータマネジメントはあまりつなげて捉えていなかったのですが、先日、ESGへの取り組みはデータ活用とも言える、という話を耳にする機会があり、認識を新たにしました。ということで、今回はESGとデータマネジメントについて書いてみたいと思います。

まず、ESGへの取り組みが強化されている背景ですが、機関投資家にESG投資という考え方が浸透してきたことがあります。これは、財務情報だけでなく、ESGへの取り組みも考慮した投資の方法で、企業の財務利益とESG活動を相反するものとして捉えていないことが特徴です。ESGに取り組んでいる企業の方が、中長期的な業績が良くなる&リスクが低いという考え方をとっています。

では、こうしたESG投資の際に、投資家はどのようなデータを活用しているのか。ここでは、投資家へのデータ公開の媒体の一つである統合報告書を見てみたいと思います。

統合報告書は、企業が、財務資本だけでなく、知的資本、人間資本、社会関係資本、自然資本といった非財務の資本も含めて、どのように長期的に価値を創造していくかを説明するもので、非財務の指標の例としては、下記のようなものがあります。

CO2排出量
社外取締役比率
女性取締役比率
離職率
、、、

上記はごくごく一部ですが、すぐにデータとしてとれそうなものと、そうでないものがあるのではないでしょうか。さらに、すぐにデータがとれそうな部門とそうでない部門があるかもしれません。

CO2排出量について考えると、物流、工場の生産、拠点の電力消費、グリーン調達など、企業全体で出そうとすると、多くの部門に関連する指標になります。

実態を表す、一貫性のある品質の高いデータを元にすることで、投資家もさることながら、自社の長期的な価値創造のためによりよい意思決定ができるようになるはずです。

部門横断でデータを収集・統合し、品質の高いデータをアウトプットする、、、データマネジメントの知識、技術が多いに役立つのではないかと思います。

最後に、従来、環境に関する活動は、利益とは反するが、企業の責任として実施すべき、という考えが一般的だったと思います。今更ですが、大分様相が変わってきており、良い方に動いているなと感じています。一過性のブームではなく、定着した考え方になっていくことを期待しています。

データ品質管理の具体的な成果物(その2)

前回私が担当したブログでは、第8分科会で整理しているDQワークシートの概要をご紹介しました。今回は、その中でも「ビジネスニーズ整理ワークシート」にフォーカスしてご紹介したいと思います。
(※DQワークシートはこちらよりダウンロードいただけます)

実は、第8分科会でワークシートの議論を進める中で、最も時間がかかったのがこの「ビジネスニーズ整理ワークシート」です。

ビジネス要件を品質要件に落としていく部分は、DMBOK1の記述でも抽象度が高く、様々な議論がありましたが、何かしら軸になる整理の仕方が必要ということで、「5W1H」の観点をベースに据えて定義すべき項目を整理しています。

ビジネスニーズ整理ワークシート

このワークシートでは、下記の要素を整理していきます。

  1. ビジネスニーズ(Why/What)
  2. 業務プロセス(Where/When)
  3. 業務プロセス関連組織/担当者(Who)
  4. 情報要求(What)
  5. データ品質要件(How)

今回は、 1.ビジネスニーズ、4.情報要求、5.データ品質要件に触れて、メインの流れをご説明していきます。

ビジネスニーズ(Why/What)

まず、背景、目的とビジネス観点での要求事項を明らかにします。実現したいことを理解する上で、背景や目的が重要なのはもちろんですが、では、要求事項はどの程度まで明らかにすれば良いのでしょうか。

ワークシートのサンプルでは下記のように定義しています(一部抜粋)。

  • 背景:改正派遣法の遵守
  • 目的:客先に派遣する社員に対するキャリア形成制度を維持すること
  • 要求事項:新入社員は3年連続で技術系の研修(8h/年)を受講しなければならない
    →技術系の研修で8h/年を満たしていない該当年次者が居ないこと

要求事項をデータ品質要件につなげていくためには、ここで、必要な情報の「範囲」と「粒度」をある程度明らかにする必要があります。サンプルの要求事項からは下記が読み取れると思います。

  • 範囲:
    • 入社3年目までの社員
    • 年間の研修時間
  • 粒度:
    • 社員個人
    • 研修の分類(技術系など)×時間数(h)

このくらいまで定義できれば、求められる情報が具体的にイメージできるかと思います。

情報要求(What)

要求事項を満たすために必要な情報を整理します。最終的にはデータ品質管理はカラムをベースに実施していくことになるので、一つの要求事項を満たすために必要な情報について項目をイメージしながら分解し、定義していきます。上記のように情報の範囲と粒度を意識すると、定義しやすいと思います。サンプルでは下記のように定義しています(一部抜粋)。

  • 受講者個人を特定できること
    • 社員の年次が正しいこと
    • 研修が技術系/ヒューマン系のいずれかがわかること
    • 受講年度単位の研修時間がわかること

この段階では、特定のデータセットに引きずられないように、業務的に必要な情報の定義にとどめます。要求に適したデータセットを探すのは後続のワークシートで実施します。

データ品質要件(How)

1つの情報要求に対して、データ品質評価軸(正確性、完全性、・・など)を当てて、データ品質の観点から求められることを洗い出します。後で実データを見てから追加することもできるので、まずは、机上で重要なポイントを定義します。

例)情報要求:受講者個人を特定できること
    →【完全性】 社員を識別する項目に抜け、モレがないこと

この他にもこのワークシートで定義すべき項目はありますが、大きくは上記のような流れで進めます。

終わりに

先日の第8分科会では、この「ビジネスニーズ整理ワークシート」を利用して、少し別の角度から、データ整備の進め方について検討されている方々とお話しすることができました。 実プロジェクトで活用されている事例も出てきており、 私達のアウトプットがデータマネジメントに取り組まれる方々の活動に、具体的に寄与できるのは非常に喜ばしいことだと改めて感じています。

データ品質管理の具体的な成果物

昨今、データ利活用によって新たな価値を創出することや、コロナ禍で対面での業務が難しくなりアフターコロナ、ウィズコロナのデジタル化された働き方が求められる中で、データ品質=「データが使える状態であること」がますます重要になってきています。

一方で、DMBOKでは、幅広く考え方やアクティビティが記載されているものの、成果物サンプルが少ないため、具体的なイメージが掴みづらい…という声を聞くことがあります。

データモデルなど、手法が確立している(統一されているわけではなくとも)分野はまだ良いとしても、一般的なシステム開発/運用で、あまり馴染みのないデータ品質管理はなかなかイメージがつきづらい分野の一つです。

DAMA日本支部:第8分科会(データ品質に関する研究会)では、実際に手を動かす一助となることを目指して、DMBOKに沿って進めるならどういう成果物を作って行けばよいのか議論しており、2019年に、DMBOK1に基づいた成果物として、データ品質管理を進めるためのワークシートを完成しました。
※下記のリンク先で公開しているので、ご興味のある方は是非ダウンロードいただければと思います。

http://www.dama-japan.org/PublishedMaterials.html

ワークシートの内容についてはDAMA日本支部の会員には総会などでも報告・共有していますが、公開資料としてももう少し解説があるとよいかなと考えており、この場を借りて、少しワークシートの概要を紹介したいと思います。

DQワークシートの概要

ワークシートは4つのシートで構成されています。DMBOK1アクティビティとワークシートの対応関係は下図の通りです。

図:DMBOK1アクティビティとワークシートの対応関係

DMBOK1アクティビティを踏まえて、各シートで記載すべき項目を定義しています。各シートに項目説明がありますのでそちらを参照ください。各シートの概要は下記の通りです。

①ビジネスニーズ整理ワークシート
ビジネスニーズを5W1Hの観点で纏める。ここでは、対象となるデータセットの特定には踏み込まずビジネス視点で必要な情報とその情報に求められる品質要件を纏める。

②DQ管理対象検討ワークシート
具体的に対象データセットを決めて、実データを見た上で、データ品質管理対象を絞り込む。

③DQチェック精緻化ワークシート
データ品質のチェック方法を精緻化して、チェック結果が意図したものになるかビジネス部門とIT部門で確認・合意する。

④検査・レポート運用整備ワークシート
モニタリングとアラート検知時の運用方法を決める。

今後のブラッシュアップ

現在のワークシートVer.1.0はDMBOK1に沿ったものなので、今後は、DMBOK2に沿って、ワークシートをブラッシュアップしていこうとしています。

また、ワークシートを使ってみて、良かった点、改善点などありましたら、フィードバックいただけると嬉しいです。今後に活かしていきたいと思います。どうぞ宜しくお願い致します。