DMBOK第二版 読み方のポイント

DMBOKの厚さをどう攻略して読むか

DMBOK第二版日本語版が出版されてから、4年以上が経過しました。
この間、DXに伴うデータ利活用ニーズの高まりと共に増刷を続けています。
SNSなどの反応を見ていると、当初の読者層はコンサルタントやSIer企業の方が多かったものの、最近ではユーザ企業の方からも多くの反響をいただいています。翻訳に関わったものとしてうれしく思っています。

ただ、はじめてデータマネジメントを学ぼうという方からは、
「650ページを超える書籍を全て読みきるのは大変。効率良い読み方はありませんか?」
と相談されることも増えてきました。
相談される方から伺ってみると、「効率良い読み方」として期待されているのは、
・すでにデータマネジメントに関わる課題を抱えている方が、解決策を早く知る方法
・データマネジメント全体を知識として学びたい方が、より深く理解しやすい方法
の大きく2つに分かれるようです。

前者については、本ブログ以外にも参考となる記事が他サイトにあります。

『DMBoK2の歩き方とデータガバナンスの位置付けを考える』
https://dama.data-gene.com/tag/dm-walking-map/

『全672ページの超大作、データマネジメント知識体系ガイド「DMBOK2」の攻略法』
https://japan-dmc.org/?p=19468

『日本語版DMBOK2を読む』 https://metafind.jp/2018/12/10/reading_dmbok2_in_japanese/

以下では、後者の視点について掘り下げて、いわばDMBOKを知識教養として学ぶための読み方のポイントをご紹介します。

章をまたいで用語や概念が解説されていてわかりづらい

DMBOKの、たとえば参照データとマスターデータのような特定の章について読んでいると、メタデータやデータ品質、データガバナンス等の他の章に関わる説明が出てきます。
DMBOKをデータマネジメントの「教科書」として読みたい方は、まずここで立ち止まってしまうようです。歴史の教科書であれば、まず古代から中世、近代と章毎に理解でき、先行章の理解が後続章の理解をより深めてくれますね。
しかしDMBOKはそのような作りではありません。(仮に歴史の教科書をDMBOK式に書き変えるならば、「歴史とは」という章ではじまり、「哲学宗教」「政治統治の方法」「共同体の形態」といった章構成になりそうです。)

DMBOKは主要11章を「知識領域」と呼んでいます。この領域というものはデータマネジメントに関する知識を①データの種類②性質③管理手段の違い※でまとめた単位です。(※たとえばそれぞれ代表的な章として①参照データとマスターデータ、②データ品質、③データモデリングとデザインが挙げられます。)
データ品質と一言で言っても、メタデータやマスターデータの品質もあればそのどちらにも該当しない品質もあります。これらはみな、DMBOKでは別々の章に書かれています。そのため、「DMBOKでデータ品質に関わる知識を深めたい」という方は、いずれは650ページすべてを読まなくてはと考えがちです。
とは言え、650ページ全て読み込むのはハードルが高いというのが今回の主旨でした。

最初は章単位ではなく”節”単位で読み込むのがオススメ

DMBOK第二版の第3章から第15章までの各章は、どの章もほぼ以下の構成です。

第1節 イントロダクション
  1.1. ビジネス上の意義
  1.2. ゴールと原則
  1.3. 本質的な概念
第2節 アクティビティ
第3節以降 ツール、技法、導入ガイドライン、ガバナンス、文献 等

第3章 データガバナンスの目次
第3章 データガバナンスの目次

第1節は、その知識領域の基本的な用語と考え方を紹介しています。
第2節は、その領域で一般的に実施される活動と手順が解説されます。
第3節以降は、DMBOK第二版英語原本が書かれた2015年時点で、その領域について広く普及していたツールや技法、ガバナンス方法が書かれています。
英語原本が書かれてからすでに7年が経過しているため、現在からすると第3節以降の内容に古さを感じるものもあります。
一方で、第1&2節の内容は、具体的なツールや方法論ではなくコンセプトを書いているため、これからも参考になります。

全くはじめてデータマネジメントに触れるという方は、まずは第3~15章の用語の解説を読み通すと良いでしょう。そうすれば、各章に分かれて記述されている知識が、頭の中で紐づくはずです。
ひととおり用語についての知識が身についた方は、次に、章を横断して第2節を読むことをおすすめします。第3節以降の知識を前提には書かれていないので、第2節を繰り返し読むだけでも具体的な活動内容について理解できるはずです。

ちなみに、第1/2/16/17章は、知識領域横断で考慮するべき内容が記述されています。

  • 第1章:第3~13章全体を通した、データマネジメント全体の目的と原則
  • 第2章:データを取り扱う際のリテラシー
  • 第16&17章:データマネジメントを成功させるための組織文化

これらは他の章に比べてより抽象的な記述が多いので、最後にまとめて読むと良いのではないでしょうか。

まとめ

DMBOKを購入したものの、その厚さと難解さに心が折れて「積読(つんどく)」していませんか?
また、DMBOK以外の、ほどほどの厚みで読みやすい本でデータマネジメントを学んだものの、物足りなさを感じていらっしゃいませんか?

そうした方はぜひ、章を横断して第1節の基本的な用語の解説を読んでみてください。第1節だけ読み返すなら、それほどボリュームはありません。
もう少し踏み込んで、どんな活動をするのか学びたい方は、第2節を読み進めてください。

そして次のステップとして、DMBOKの基礎用語や活動の解説を参考に、みなさんの所属する組織やお客様に対して、DMBOKをベースにデータマネジメントを実践してはいかがでしょうか。

ADMC2021”DX推進のためのデータストラテジーとガバナンス”のご紹介

11月16日に、DAMAの日本支部主催でデータマネジメントのカンファレンス、Asian Data Management Conference 2021(以下、ADMC2021)が開催されます。
今回のブログでは、ADMC2021の概要を紹介し、データストラテジー(以下、データ戦略)とデータガバナンスがなぜDX推進に必要なのかについて、私見ですがまとめます。

Asian Data Management Conference 2021とは

ADMCは、データマネジメントの普及活動のために、2010年から毎年開催されており、今年で11回目を数えます。  
毎年、DAMA海外支部メンバによる先進事例やノウハウの共有と、国内企業の最新の取り組みを紹介しており、今年は次の内容で11月16日にオンラインで開催されます。

【テーマ】 最新事例に学ぶ DX推進のためのデータストラテジーとガバナンス  
【日時】  2021年 11月16日(火)10時~17時  
【会場】  ZOOMウェビナー  
【会費】  無料  
【講演】
1. 開催にあたってのご挨拶  
(DAMA日本支部会長 林幹高氏)
2. データガバナンスの成功要因 ―カナダにおける銀行事例― メタデータの収集、カタログ化とその普及  
(DAMAインターナショナル 理事兼Chief Privacy Officer Ron Klein氏)
3. スポンサー各社によるLightning Talk
4. 今取り組まないと置いていかれる!データコンプライアンスの最前線  
(SBIホールディングス株式会社 社長室 ビッグデータ担当次長 佐藤市雄氏)
5. データ戦略を構築する ―ビジネスゴールに沿った実践的なSTEP  
(Global Data Strategy Ltd,マネージングディレクター Donna Burbank氏)
6. DX推進を支えるデジタル事業基盤とデータガバナンス  
(株式会社日立物流 IT戦略本部副本部長兼デジタルビジネス推進部長 佐野直人氏)  
※1・4・6の国内講師による講演はリアルタイム配信ですが、2・3・5のLTと海外講師による講演は録画の配信になります。なお、2&5の海外講師講演には日本語字幕が付きます。

【申込】 https://us02web.zoom.us/webinar/register/WN_WkQkPHnXTGCJAlQekl24wA  
【その他詳細】https://www.dama-japan.org/ADMC2021.html

DX推進にデータガバナンスとデータ戦略が必要な理由

今はDXが徐々に浸透しつつある段階で、DXのための取り組みの多くが、PoCや単一の業務部門に閉じて実施されています。こうした小さな範囲では、データに関する問題・課題に目が届きやすく、関係者間で解決に向けて調整しやすいため、データガバナンスとデータ戦略の必要性はあまり認識されていません。

ただ、これからPoCが実装・運用され、複数の部門を横断したサービスとして継続することになると、データに関する問題・課題に誰が継続して携わるか役割を明確にし、どう対処するべきか方針とルールを決め、いつ実行するか計画を立てる必要がでてきます。  
このように役割とルールを決め、データが適切に管理されるようにコントロールし続ける活動が、データガバナンスです。
また、複数部門間で共通のデータ問題・課題に優先順位をつけて、いつどうやって解決するかの計画をまとめたものが、データ戦略です。
データガバナンスは、現在の統制活動がデータ戦略による計画の範囲と深さに対して過不足無いかを判断しつつ、組織全体のデータに関するリスクを軽減していきます。
データガバナンスとデータ戦略無しでデータに関わるDX事業を本格化させると、データに関する潜在的なリスクを増やし、問題が起こったときに即座に対応することができなくなるでしょう。

たとえばデータサイエンスのPoCでは、データサイエンティストがデータ品質向上のため、分析前に都度、データのクレンジングや集約などの処理を直接行います。
もしある分析のPoCが終了し、今後継続して複数部門のデータを対象に分析していくことになったら、データサイエンティストだけでデータの前処理を行うのは、負担になります(そもそもデータサイエンティストは前処理よりも分析作業に時間を割くべきですね)。
データガバナンスとして、サイエンティスト以外の誰がどうやって処理していくか、ルールを決める必要があります。もし、ビジネス側が将来分析範囲を拡大したいなら、いつまでにそのソースデータを収集できるか、事前に関係者と調整して準備しておく必要があります。早すぎず遅すぎず、適切な時期に収集開始できるように、データ戦略のなかでロードマップを描いておく必要があります。
また、DXのためのデータ利活用のため、データを収集・蓄積・連携する基盤や、部門横串の分析を実現するためのマスタデータマネジメント(MDM)基盤の構築が活発になっています。なかには、取り組み毎にこうした基盤の構築を進めてしまい、よく似た基盤が同じようなツールによって複数できてしまう企業も見受けられます。こうした基盤の乱立を防ぐためにも、中長期に渡るデータ戦略を整備しておくべきです。

まとめ

DXの試行期間が終わり、データが部門やサービスを横断して本格的に活用されていくこれからこそ、全社的なデータガバナンスとデータ戦略が必要になります。これら無しでは、データの問題・課題にすみやかに対応できず、ビジネスが要求するスピードに応えられない場面も増えてくるでしょう。
では、具体的にデータガバナンスでどんな役割とルールが必要なのか。
データ戦略では、どんな要素を考慮して計画としてまとめるのか。
具体的な中身については、本カンファレンスに参加して学んでいただけると幸いです。
そして、国内外の先進事例を参考にして、みなさんも自分の組織のデータガバナンスとデータ戦略に着手してみてください。  

【ADMC2021申込はこちらから】 https://us02web.zoom.us/webinar/register/WN_WkQkPHnXTGCJAlQekl24wA

DAMA日本支部 財務担当理事 髙橋章

座学でデータマネジメントを学ぶには

データ利活用を推進するために、データマネジメントやデータガバナンスに関心を持つ組織が増えています。それとともに、組織内にデータマネジメントの知見が無いため、まずは一般的な教育を受けるところからはじめたい、という方も増えてきています。
効率的に自社に必要な知識を学び、同時に組織内のデータマネジメントを実践するには、外部の専門家に入ってもらい、プロジェクト化するのが手っ取り早いでしょう。今後組織のデータマネジメントの中核を担うメンバにもプロジェクトに参加してもらい、OJTで手を動かしながら学んでいくやり方です。
ただ組織が必要とする特定のデータマネジメントの専門家を見つけられない場合、独力で座学で学んでいくことも必要です。

座学でデータマネジメントを学ぶ3つのステップ

私はデータマネジメントについてわからないことがあると、次のようなステップで調べ、学んでいます。

その1 DMBOKで基本に立ち返る

なにかわからないことがあれば、まずはDMBOKを開いています。
データマネジメント知識体系ガイド 第二版
https://www.nikkeibp.co.jp/atclpubmkt/book/18/270160/

翻訳メンバだったこともあり、英語原本も日本語版ももうすでに何度となく読んでいます。ですが新たに経験した現場の成果物や組織体制を踏まえて読み返すたびに、「この成果物や考え方は別の場面にも適用できるな」などと、新しい気づきが得られます。
データマネジメント未経験者の方も、DMBOKを何度も読み返せば、全般的な知識を学べるはずです。
ただし、DMBOKは日本語版の本文だけでもおよそ650ページあり、また具体的な成果物やルールの記述が少ないため、ひとりで最初から最後まで通して読み切るには、なかなか歯ごたえがあります。
おそらく英語圏でも同じような悩みがあるのでしょう。DMBOKの出版責任者の方が、DMBOKの概説書を英語で出版されています。英語が堪能な方は、まずはこちらを読み込み、より深く学ぶときにDMBOK本体にあたられるといいかもしれません。
Navigating the Labyrinth: An Executive Guide to Data Management
https://technicspub.com/dmbok/

その2 WEB教育プラットフォームで最新情報を押さえる

現在のDMBOK第2版の英語原本が出版されてから、すでに3年が経過しています。データマネジメントも、新しい技法や考え方が出てきています。
私はこうした情報を、WEBの教育プラットフォームのコースや解説記事を通じて仕入れています。特に、毎年DAMA-Internationalと国際的なデータマネジメントカンファレンスEDW(Enterprise Data World)を開催しているDataversityのサイトは頻繁に巡回しています。
Dataversity
https://www.dataversity.net/

有料のトレーニングコースもありますが、その時々のデータマネジメントやガバナンスのトレンドを押さえるのであれば、Webinarをチェックすれば十分でしょう。(https://www.dataversity.net/category/education/webinars/upcoming-webinars/
ここでWebinarを開催しているDMBOKの著者もいます。彼らのWebinarではDMBOKには載せていなかった事例や成果物イメージを確認できることもあるので、おすすめです。

その3 SNSで疑問を直接専門家にぶつける

書籍やWebinarの疑問は、著者または講演者本人にSNSを通じて質問します。海外、特にアメリカの著名なデータマネジメント専門家の多くが、LinkedinかTwitterのアカウントを持っていて、直接コンタクトを取ることができます。
またLinkedinではグループ機能で専門家を中心にディスカッションが行われているので、参加してみるとおもしろいでしょう。

日本語で学ぶならまずはDAMA日本支部へ

上記以外に日常的に参照している書籍やサイトもありますが、だいたいなにか知りたいことがあると、この3ステップのどこかで解消されます。
また書籍代以外は基本無料なので、金銭コストを避けたい学生や若手の方にもおすすめです。ご参考ください。
ただ、その2もその3もそれなりの英語力が必要になります。
やはり語学のハードルは高い、日本語で幅広く学びたい、という方はDAMA日本支部にご参加ください。
テーマ別の分科会だけでなく、最近では2~3ヵ月に一度DMBOKの概説セミナも実施しています。また国内の専門家が所属しているので、分科会/セミナの場で直接質問をぶつけてみてはいかがでしょうか?

データ活用の成功を導く「データリーダーシップ」

今年の3月に、データマネジメントの国際カンファレンスEnterprise Data World(EDW)が実施された(https://edw2020.dataversity.net/)。今年のセッション毎のテーマを眺めてみると、「データリーダーシップ」をテーマとするセッションが多い。海外でもDXはキーワードとなっているが、それよりも上位である(下表、「EDWセッションの分類」を参照)。

データリーダーシップは組織の機能

そもそもデータリーダーシップとはなにか。
CDO(Chief Data Officer)のような社内のデータ責任者を思い浮かべる方もいるだろうが、そうした特定の人物は指していない。
データマネジメントとデータガバナンスのあるべき姿(ビジョン)や目的を明確にし、そこに至るステップを戦略として策定すること。
または、そうして策定されたビジョン・目的と戦略を見直すことが、データリーダーシップである。

DMBOK第2版でも、データマネジメントのリーダーシップについて述べている箇所がいくつかある。
第1章「データマネジメント」では、データマネジメントの原則として
「効果的なデータマネジメントにはリーダー(※原文では”leadership”)のコミットが必要(Effective data management requires leadership commitment)」
「管理スキルだけでなく、ビジョンや目的が必要」
と述べている (DMBOK 第2版日本語版 P46) 。
また、第17章「データマネジメントと組織の変革」では、米国の専門家ジョン・コッターのリーダーシップ論を紹介しながら、リーダーシップとは変革を実現するための能力で、合理的で魅力的な将来像であるビジョンを描き、どうしたらビジョンを達成できるかという筋道である戦略を作成することだと紹介している (DMBOK 第2版日本語版 P636 図117) 。

データの価値を収益・コスト・リスクで評価する

ビジョンと戦略を作成するだけなら既存の「データ戦略」(またはデータマネジメント戦略/データガバナンス戦略)となにが違うのか。

データリーダーシップの提唱者の一人、Anthony J. Algmin氏によれば、データの価値とはつまるところ収益の増加・コストの減少・リスクの管理の3つのどれかだと言う。

データの価値とは、「データを使い何をするのか」と「そのデータ無しで何ができるか」の差分によって具体化される。
収益の増加、コストの減少、リスクの管理によって価値は測定される
これら3つは、実際にデータの価値を生む「唯一の」方法である。

“Data Leadership: Stop Talking About Data and Start Making an Impact!” https://algmin.com/book/

データ戦略の目的は企業によって様々だが、究極的にはデータの価値によってビジネスに貢献することを目指す。
つまりAlgmin氏の上記意見に拠れば、データ戦略の目的とは収益の増加・コストの減少・リスク管理というビジネス視点で具体化・定量化されたものになる。
また彼は、こうして目的が定量化・具体化されれば、目的に対して現在どこまで達成できたのか測定し、問題点があれば特定して改善し続けることができるとも言っている。

すなわち「データリーダーシップ」とは、
・データ戦略の目的を、ビジネス視点で具体化・定量化する
・定量化された指標に基づき、戦略自体が定期的に評価され、見直される
のふたつを前提条件としている点が、通常の「データ戦略」との違いとして位置づけられる。

データリーダーシップで変化に対応し、無駄を省く

ではEDWに参加しているような海外の企業や組織は、目的の具体化・定量化とそれに基づく改善活動をどれだけ実施できているのか。
あまりできなくて悩んでいるからこそ、「データリーダーシップ」をテーマにしたセッションが増えているのではないだろうか。

たとえば、ビジネス環境が急速に変化して戦略自体を見直すべき状況になっていても、目的を定量化できていないので測定できず、変化に気づかないまま、もはや無駄かもしれない施策を継続する。また、施策実行の結果得られる収益を、そのために費やしたコストが上回っていても気づけない。そんな企業が多いのではないだろうか。

海外では、2010年代前半からデータ戦略の策定に取り組む企業が増えた。それから10年近く経つが、戦略立案と推進で成功したという事例は、それほど多くはない。
一方、日本は最近になってデータ戦略策定に取り組む企業が増えてきたところだ。
もし貴社もそうした企業なら、今からできるだけ目的の具体化・定量化に取り組んでみてはどうだろう。
目的の定義に時間がかかるかもしれないが、変化に対応し、無駄な作業を省くことで、最終的にはデータ活用成功の近道になるかもしれない。

パッケージシステム導入時のデータモデル

パッケージシステムでは、多くの業種とその業務プロセスに対応できる、柔軟な標準機能が用意されています。そのためパッケージ導入プロジェクトでは、新規業務をこうした標準機能でどこまで対応できるか、Fit&Gap分析を行います。

たいていのプロジェクトでは、この分析時にプロセスモデル図を作成し、
・どのプロセスにどのパッケージ標準機能が対応するのか
・パッケージ標準機能が対応できない業務は、アドオンを導入するのか、追加開発するのか
を明らかにしていきます。

データ構造もFit&Gap分析が必要

一方、パッケージは機能だけではなく、データを格納する標準データ構造(テーブルなど)も用意しています。
機能をプロセスモデル図でFit&Gap分析するのと同じように、新規に管理すべきデータと標準データ構造をデータモデルで図化して分析すれば、より漏れ無く無駄の無いパッケージ導入ができるはずです。

ただ実際のパッケージ導入プロジェクトの多くで、プロセスモデル図は作られてもデータモデルはあまり作られないようです。
それで問題が起きなければいいのですが、そういったプロジェクトではテーブルやI/F設計の手戻りが発生したり、データの移行設計が見直されたりすることが多いように思えます。

データモデルに工数をかける価値

なぜパッケージ導入プロジェクトで、データモデルは作られないのでしょうか。
まず、パッケージ導入が短期間のシステム構築を目的としているため、データモデル作成の工数を懸念されるのかもしれません。既存システムからパッケージの移行設計をしなくてはいけないのに、データモデルまで作るのは負荷が高い、などなど。
ただ移行範囲全体を表すデータモデルが一枚あると、詳細な移行設計前に移行元と移行先の関係を確認でき、対象データの漏れや重複の確認ができます。移行設計の手戻りは移行作業の負荷とテストの精度にも影響を与えるので、早い段階で移行検討できるのは価値が高いでしょう。

モデリングコミュニティとしてのDAMA

データモデルが作られないのは、パッケージ導入の現場にデータモデルを読み書きできる人材が少ないこともあるでしょう。データモデラーはどうしても手組みシステム開発の現場にアサインされがちです。
またプロセスモデル図がプロセス間の関係を順に追って読めるのに対して、データモデルは記法による表現の違いが大きく、読むのにもある程度の学習が必要です。

もしこのエントリーを機にデータモデルを学びたいという方がいらっしゃったら、書籍を読んだりセミナーに参加したりするのに加えて、DAMA日本支部に入会されることをオススメします。実はDAMAには、メインフレームのシステム開発時代からデータモデルと格闘してきた、データモデラーの“猛者”たちが集っているからです。
特に、第10分科会「データモデリングの実践的検討会」では具体的なデータモデルをベースにノウハウの共有を行っていますから、パッケージ導入時のコツについて聞くことができるかもしれません。