ADMC2021”DX推進のためのデータストラテジーとガバナンス”のご紹介

11月16日に、DAMAの日本支部主催でデータマネジメントのカンファレンス、Asian Data Management Conference 2021(以下、ADMC2021)が開催されます。
今回のブログでは、ADMC2021の概要を紹介し、データストラテジー(以下、データ戦略)とデータガバナンスがなぜDX推進に必要なのかについて、私見ですがまとめます。

Asian Data Management Conference 2021とは

ADMCは、データマネジメントの普及活動のために、2010年から毎年開催されており、今年で11回目を数えます。  
毎年、DAMA海外支部メンバによる先進事例やノウハウの共有と、国内企業の最新の取り組みを紹介しており、今年は次の内容で11月16日にオンラインで開催されます。

【テーマ】 最新事例に学ぶ DX推進のためのデータストラテジーとガバナンス  
【日時】  2021年 11月16日(火)10時~17時  
【会場】  ZOOMウェビナー  
【会費】  無料  
【講演】
1. 開催にあたってのご挨拶  
(DAMA日本支部会長 林幹高氏)
2. データガバナンスの成功要因 ―カナダにおける銀行事例― メタデータの収集、カタログ化とその普及  
(DAMAインターナショナル 理事兼Chief Privacy Officer Ron Klein氏)
3. スポンサー各社によるLightning Talk
4. 今取り組まないと置いていかれる!データコンプライアンスの最前線  
(SBIホールディングス株式会社 社長室 ビッグデータ担当次長 佐藤市雄氏)
5. データ戦略を構築する ―ビジネスゴールに沿った実践的なSTEP  
(Global Data Strategy Ltd,マネージングディレクター Donna Burbank氏)
6. DX推進を支えるデジタル事業基盤とデータガバナンス  
(株式会社日立物流 IT戦略本部副本部長兼デジタルビジネス推進部長 佐野直人氏)  
※1・4・6の国内講師による講演はリアルタイム配信ですが、2・3・5のLTと海外講師による講演は録画の配信になります。なお、2&5の海外講師講演には日本語字幕が付きます。

【申込】 https://us02web.zoom.us/webinar/register/WN_WkQkPHnXTGCJAlQekl24wA  
【その他詳細】https://www.dama-japan.org/ADMC2021.html

DX推進にデータガバナンスとデータ戦略が必要な理由

今はDXが徐々に浸透しつつある段階で、DXのための取り組みの多くが、PoCや単一の業務部門に閉じて実施されています。こうした小さな範囲では、データに関する問題・課題に目が届きやすく、関係者間で解決に向けて調整しやすいため、データガバナンスとデータ戦略の必要性はあまり認識されていません。

ただ、これからPoCが実装・運用され、複数の部門を横断したサービスとして継続することになると、データに関する問題・課題に誰が継続して携わるか役割を明確にし、どう対処するべきか方針とルールを決め、いつ実行するか計画を立てる必要がでてきます。  
このように役割とルールを決め、データが適切に管理されるようにコントロールし続ける活動が、データガバナンスです。
また、複数部門間で共通のデータ問題・課題に優先順位をつけて、いつどうやって解決するかの計画をまとめたものが、データ戦略です。
データガバナンスは、現在の統制活動がデータ戦略による計画の範囲と深さに対して過不足無いかを判断しつつ、組織全体のデータに関するリスクを軽減していきます。
データガバナンスとデータ戦略無しでデータに関わるDX事業を本格化させると、データに関する潜在的なリスクを増やし、問題が起こったときに即座に対応することができなくなるでしょう。

たとえばデータサイエンスのPoCでは、データサイエンティストがデータ品質向上のため、分析前に都度、データのクレンジングや集約などの処理を直接行います。
もしある分析のPoCが終了し、今後継続して複数部門のデータを対象に分析していくことになったら、データサイエンティストだけでデータの前処理を行うのは、負担になります(そもそもデータサイエンティストは前処理よりも分析作業に時間を割くべきですね)。
データガバナンスとして、サイエンティスト以外の誰がどうやって処理していくか、ルールを決める必要があります。もし、ビジネス側が将来分析範囲を拡大したいなら、いつまでにそのソースデータを収集できるか、事前に関係者と調整して準備しておく必要があります。早すぎず遅すぎず、適切な時期に収集開始できるように、データ戦略のなかでロードマップを描いておく必要があります。
また、DXのためのデータ利活用のため、データを収集・蓄積・連携する基盤や、部門横串の分析を実現するためのマスタデータマネジメント(MDM)基盤の構築が活発になっています。なかには、取り組み毎にこうした基盤の構築を進めてしまい、よく似た基盤が同じようなツールによって複数できてしまう企業も見受けられます。こうした基盤の乱立を防ぐためにも、中長期に渡るデータ戦略を整備しておくべきです。

まとめ

DXの試行期間が終わり、データが部門やサービスを横断して本格的に活用されていくこれからこそ、全社的なデータガバナンスとデータ戦略が必要になります。これら無しでは、データの問題・課題にすみやかに対応できず、ビジネスが要求するスピードに応えられない場面も増えてくるでしょう。
では、具体的にデータガバナンスでどんな役割とルールが必要なのか。
データ戦略では、どんな要素を考慮して計画としてまとめるのか。
具体的な中身については、本カンファレンスに参加して学んでいただけると幸いです。
そして、国内外の先進事例を参考にして、みなさんも自分の組織のデータガバナンスとデータ戦略に着手してみてください。  

【ADMC2021申込はこちらから】 https://us02web.zoom.us/webinar/register/WN_WkQkPHnXTGCJAlQekl24wA

DAMA日本支部 財務担当理事 髙橋章

DXは「保守的な考え」から生まれる

今日は、「DXは革新ではなく保守である」というお話をする。 ここで言う保守とは保守運用の保守ではなく、あくまで保守的な考えや姿勢ということである。

え?DXは革新的なことを追求する考え方ではないの?と思う方も多いと思う。

それに答える前に、そもそも革新とは何か、保守とは何かということをはっきりさせないといけないのだが、世の中には様々な定義があり困ってしまう。そこで誠に勝手ながら私なりの解釈を業務に当てはめることとする。ご容赦願いたい。

革新:
今やっていること、即ち今の業務遂行方法をガラッと変える。新しい「革新的な」製品ややり方を生み出す。市場の価値観を変える。などなど。
保守:
伝統的な価値を重視し、本当の意味や価値を追求する。今のやり方が良ければそれを踏襲する。違和感があれば変えてみる。

どうだろうか。こう書くとDXがひょっとしたら保守に近いのではないかと思い始めないだろうか(笑。まだまだしっくりこない方は続けて読み進めてほしい。

私が「DXが保守」という時に頭に浮かぶ重要なキーワードは、「価値」である。価値とは人間にとって、お客様にとって、環境や地球にとっての価値を指す。逆に今まで「価値があると思っていた」対象には実は価値がないことを発見したときに、おそらく人生は変わるし、市場も変わる。

よい例は株式市場や不動産である。

最近のニュースで、中国の不動産大手・中国恒大集団が巨額の負債を抱え、経営危機に陥っていることが報じられている。負債が30兆円を超えるまでなぜ金融機関やサプライヤーはこの会社を信頼してきたのか不思議になる。日本人の年金基金もここに投資している。もちろんこれに限らずリーマンショック、通貨危機も、信じていたものに裏切られたという意味では同じだろう。

人や市場は何を信じ、何に価値を見出すのか。非常に深く難しい問題である。悲しいことに今日の価値は明日のゴミかもしれない。

しかしいつの時代でも変わらないこと。それは「人間」にとって常に 大事なことでで、人間が持つ根本的な価値観、おそらく「人類」が生まれてから一度も変わっていないものである。

それを見失ってはいけない。

このこととDXには大いに関係がある。DXとは一見新しい価値を創造するように思えて、実は忘れられていた価値、勘違いしていた価値、操作されていた価値に対するアンチテーゼに過ぎない。今あなたが欲しいのは本当にこれですか?という「今思い込んでいる」価値に対する挑戦状である。

他の言い方をすれば、DXを推進する中で、今なぜこれに価値があると思っているのか、本当にこれに価値があるのか、なぜこの仕事をしているのか、という問いに答えていかなければならない。自問自答を繰り返すのだ。

それでは、それに答えるために何が必要なのか。実は技術でもなくスキルでもなく、正直さと勇気である。

ひょっとしたら現状を冷静に受け入れることが怖いかもしれない。見て見ないフリをしたくなるかもしれない。 それでも対象を真正面から見なければ答えは見つからない。

ここまで、データマネジメントと全く関係のない話をしてきた。ただデータマネジメントはそもそもデータの業務価値を高めるためのものであり、「価値の追求」という意味では同じである。人間や市場が求める「本来の価値」やデータが持つ「潜在的な価値」を見出して、それを再発見し活用する。これが私が冒頭で述べたある意味「保守の姿勢」と重なるのである。

【次回予告】
現状を冷静に分析し問い詰めるのに何も技術を使わないかというと、データモデリングという手法を使う。いきなりデータモデルが登場したが、私の会社ではデータモデリングを通して多くのDXが起きつつある。次回はデータモデリングからDXを起こす事例をご紹介する。

DAMA日本支部の学生会員

今回はDAMA日本支部の学生会員について書きたいと思います。

まだまだあまり利用されていないのですが、実はDAMA日本支部では学生の会員は会費無料です。支部規約ではこんな風に決められています。

———————-
8.会費
4. 個人会員の年会費を、10,000円とする。ただし、学生は無料とする。ここで言う学生とは、未就労の大学院生以下を指す。
(DAMA日本支部規約の全文はコチラ
———————-

もともとの支部規約では学生向けの優遇措置は特にありませんでした。しかし、理事会で会員のダイバーシティを促進するための議論があり、2019年度に規約が改定されました。これから社会人になっていく学生にデータマネジメントに触れる機会、「こういう分野があるんだ」と知る機会としてもっとご活用いただきたい制度です。

2020年度からプログラミング教育が小学校でも必修となりましたが、そのねらいはIT業界で働く人材を増やすというよりも、どんな職業でもITを使いながら課題解決を図る力としてプログラミング的思考を育成するというものです。
今後、どんな職業であってもデータを活用しながら課題解決をしていくと考えると、データマネジメント的な思考も間違いなく必要になってくるのはないかと思います。

以前、データガバナンスの導入にあたって、会社としてのデータに対する基本的な考え方、関係者の方向性を合わせるためにデータマネジメント方針の策定をご支援したことがあります。その方針の中では、データは自分の業務だけで使えれば良いのではなく、他の領域や横断的な判断のために活用できることを意識する、またIT側だけの話ではなく業務側も含めた話であるという考え方を込めて「データマネジメントはみんなの務めである」という趣旨の記載を含めることになりました。実際にデータマネジメント施策を推進、普及、定着させていくには専門家はもちろん、様々な立場の人が携わっていくことになります。

現在、企業等にデータマネジメントが段々と普及していっています。学生の間にこの分野に触れることによって、データマネジメントを担う人材がもっと増えていってほしいと思います。さらに将来的には専門家だけでなくデータマネジメント的な思考を持つ人が増え、組織横断的なデータマネジメント施策の推進もしやすくなっていくということを期待したいと思います。

やや話を広げすぎたかもしれませんが、もし、データマネジメントに興味がある学生のお知り合いがいらっしゃいましたら、ぜひ入会の検討を勧めていただければ幸いです。

「デジタル化」で改革ができるか?

9月1日にデジタル庁が発足され、平井卓也デジタル相の会見はじめ、華々しくメディアでも取り上げられています。
報道のされ方含めて、誰もが「徹底的にデジタル化を進める」と繰り返していますが、この認識に私は大いに違和感を覚えます。

アナログ(紙)のデジタル化(電子化)についていえば、職員のExcelだろうが、多額な国家予算が投じられ、ほぼ使われていないような行政手続きシステムだろうが、既にデジタル化(電子化)されている状態になっているのです。
問題は今やデジタル化することではなく、各行政手続きごとに縦割りの状態で構築され、メインフレーム時代の古いアーキテクチャーを見直すことなく長年場当たり的な増改築が繰り返されてきたシステムの中で”データがサイロ化”し、意味や粒度、整合性が合わない状態で分断されていることが最大の問題なのです。
適切に管理されないままに増大化の一途を遂げるデータは、複数の「系」のシステムをまたがってつなぐことができないため、手続きのたびに本人確認や同じ情報の入力を強いられ、デジタル化(電子化)すればするほど、人手のかかる照合・確認対象のデータや利活用することができないデータがさらに無尽蔵に増えていくことを強く危惧しています。

デジタル化(電子化)という手段が今後も引き続き目的化し、新たな「器(システム)」の開発・導入が進んで濫立化することにより、その結果、使えないデータがさらに増えてしまう。
この悪循環を断ち切るためには、「器(システム)」ではなく、その「中身(データ)」と向き合い、これをいかに最短距離で整備すれば利活用できるようになるかを実地にアセスメントし、それを改善していくための地道な活動計画を策定・実行していくことに他なりません。
どうしても目に見えやすい「器」をどう作るかに衆目が集まりがちになりますが、その「中身」と真摯に向き合わないと、政府が標榜する「Once,Only原則(国民・事業者が役所に一度提出した情報を他の役所が二度と求めてはならない)」などは夢のまた夢になります。

データマネジメントの普及・啓発団体であるDAMA日本支部にとっても、私が事務局長を務める(一社)日本データマネジメント・コンソーシアム[JDMC]としても、こうした問題意識をもっと世に問い、情報発信していくことが重い責務なのではないかと、デジタル庁の一連の報道を見ていて再認識した次第です。

DAMA日本支部 企画担当理事
日本データマネジメント・コンソーシアム[JDMC] 発起人 兼 事務局長
大 西 浩 史

データマネジメント成熟度評価を考える(8/25 10分科会話題より)

8月25日(水)に月次の第10分科会(ZOOM方式)が開催され、筆者が以下の題目で説明を行いました(参加者19名)。この記事ではその話題概要と、出された質問の回答に補足する内容を記します。

題目:「データマネジメント成熟度評価/データモデル評価の考え方」

この分科会で議論したように、データマネジメント(DM)成熟度評価の実施/適用を考えるに当たっては、以下の3点を意識した計画が必要です。(当日の資料については筆者の運営するWebページからダウンロードできます。興味ある方は参照下さい(※1))。 

  1. 目的設定および結果の使用方法の明確化 
  2. 評価スコープの設定(対象部門、システム領域、時間的スパン)
  3. 参加者(成熟度評価実施者、実務側の関係者)を含めた中での意図・内容理解のためのコミュニケーション実施

企業としてのDM活動は、言うまでも無く個人の努力のみで成立させるものでなく、組織的活動により成果(例えば高品質なデータを提供する)を生み、長期的に維持する環境を築く事と捉えられます。企業のマネージャレベルの方との話として筆者がDM成熟度の話題を出すと、案外簡単に「自社のレベルはゼロかな。」或いは「うちは1だね。」のような答えが返ってきます。恐らくそのマネージャ感覚は正しいと推察されますが、そのままで済ませていると何時まで経ってもDM環境は改善せず時間が過ぎ去ることになります。現場でデータを扱う方々やシステム関係者は何となく日々の問合せに追われ続け、時によっては何らかのトラブル対応に大部分の時間を費やさざるを得ない状況も生まれます。

それでは、成熟度アセスメントの使い道は一体何なのでしょうか?その考え方の第一の要点「項目1」を図1に纏めました。

現在状況で十分に要望を満たせている場合を除き、自社のDM環境を何とか将来を見据えて改善したいという思いを形にするには、それを企業内公式化する必要があります。このための手段として利用するという考えがあります。DMBoK2 第3章「データガバナンス」のコンテキスト図(同図14)で、入力として成熟度アセスメントが記載されているのはそれを意図するといえます。現状を知り、将来に渡る改善/改革目標への道筋を立て、そのためのプログラム/プロジェクト予算化・リソース確保を確実にするという流れです。従って、この段階のアセスメント(査定)は、余り細かな問題点や対策を突き回すというよりは、中期的な視点での課題とその改善の方向性を見出し、そのための予算化の必要性を経営者/オーナーに理解してもらうために利用すると考えることです。実際の予算額見積りやプロジェクト化は次の段階として検討されることもあるでしょう。

この公式化を納得性のあるものとするためには、目指すDM環境に関して何らかの根拠が要求されます。このためにDM成熟度フレームワーク(DMMF)を参照する事が一つの有力な考え方です。DMMFは有識者により、有効な企業内DM環境のための必要要素を整理したもので、ゼロからDM構想を練り上げることなく時間の大きな節約につながります。この意味である程度の客観性を供えたものとして使用できます。そして冒頭で取上げた三要素の中の「項目2」を検討する材料とできます。但し、DMMFは理想的環境構築(レベル5或いは6)を前提とした幅広い視野で構成されている点に注意が必要で、ピンからキリまでを取上げたものといえます。つまりDMMFを与えられたものとしてそのまま利用するのではなく、自社の当面の目標として、どういう要素をどの程度までに実現するかという身の丈を踏まえた見方を通じ、批判的に参照することが大切です(様々なリソース(人・費用・時間)に余裕のある大企業視点で見るのか、成果第一の形から取組むか等を見極める点も含める)。こういった利用視点を「テーラリング」と呼んでパッケージの「カスタマイズ」と区別することがあります。

参照するDMMFの種類によって成熟度レベルの段階(図2)、判断基準、ドメイン/コンポーネントの内容は大きく異なります。従って、全ての要素を統合して考えるよりは、一つを軸に、不足する内容について他を参照して補うという考え方が適していると考えられます。CMMI/DMMは全体項目数が多く判定に厳格性があり、運用操作性主体で腰を据えた取組みが必要です。EDMC/DCAMはDMMよりも項目は少なく機能性重視視点を持ちます。DMBoK2はDMMFというよりは技術的構成要素を主体にした解説と対応策アクティビティ検討の材料という意味合いが強く、DMMFとして使うには評価項目の具体化等ブレークダウンが必要です。例えばDMBoK2で取上げている第10章「リファレンスおよびマスタデータ」項目はCMMI/DMMでは具体的プロセス領域として明示されていません。

要点「項目3」については、DM成熟度評価の計画・実行・結果の評価/共有という各段階で必要な内容です。計画段階では、実施目的・意義の周知、実施者教育およびインタビュー対象となる部署の理解獲得、経営者関与の明確化が主体です。実行段階ではインタビュー円滑化、スムースな査定文書類取得と分析・状況の共有が含まれます。結果共有の段階では、業務関係者の課題認識確認、今後の時間軸イメージの共有、経営者/スポンサーの納得性の獲得といったことが対象です。特に成熟度評価結果から、今後の改善/改革に向けたロードマップ作りと目標・期待効果設定が、関係者の理解を得た上で相当程度具体化することで、予算化/プロジェクト化という次段階への道筋作りに繋がります。この進展への第1段階は、パイロット的な小規模範囲のプロジェクト的試みから始めることになるかも知れません。

また、成熟度評価手続きをどのようなメンバで行うかといった考慮点もあります。評価を方法論に慣れた専門家に委ねる考え方もありますが、結果の理解を深めた上で次のステップに進めるという意味では社内担当者が主体で実施する方が望ましいといえます。また、評価報告書に対する信頼性を経営者がどのような価値観で見るかも必要な考慮事項です。外部の戦略コンサル会社の意見を重視する形なら、やはり外部専門家活用を重視、一方、社内有識者の進言を大切にする経営者向けでは、社内関係者を積極的に活用するという考え方になるでしょう(但し、成熟度評価の意味合い・方法を理解した上で実施)。第三者視点で実施するといっても、会計監査のように法規制で決められている評価姿勢と異なり、DM成熟度評価は厳密性・正確性・規則準拠性等よりも、ある程度の曖昧さが残っていても関係者の納得性を得ることを重視して進めるべきものと筆者は考えます。

最後に、先に書いたようにDMMFは、具体的な対策の考え方の参考書として見ることもできます。特にDMBoK2の知識領域のプロセス説明は、そのような視点で書かれていると理解すると分かり易いでしょう(但し、書かれていること全てが、自社にとっての絶対的な正解とは限らない点に注意)。いずれにしてもDMに関わる各領域/ドメインを参考にして個別的に理解するだけでなく、領域同士の関係を意識して読み取ることが大切です。この例として、分科会説明で取上げた、Abu Dhabi政府データマネジメント標準(V1.0)を元にした見方を紹介します)。

図3は上記DM標準に記述されるDM領域要素の関係を、資料内容を参照して筆者が図解したものです。この標準はDMBoK1をベースにして作成したものですが、内容から見てDMBoK2を基準にして構成要素は大きく変わっていません。DMBoK2にない要素として、「データカタログ」、「オープンデータ」の2要素がありますが、前者は「メタデータ」および「データガバナンス」と関連付け、後者は「文書とコンテンツ管理」と連携することで分かり易くなりそうです。このようにDM構成要素の関連を図解することで、構築しようとするDM環境がどのように位置付いているかを理解する助けとなります。例えば、ここで特徴的なのは、「メタデータ/データカタログ」が要素フローの先頭にある点、「データ統合と相互運用性」がフローの最後尾にある点です。これによりメタデータの構築を軸とし、他システム/データ要素との連携は次の段階として捉えられていると推測できます(この要素関係は、筆者が整理したDM歩き方マップから見てDMBoK2の記述内容と大きく違っている点です)。目標とするDM環境をこういった要素関係の整理視点で描くことは、DM成熟度評価を計画/評価する上で役に立つものと筆者は捉えています。

尚、説明題目にある「データモデル評価」についてはDMBoK2 第5章 5.2で説明されているHobermanの説明を補足したものであり、誌面の都合上ここでは割愛します。

(以上)

※1 筆者のWebページ(インフオラボ游悠で検索)。Topページにある「游悠レポートページ」ボタンをクリックして移動。「游悠レポート2021-006」を参照。尚、当該資料でDMBoK2の内容を取上げた部分では、日本語版発行前に筆者作成したページについて「データマネジメント知識体系ガイド(第二版)」と用語表現が異なっている点に注意。

※2 図は何れも、8/25(水)第10分科会説明で用いた資料から抜粋。※1の資料を確認。

※3 この資料はDMBoK1を参考に作成し2016年に公開されたもので、Abu Dhabi政府に関連する50以上の団体/企業エンティティのDM環境構築の標準統制事項を規定している。この標準に従ったプロジェクトがこれまで進行・実現されていると同政府関連Webページでは紹介している。

[投稿者]中岡 実(インフオラボ游悠 代表/データマネジメントコンサルタント、ITコーディネータ、認定心理士)

データプロファイリング

 これまで、主に 主にデータモデリングについて取り上げてきましたが、今回は関係深いものの一つとして、データプロファイリングについて紹介したいと思います。以前にも、少し触れていますが、もう少し詳しく見てみましょう。

DMBOK2での記述

 DMBOK2の中でも、 何箇所かで取り上げられているので見てみましょう。最も大きく取り上げているのは「第13章 データ品質」の中です。1.3節の本質的な概念の9番目に「1.3.9 データプロファイリング」として登場します。
 定義としては「データを検査し、品質を評価するために行われるデータ分析の一形式である」とされています。統計的手法を活用して、収集したデータの真の構造、コンテンツ、品質を洗い出すとあり、データのコンテンツと構造のパターンを識別するために利用できる統計処理結果を生成します。

NULL数 NULLが存在することを検出し、許容可能かどうかを検査できるようにする。
最大値・最小値 マイナス値などの異常値を検出する。
最大長・最小長特定の桁数要件を持つフィールドの外れ値や異常値を検出する。
個々のコラムに存在する値の分布度数値の妥当性を評価できるようにする。(トランザクション内の国コード分布、値の発生頻度検査、初期値が設定されているレコードの割合など)。
データタイプとフォーマットフォーマット要件への不適合レベル、想定外のフォーマット(小数点以下の桁数、スペースの混入、サンプル値など)を検出する。

 この表に見られるのは、主に一つのテーブルの各項目ごとの分析となっていますが、この他にもテーブル内での書く項目間の関連や、テーブル間での関連を分析することがあり、DMBOK2ではクロスカラム分析と記載されています。

 「第5章 データモデリングとデザイン」では、ツールの節で「3.3 データプロファイリングツール」として紹介され、ツールによってデータの中身を調べ、既存のメタデータと照らし合わせて検証したり、既存のデータ関連生成物の不備を特定したりするのに役立つことがかかれていました。例として、従業員に複数の職位がある場合をあげていました。
 DMBOK2では、データプロファイリングが何らかの形で、第5、8、10、11、12、13、14、15、17の各章に登場しています。

ツールの利用に関して

データの中身の検証は、データプロファイリングという名前で紹介される以前から実施されてきました。私の場合、初期としてはシステムの再構築におけるデータ移行を目的として始めた記憶があります。特に最初に行ったのは、いわゆる「区分値」の調査でした。再構築に伴い「区分」も見直され、統合や新設、再編を行うことがありますが、その対応をマッピングするために、現在実際に使われてきた値を調べることを目的としていました。
 このために、多くはレプリケーションのデータベースでSQLでGROUP BY句を使って、区分値の種類と、実際に使われている数を出していました。

SELECT 区分値, COUNT(*) FROM 表 GROUP BY 区分値;

こんな感じで、必要な数のSQL文を実行していけばそれなりに機能しますが、テーブル数、項目数が多いと大変です。現在では、データ品質やデータカタログ関連のツールで、プロファイリングの機能が搭載され、簡単に正確に、度々検証することができるようになっています。
 区分値だけでなく、コード系などでもXXX-XX-XXXとか、XX-99-9999などのようなものが混じって居たり、過去の経緯で色々と乱れているものも発見できたりします。
 システム再構築の際のデータ移行だけに使うのではペイしないかも知れませんが、その後のデータ品質とガバナンスに繰り返し使うことを合わせて導入するのが良いかと思います。

データモデリングと関連して

 データモデリングを行ったら、できればデータプロファイリングも実施して、区分値によるサブセットの検証を実施して欲しいです。ナンバーコードに埋め込まれた有意味のコードも確認できます。
 データモデリングによってサブセット分析を行い、区分による業務の差異をサブセットとして切り出せますが、定義書にかかれている区分値と実際のデータベースに入っている区分値では実際には少し異なることがあります。  定義書によれば、1、2、3の値が定義されていても、実際には3は使用されておらず、一方で4とか5とか、場合によっては99みたいな値が勝手に作られていることが少なくないようです。
 この場合、3に相当するサビセットは実際には不要で、4と5に関するものを詳細に調査する必要があります。また、99のような値が設定されている場合は、その値をプログラム中でどのように扱っているかまで、確認する必要がありそうです。

 こういった議論も第10分科会で展開していこうかと思います。

DXとBPR

かつてのBPRが何故上手くいかなかったのか。「BPR失敗」で検索するといろいろでてきますね。ところで改めてBPRとは?

業務工程のリエンジニアリングですよね。BPはスタートがあってエンドがある一連の業務活動の繋がりかな。リエンジニアリングは検索トップのWeblioによれば、”re-engineering リエンジニアリング: ソフトウェアの保守において, 既存の資産をより抽象度の高い形式に変換した後に再構成する技法.”
ですと。

データマネジメントもそうですが、ある一つの事業を営むためのBPが一つの会社に収まり部門間のやりとりも日本語で事足りていれば、そりゃ多少部門間の軋轢が生じるかも知れませんが目標達成のための調整が働くし、組織を跨った改革も進められるかも知れません。

これが製造は複数の海外拠点で販売も複数の海外拠点、拠点の法人は複数の事業部門をカバーしており、法人としての業績も問われるとなるとどのゴールに向かって頑張れば良いのか分かりにくいですね。グローバルの共通語は英語でしょうけどどうしても言葉(考え方)の違いによるすれ違いも生じがちです。部門間の壁も法人、部署をまたがりレポートラインが錯綜していてなかなか崩せませんね。

DXにより導入するソリューション(DXS)はその答えになる可能性があると思います。DXSはデータをデジタル化し、リアルタイムにつなげ、データアナリストがPythonコードを書き未来を予測する取り組みとしてみて、マーケティングとならぶ製造業の本丸、SCMで考えてみます。

どこまでも得意先の果てまで、どこまでも仕入先の果てまでのデータを繋げることによって我々は「神の目」を手に入れることができる。神の目でみてみるとそこは部分最適のオンパレードで最終目的である例えば生活者の便益はまだまだ改善の余地がある、とする。

デジタル化もまだまだ道半ば、例えば物流の運賃表(タリフ)はデジタル化されているか?データを繋げることもいろいろ大変。マスターやリファレンス類はもとよりトランザクションだって処理のプロセスが違ったり、ERPへのインプリが違っていたり。区分値を合わせるのも一苦労。未来を予測するモデルも最初はよちよち歩きでSME(業務領域の専門家)に馬鹿にされる始末。

でもこの状態が逆にチャンスを生む。SMEは油断してモデルを鍛えてくれる。(全くオメェは馬鹿だなぁ、この観点が抜けてんだよ!)デジタル化もオーナーを定めて地道に進めて行く。繋ぐことは昨今の技術の進歩で少しやりやすくなった。

そうするとおぼろげながら「神の目」には徐々にゴールの姿が見えてくる。それは例えば生活者の便益で個別最適の連鎖の結果、毀損されている。

我々の最終目的が生活者の便益ならば、個別最適から全体最適に移行しなければならない。「神の手」を動かすためには個別最適を犠牲にして全体最適に貢献する部門に報奨が必要だ。神の目にはある個別最適を犠牲にしたときの全体最適への貢献度合いが分かるから報奨の額も設定できる。

やがて部分最適を主張する部署は無くなり、One Team!で生活者に向かい合えるようになる。

なんてことをこの寝苦しい夜に夢見ています。一緒に夢をかたちにしませんか?

DMBoK2の歩き方とデータガバナンスの位置付けを考える

筆者もDama-Jで設けられている各種分科会に参加している中で、最近新しく分科会参加してくる方々(主にベンダーやコンサルタント系)から出てくる参加理由として「仕事で出会うユーザ企業の人々が「データマネジメント知識体系ガイド(第2版)」(DMBoK2)を見ていて、自分たちもしっかり勉強しておく必要性を感じたため」という意見を聞くことが多くなっています。データをビジネス資産として扱おうという企業活動からすると、これは当然の流れであり筆者も喜ばしい傾向と捉えています。しかしDMBoK2そのものは知識領域を網羅的に解説した内容であり、初学者が手軽にその内容を理解するのに抵抗を感じるという読者意見も少なくありませんでした。

そこで今回の記事では、分科会活動へ参加する中で筆者が整理した、DMBoK2で説明しているデータマネジメントの全体像をビジュアルな形で理解を進めるための地図「データマネジメント歩き方マップ」について簡単に紹介し、一つの知識領域である「データガバナンス」の位置付けに目を通したいと考えます。(この「DM歩き方マップ」についてはEDW2020のビデオパック講演として筆者が紹介したものです(※1)。日本語版/英語版あり)

データマネジメントを具体的なものとして捉えるためには、それを構成する知識領域(機能構成)を個別に学習するだけでは不十分であり、それら知識領域の全体像(関連性)を理解する必要があるということが筆者の考え方です。この全体像を捉え、しかも個々の要素も見落とさずに眺めることができるようにしたいというのが筆者の目標であり、それを具体的に表現する形として作成したのが、この「DM歩き方マップ」でした(図1)。

図 1 DMBoK2 データマネジメント歩き方マップ 1.8版と知識領域対応図 (※2)

今やスマートフォン/PCの日常的利用の中で、地図を活用できることの便利さを否定する人は余りいないと思われます。それと同様にデータマネジメント(DM)という難題に取り組み、理解を共通化するためには、視覚的見方を可能とするDM地図が必要です。これを利用することでDMBoK2の知識領域(機能分野)の関連性理解を深めることができます。

(ここでは紙面の都合上、細かい議論には入りません)

図1は、機能分野の外部的関連性を表していますが、それに加えて各分野の直接の参照関係を表現したものが、参照関係図です(図2)。ここでは12の知識領域に加えて、他の5つの章を加えた合計17の章立ての内部関係性を表しています。参照関係は方向性(矢印の向き及び色使い)と関係の強さ(矢印線の太さ)で示しています。この図(DM歩き方マップ2)を参照することで、DMBoK2を読み解く上での章間の流れを離散的に推し量ることができます。

図 2 DMBoK2 各章の記事参照関係図(DM歩き方マップ2) (※2)

これらのマップ利用の例として、DMを考える読者の多くに感心の高いと考えられる、第3章「データガバナンス」を取り上げてみます。図1からデータガバナンス領域は各知識領域へ繋がる起点の話題であることが分かります。それと同時にDM活動を考える上での1.ビジネス戦略、2.EA(エンタープライズ・アーキテクチャ)戦略、3.データ戦略といったビジネス活動に直結する戦略領域の話題はDM活動に対する入力となっていることを確認できます。つまり企業活動の上で、DMを推進することは目的ではなく手段であると改めて視覚的に説明できます。ビジネス目標を達成する、データ資産化を実現するために何をしたら良いかと考えてゆくことが、DM活動の方向性であるといえます。それであるからこそ、スポンサー、経営者も本気で取り組むべき話題であると捉えることができます。

(少し話が逸れますが、2年位前のIT領域に関わる記事で大手企業(複数)役員が「CIOは貧乏くじ」という発言をしたのを取り上げていました。そういう企業ではいつまで経っても、システムトラブルが絶えることはなく、システム関係者こそ被害者意識を持ちながら鬱々とした日々の仕事生活を送っているだろうと想像したことを思い出しました。)

マップ2から見ると、データガバナンス領域(第3章/DG)の延長として第15章、16章、17章が構成されていることが確認できます。DGを多く参照しているのは、参照データとマスタデータ(第10章)、データ品質(第13章)で、他の章からの参照も幾つか存在します。第3章はデータ品質を高め・維持に関する組織立て、基本的プロセスの考え方を説明しています。これを踏まえて各機能領域での具体的なDG活動は、それぞれの領域内に含まれるという構成で読み進めることがDMBoK2データガバナンス理解の道筋となります。

DMBoK2でのDM知識領域解説は網羅的な形であり、一部を除いて余り役割階層的、また時間軸的な説明を区別したものとはなっていないと見ることができます。それが、DMBoK2を頭から順番に読了しようとして読者が躓く一つの要因であると、筆者には考えられます。DM歩き方マップで見る景色は、実際には時間軸(ロードマップ要素)、整合性を踏まえた関係者の役割軸を意識する必要があります。データガバナンス要素を含めて、DM活動は組織としての継続的で総合的な有機的活動とすることが必要です(図3)。個人の努力に依存する形では、決してDM活動の理想に到達できないものと筆者は捉えています。人材の流動化が益々想定される社会では、確固として継続的なデータマネジメント活動の意味が大きなものとなることでしょう。

図 3 DMBoK2 を基本にしたデータマネジメント知識領域全体像 (※2)

組織的活動としてのデータマネジメントを成功させるために、DMBoK2で議論されているエッセンスが広く多くの立場の方々に理解され、納得性のある当たり前の活動として実践されることを期待しています。

尚、本記事で紹介したDM歩き方マップ等に関心のある方は、筆者に照会頂ければ資料ご案内します。問合せ下さい。

(メール: minoru.nakaoka(a)infolabyouyou.com メール発信時は、(a)部分をアットマークに変更下さい)

※1 EDW(Enterprise Data World)カンファレス2020は、当初3月にカリフォルニア、サンディエゴ市で開催予定されていたが、コロナ窩話題により集合形式実施は中止された。その際、主催者からの照会によりビデオ録画形式での実施参加問合せを受け、筆者はビデオパック向けの講演参加を行った(60セッション強のセッション参加あり)。

演題 “Walking Map of DMBOK2 : A Bird’s-Eye View to the Data Management World”

※2 図は何れも筆者のEDW2020 ビデオ講演で利用したものを抜粋している。(日本語表現に訂正して掲載)

[投稿者]中岡 実(インフオラボ游悠 代表/データマネジメントコンサルタント、ITコーディネータ、認定心理士)

カンファレンス~海外事例紹介の価値とは

DAMA日本支部では毎年11月にカンファレンスを実施しています
(参考 https://www.dama-japan.org/ADMC2020.html )

我々はその名の通り、国際組織 DAMA-International(以下DAMA-I)の日本支部であることから、 毎年 DAMA-Iや、カンファレンスEnterprise Data World(以下EDW)での関係を活かし 、海外スピーカーを招聘しています。

いま今年の海外スピーカーの調整で様々な議論をしていることもあり、 海外事例として我々は何が聞きたいのだろう? 何が価値だろうか? ということを改めて自問しているところです。

しばしば言われる事として、データマネジメント領域においては、 米国・欧州が日本よりも数年先に進んでおり、先進事例が聞けるという意見があります。

個人の所感として、ある面では当たっていると思います。
特に少し前まではこの差は顕著に感じました。

2010年代前半においては、日本ではデータマネジメントという言葉もごく一部しか流通して おらず、その反面 米国・欧州ではEDWのようなデータマネジメントを主題にした 大規模なカンファレンスが行われており、筆者が10年程前に初めてEDWに参加した時はそのギャップの大きさに驚愕したのを記憶しています。
(EDWは今年でなんと26周年!とのことです)

ただデータマネジメントに関わる日本の状況も刻々と変化しています。

デジタル・DX・データ活用などの文脈に基づき、データの重要性は既に市民権を確立しつつあります。
なぜデータが重要か、というそもそもの説明にゼロベースからの多大な苦労が必要な時代ではなくなりつつあります。
(※ もちろん各現場レベルでは、依然苦労していることと思われますが・・・全体の傾向としてです。)

DMBOKは知識のベースラインとして確立され、DAMA-J,JDMCを中心としそれ以外以外にもデータマネジメントについて語られる場も増えてきました。

従い、海外からの単なる「新しい概念の導入」という価値は相対的に縮小しています。

ただ、その背景をふまえても、自分は以下の価値が大きいのではと考えています。

(1) 事業会社主体の取り組み事例の多さ

データの課題は、ビジネスとITの両面にまたがるものです。
IT技術だけで取り組めるものではない、というのは周知の事実でしょう。

国内外の大きな違いとして、IT技術者の所在・所属があります。。
日米の比較になりますが、日本ではSIerをはじめとするIT企業にIT技術者の多くが所属していますが、
米国では事業会社自体に多くが所属しています。(「ソフトを他人に作らせる日本、自分で作る米国」というタイトルの書籍があります)

話を聞いていると、高いスキルをもったIT技術者が事業会社の中でビジネス側メンバと一体になって、自社のビジネス・データの課題に取り組んだ事例が数多くあります。

もちろん日本でもよい事例はありますが、事例の母集団の量にかなりの差があるように感じています。
日本はまだまだビジネス課題とITの推進主体が切り分かれているのではないでしょうか。

この多くの事例の中から特に優れたものを紹介できればと考えています。

(2) 細分化された専門をもつコンサルタントの存在

欧米では様々な守備範囲のコンサルタントが存在しており、例えばデータ品質改善、データモデリングなど様々な専門性を打ち出しています。
またどんなにニッチに思える領域や製品群にも、その導入を支援しているコンサルが一定数存在します。
日本にもマスタデータ統合支援やデータ統合等のサービスを主として手掛けている会社・個人はいますが、母集団数にはかなり差があるように感じています

これらの方々に理論だけでなく、理論と実際の両面で講義して頂くことで日本にとっても価値が高いものが聞けるのではと考えています。

ということで、国内外それぞれのデータマネジメントの状況と傾向を鑑みたうえで、 より価値の高い講演とは何か、ということを今後も検討していきます。
このような話を聞きたいというご意見があれば是非DAMA日本支部までお寄せください。

またDAMA -I・各支部の状況も変化しております。
中国やインドなど新しい国の支部の成長も着目すべき事であり、日本からのデータマネジメントに関する情報発信の必要性も感じている次第ですがこの点については別の機会に記載することとします。

DAMA会員向け ブログ執筆者募集

(DAMA日本支部 会員メンバ宛)

当ブログはこれまで主に理事メンバが執筆を行っていましたが、今後 DAMA会員の方からも執筆記事を募集する運びとなりました。

テーマはデータマネジメントに関することなら自由とします。
アウトプットすることで、この領域の深い理解にもつながると思いますので、奮ってのご参加をお待ちしています。
ご興味のある方は以下執筆ルールをご一読の上、連絡をおねがいします。

〇 執筆ルール
・テーマはデータマネジメントに関することなら自由とします。文字数は他のブログを参考にお願いします(あまり長すぎないように)
・製品やサービスおよび企業の宣伝・アピールはお控えください。
・自身の氏名・所属社名の記載は任意です
・執筆希望者は、ブログのテーマ案と公開の目標時期を担当理事 吉村までご連絡お願いします。
   (t.yoshimura(at)dama-japan.org  * (at)を@アットマークに変更ください)