コロナ時代のデータリテラシー

コロナ問題が浮上してから半年以上が経過していますが、相変わらず「感染者数」中心の報道が続いているようです。流行当初からニュースなどでは感染者数ばかりが重視され、死者数や重症者数があまり報じられていませんでした。もう少しきちんと「データ」に立脚して判断すべきなのではないかと思っていましたが、そもそも感染者数や死者数、重症者数の定義が曖昧のようです。(この点は、6月の総会で林会長からも指摘がありました。)

データがあふれている現在、データの読み書き算盤能力と言われるデータリテラシーが疎かにされているような気がしました。そこで、データリテラシーという言葉がふと頭に浮かびネットを覗いてみました。

するとDataversityのサイトの「The Importance of Data Literacy」(https://www.dataversity.net/the-importance-of-data-literacy/#)という記事が目に留まりました。

その中で、MITメディアラボのRahul Bhargava氏とMITデータフェミニズムラボのCatherine D’ignazio氏によるデータリテラシーの定義として、以下の4つが挙げられています。

  • read(読む)
  • work with(使う)
  • analyze(分析する)
  • argue with(データを使って議論する)

Qlik社のMorrow氏によれば「データリテラシーを身に付けていればフェークニュースなど存在しない」ということだそうです。

何れにしても、データを正しく取得し、自らの頭で考え、行動することが、以前にも増して求められているのだと思います。

同ページの「Data Literacy」のリンク先を開くと、元米国国務長官コリン・パウエル氏の「40-70ルール」というルールが載っており(彼の地では有名らしい)、「必要なデータのうち40%に満たないデータで判断するのは無謀だが、70%以上のデータが得られるまで待っているとチャンスを逃す」という説明がありました。まさに、リーダーの決断の難しさを良く表していると思います。今回のコロナ禍でも、支援金をいつ/どのように出すのか、緊急事態宣言をいつ出すのか/出さないのか、同じく何時終了するのか、またGoToキャンペーンの是非などを巡って、様々な議論があり、政治的決断の難しさが顕わになりました。

必要なデータとは何なのか、これまた難しい問題だと思いますが、全てをまな板の上に載せた議論をしたいものです(これもまた、また、難しいことではあると思いますが)

データリテラシーはフロントからバックまで組織の全ての部署で必要となります。いわゆる「データの民主化」が求められるということです。そのためには、データマネジメントがやはり重要になってきます。コロナ禍の今だからこそ基本に立ち返り、データマネジメントに関わる叡智を養いたいものです。

これまでも人類は様々な感染症に苦しめられてきましたが、今回のコロナ禍は、人・モノ・カネ・情報、全てが高度にグローバル化された社会に生じた、現代人にとって未曾有の出来事であると思います。この禍を転じて福と為すべく、この混乱の中から画期的なイノベーションが生まれることを期待しています。

以上

メタデータ管理の勘所 (その2)

前回は、データ定義を統合的に管理する辞書(リポジトリ)をつくり、育てていくことの必要性を述べた。
今回はその進め方・アプローチについて述べたい。

■ メタデータ管理の進め方:DMBOKの記載

DMBOK2には次のような記載がある
「多くの場合、メタデータ管理がデータマネジメント全体を改善する出発点となる。」(DMBOK2 1章 2.5.5項)

メタデータ管理は「出発点」という性格を持つがゆえ、どこから着手し、どのレベルを目指すべきか、に迷うことが多い。
また残念ながらDMBOKには、他のBody Of Knowlegde本と同様、「何をすべきか」は書いてあるものの、「どうやるか」は具体的にはあまり書かれていない。

12章 メタデータ管理の2項には、
(メタデータに関する)  戦略の策定 → 要件の把握 → アーキテクチャの定義 → 作成と維持   → クエリ・レポート・分析
という枠組みのみが示されている。

要は、要件に応じてメタデータを管理する仕組み(アーキテクチャ)を作り、そこにメタデータを入れ、維持しましょう、という至極当然の記載でしかない。

結局、データマネジメントやメタデータ管理のような活動には、このタスクを順に進めさえすれば良い、という王道は存在しないともいえる。個々の企業の目的や課題、成熟度を考慮しつつ、自らが進め方を決めていくしかないのではと思う

但しその進め方を決めるための観点は幾つか存在する。ここではその観点を挙げてみるとしよう。

■観点1:業務用語から攻めるか システム項目から攻めるか

業務用語から攻めるというのは、例えば業務ドメインのエキスパートをアサインし、業務用語集の整理・作成から始めるような方式である。
システム項目から攻めるというのは、例えばDB定義やIF定義からデータ項目を収集し、その項目定義を進める方式である。

当然のことながら、どちらかが常に優れているわけではなく、ある程度の比率で両方やるべきである。が、どちらに力を入れるかは各企業の状況による。

= 業務用語から攻める場合 =

この場合、業務エキスパートに用語集を作成した上で、仕組みとしては一般的にはポータルサイトのような多数メンバが容易にアクセスできる場所にそれを公開していく。
この方式の利点は、なんといっても業務のドメインエキスパートの主体的な参画とその知見が得られることである。またナレッジマネジメント・知識の共有という別の効果も得ることができる。

留意点としては、業務エキスパート側だけにまかせておくと、どこまでの情報を対象にし・どのような記載とすべきかという点が迷走してしまうことが多い。

例を挙げておこう。
「配送先地区コード: 配送業務の観点で、都道府県を複数の地区ごとに分類したコード。例:東京城南地区)
このようなデータ項目名とその定義情報は有用である。

しかしながら
「東京城南地区: XX区とYY区とXX区の一部を含む。配送作業における注意点として、、、」
これは値そのものであり、メタデータ管理的には不要である。また付随する業務ノウハウの記述も残念ながら不要である。

業務エキスパートに対し、メタデータ管理的に何が必要/何が不要という基準を伝え、誘導するのは難しい場合も多い。
業務ノウハウの記述も、ナレッジ共有という目的に対しては有益な場合もあり、それも明確な一線を引くことの難易度を上げる。

対応策としては、先に結論めいた話になってしまうが、ある程度 システム項目の整備を先行させた上で、業務用語集側にどのような項目を記載して欲しいかを提示する、対応がとれるものは業務用語とシステム項目とのマッピングを管理していく、という方式がよいと筆者は考えている。

ある程度システム項目に軸足をおくことで、業務用語集をメタデータ管理の目的に沿ったものに誘導することが出来るのである。

= システム項目から攻める場合 =

この場合、多くのケースでは既存のDBのテーブル・IFファイルや設計書、モデリングツール等からデータ項目情報を抽出・とりまとめ、データ項目の定義を整理していく。
抽出は手動で実施することもあれば、ツールを導入し半自動的に集約をかける仕組みを構築する場合もある。

この方式の利点は、ある程度までは機械的に進めることができることである。
散財しているデータ定義を一か所に集めて整理する、これだけでも十分に価値を生む成果物ではあり、データ活用・分析対象のデータを探すための手がかりとして利用できる。

留意点は多数あり、以下のような点が挙げられる。

・物理データ項目の意味判別

物理的なデータ項目を、意味を持つ論理的な項目(とその定義)に紐づけていく必要がある。
設計資料にデータ定義が丁寧に書かれている場合はよいが、そうでない場合はデータの値や画面表示のラベルを手掛かりにするなど、定義情報の獲得に苦労することが多い。
また基本的にシステムは、ある限られた領域の業務を満足するために作られているため、領域をまたがってユニークとなるように項目定義がされていることは稀である。「注文日」という項目は販売管理システムであれば受注の日付であろうし、調達管理であれば発注の日付であろう、がそのようなコンテキストは省略された項目名になっていることが多い。

・スコープの絞り込み

基本的に収集するデータ項目数はかなり多量になるため。対象の絞り込みが必要となる。どのように絞り込むかについても方針が必要となってくる。

これらはメタデータ管理そのものの課題でもあり、対応策については次回以降に述べるとしよう。
(次回に続く)

「DAMA日本支部 第9分科会=DMBOK勉強会=の紹介」

DAMA日本支部ではいくつかの分科会活動を行っている。そのうち筆者が担当しているのが第9分科会である。今回はこの場をお借りして簡単に第9分科会の紹介をさせていただきたい。既に当分科会に参加いただいている方やDAMA日本支部の総会に参加いただいた方には既知の情報ばかりになってしまうことをご容赦願いたい。

第9分科会はDMBOKの勉強会

DAMA日本支部のホームページでは「DMBOKに関する研究会」とも紹介されているが、簡単に言えば単なる勉強会である。概ね以下の方針で運営している。
・開催頻度・時間: 3か月に2回程度、各回は概ね90分
・開催場所:    都内+リモート接続 但し今年度からはリモート接続のみ
・内容:      毎回DMBOKの1章分を代表者が説明しディスカッション
・説明担当者:   分科会参加者のボランティア
DMBOK2は全17章あるので、全章の勉強を完了するのには2年以上を要する。

第9分科会は広く浅く 説明担当はボランティア

他の分科会が一つのテーマを掘り下げているのに対して、当分科会はその全く反対であり、DMBOK全体を広く浅く理解しようというアプローチである。
説明担当者もその道の専門家を招くわけでもなく、分科会参加メンバーが自分の得意分野もしくは自分の興味のある分野を自ら勉強して担当する。説明担当者は完全なるボランティアであり、自分で説明資料も作成するので、それなりの負担にはなる。説明担当者にはならずに、ディスカッションに加わるだけの参加方法も可能としている。だが、説明担当になることで、その章に関する理解がより深まるというメリットもあり、多くの参加者が説明担当に挑戦している。

既に2周りして3周目!

 1周目 DMBOK 第1版 2015.10~2017.07
 2周目 DMBOK 第2版 2017.12~2020.04

実はこの分科会の歴史は短くない。2015年の10月にDMBOK第1版の勉強会が始まり、2017年5月には第1版全章の勉強会が完了した。その後第2版の英語版が発売され、2017年12月からは第2版の勉強会として再開、本年4月に全17章の勉強会を完了したところである。この途中には第2版の日本語版も発売されている。これでこの分科会の活動は一旦終了したが、その後も継続の要望が強くその継続方法に関しては大きく以下の3つの意見に分かれた
 1) データ管理って何?というレベルの、より入門クラスの分科会にする
 2) 2周目の内容をもう1周する
 3) 各章をより深堀したディスカッションが行える分科会にする
検討を重ねた結果、2周目の途中から参加したメンバーも多く、また復習もしたいという意見もあったため「2) 2周目の内容をもう1周する」に決定した。2020年7月に3周目のキックオフを行い、今月2020年9月から各章の勉強会を再開する。

今がチャンス!?

これからDMBOKを勉強したいという方、今まさに3周目が始まろうとしているので、今がチャンスと言える。リモート接続のみの開催となったので、ある意味参加しやすいのではないかと思われる。これを機にDAMA日本支部の会員になり、第9分科会に参加してみては?

新分科会について

新分科会として「 データ管理って何?というレベルの、より入門クラスの分科会 」と「各章をより深堀したディスカッションが行える分科会」の要望がなくなったわけではない。会員の方で我こそはと思う方は、分科会リーダーとなり、新たな分科会を開始してみるのも良いと思われる。

== おことわり ==
第9分科会の資料だけいただけないか?という問い合わせをいただくことがありますが、説明資料は著作物の引用が多い関係で配布できませんのでご了承ください。

BIのマスターはメンテされない!

マスター登録を業務(例えば受注ー出荷ー請求ー入金)のためのマスターと分析のためのマスターに分けて考えてみる。

前者に必要なマスター(製造業では商品、取引先、出荷先、請求先等)の登録を間違えると、誤った商品を誤った場所に出荷し誤った請求先に誤った請求額で請求することになり、修正の遡りで多大な対応が必要となる。誤りが繰り返されれば取引先の信用を失うことにもつながり、誤ったマスターはすぐに修正されるべくフィードバックがかかる。

後者に必要なマスターは分析の観点から新たに付加される商品や取引先などの分類とその属性や、様々な組織で生成されるデータを統合するためのマッピングマスター等がある。しばしば分析のプロジェクトは熱く燃え上がり(この軸でも管理したい!より細かく管理したい!)苦労してマスターを登録し素晴らしいアウトプットを見てうれしくなるが、それは往々にしてその時の担当者の視点に留まっていて、時が経ち担当者が変わり後任のマスター登録が回らなくなりアウトプット実績が他の基準となる資料と合わなくなっていく。

担当者の上司も変わる頃には、実績がおかしいことが話題になり、ベンダーの甘い誘惑に負けて最新のツールは何でも安く・早く・上手くできるように思え、また新たな管理視点を入れた最新のBI導入プロジェクトが立ち上がって行く。

なんてこと、皆さんの周りで起こっていませんか?

分析のためのマスターはメンテされない。どうすれば良いのか?決定打はなさそうだが、いくつかポイントを挙げてみる。

1.マスター登録の業務設計が成されていない。不十分。

誰が、どういうトリガーで、何のマスターを登録するのか、この業務設計がキチンとできているか?突っ走る分析担当者にこの重要性を認識してもらうのが中々大変。

2.管理の目的が組織全体で共有されているか?

管理するデータが生成されるタイミングで同時に分析のための分類が登録されないと後から付与するのは初回はともかくメンテが大変。そのためには管理の目的が組織全体で共有されていることが大事。

3.利用されるコードセット(リファレンスデータ)の標準コード

利用されるコードセットの標準コードが定義され運用されているとマッピングの回数を減らすことができる。標準コード類は後から導入できない。先に合意しておいてデータ生成組織が運用する現地コードの属性として追加していくとか、システム更新の機会をとらえて導入するとかが必要。

結局、できる限り管理対象のデータが生成される上流で管理のためのマスターが登録されないとだめかなぁ・・・。

デジタル・トランスフォーメーション(DX)とデータ・マネジメント(DM)①

デジタル・トランスフォメーション(DX)とは、デジタル(データ)とトランスフォメーション(変革)を組み合わせたものである。当然そこではデータ・マネジメント(DM)の要素がコアとなるはずだが、世の中そのようには理解されていないらしい。

ここではまず、2019年に経産省から発表されたDXレポート、DXガイドラインの内容について吟味してからDXとDMの関係に迫りたい。

DXレポート(2019年9月/57ページ)
~ITシステム「2025年の崖」の克服とDXの本格的な展開~

  1.  検討の背景と議論のスコープ
  2.  DXの推進に関する現状と課題
    1.  DXを実行する上での経営戦略における現状と課題
    2.  既存システムの現状と課題
    3.  ユーザ企業における経営層・各部門・人材等の課題
    4.  ユーザ企業とベンダー企業との関係
    5.  情報サービス産業の抱える課題
    6.  DXを推進しない場合の影響 (2025年の崖)
  3. 対応策の検討
    1.  「DX推進システムガイドライン」の策定
    2.  「見える化」指標、診断スキームの構築
    3.  DX実現に向けたITシステム構築におけるコスト・リスク低減のための対応策
    4.  ユーザ企業・ベンダー企業の目指すべき姿と双方の新たな関係
    5.  DX人材の育成・確保
    6.  ITシステム刷新の見通し明確化
  4. 今後の検討の方向性
  5. 終わりに

DX推進ガイドライン(2019年12月/10ページ)

  1.  はじめに
  2.  『デジタルトランスフォーメーションを推進するためのガイドライン』

 1)DX推進のための経営のあり方、仕組み

          • 経営戦略・ビジョンの提示》
          • 《経営トップのコミットメント
          • 《DX推進のための体制整備》
          • 投資等の意思決定のあり方》
          • 《DXにより実現すべきもの: スピーディーな変化への対応力》

 2)DXを実現する上で基盤となるITシステムの構築

体制・仕組み

          • 《全社的なITシステムの構築のための体制
          • 《全社的なITシステムの構築に向けたガバナンス
          • 《事業部門のオーナーシップと要件定義能力

実行プロセス

          • IT資産の分析・評価》
          • 《IT資産の仕分けとプランニング》
          • 《刷新後のITシステム:変化への追従力》

まず、DXレポートの2「 DXの推進に関する現状と課題 」は以下の図で概観できる。

DXレポート2.1概観

2-1:DXを活用する経営戦略がない。
2-2:既存システムがDX推進の足かせ
2-3:業務の見直しに対する反対勢力を押しきれない
2-4:ユーザ企業からベンダー企業への丸投げ
2-5:受託事業を中心とした
情報サービス産業ビジネス・モデル
はこのままでよいのか?

最後の2-6として「2025年の壁」が述べられている。
複雑化・老朽化・ブラックボックス化した既存システムが残存した場合・・・

経済損失は、2025年以降、最大12兆円/年(現在の約3倍)にのぼる可能性がある。

一方で、こうも書かれている。

【DXシナリオ】2025年までの間に、複雑化・ブラックボックス化した既存システムについて、廃棄や塩漬けにするもの等を仕分けしながら、必要なものについて刷新しつつ、DXを実現することにより、2030年実質GDP130兆円超の押上げを実現。

つまりレガシーな既存システムを温存した場合と、DXを実現した場合の差は、-60兆円(12兆円/年 x 5年)vs + GDP 130兆円というわけである(マイナスは主にITサイドであり、プラスはDXから生まれるビジネス価値なので単純に足し算はできない)。

この巨大な市場を誰が無視することができよう。いや皮肉を言う前に明確なことがある。レガシーシステムが今後5年間で仮にゼロになっとしても、その間に30兆円(60兆の半分)は経費が使われるということになる。さらに今後作られていくシステムも、作ったそばから陳腐化する。これはDXレポートでも指摘されている。しかし、ITシステムだけが問題なのだろうか。

次回は、企業の資産とはITシステムなのかDataなのかという点を議論したい。https://dama.data-gene.com/index.php/category/dx/

データ品質管理の具体的な成果物

昨今、データ利活用によって新たな価値を創出することや、コロナ禍で対面での業務が難しくなりアフターコロナ、ウィズコロナのデジタル化された働き方が求められる中で、データ品質=「データが使える状態であること」がますます重要になってきています。

一方で、DMBOKでは、幅広く考え方やアクティビティが記載されているものの、成果物サンプルが少ないため、具体的なイメージが掴みづらい…という声を聞くことがあります。

データモデルなど、手法が確立している(統一されているわけではなくとも)分野はまだ良いとしても、一般的なシステム開発/運用で、あまり馴染みのないデータ品質管理はなかなかイメージがつきづらい分野の一つです。

DAMA日本支部:第8分科会(データ品質に関する研究会)では、実際に手を動かす一助となることを目指して、DMBOKに沿って進めるならどういう成果物を作って行けばよいのか議論しており、2019年に、DMBOK1に基づいた成果物として、データ品質管理を進めるためのワークシートを完成しました。
※下記のリンク先で公開しているので、ご興味のある方は是非ダウンロードいただければと思います。

http://www.dama-japan.org/PublishedMaterials.html

ワークシートの内容についてはDAMA日本支部の会員には総会などでも報告・共有していますが、公開資料としてももう少し解説があるとよいかなと考えており、この場を借りて、少しワークシートの概要を紹介したいと思います。

DQワークシートの概要

ワークシートは4つのシートで構成されています。DMBOK1アクティビティとワークシートの対応関係は下図の通りです。

図:DMBOK1アクティビティとワークシートの対応関係

DMBOK1アクティビティを踏まえて、各シートで記載すべき項目を定義しています。各シートに項目説明がありますのでそちらを参照ください。各シートの概要は下記の通りです。

①ビジネスニーズ整理ワークシート
ビジネスニーズを5W1Hの観点で纏める。ここでは、対象となるデータセットの特定には踏み込まずビジネス視点で必要な情報とその情報に求められる品質要件を纏める。

②DQ管理対象検討ワークシート
具体的に対象データセットを決めて、実データを見た上で、データ品質管理対象を絞り込む。

③DQチェック精緻化ワークシート
データ品質のチェック方法を精緻化して、チェック結果が意図したものになるかビジネス部門とIT部門で確認・合意する。

④検査・レポート運用整備ワークシート
モニタリングとアラート検知時の運用方法を決める。

今後のブラッシュアップ

現在のワークシートVer.1.0はDMBOK1に沿ったものなので、今後は、DMBOK2に沿って、ワークシートをブラッシュアップしていこうとしています。

また、ワークシートを使ってみて、良かった点、改善点などありましたら、フィードバックいただけると嬉しいです。今後に活かしていきたいと思います。どうぞ宜しくお願い致します。

DAMA日本支部の課題と今後

このブログでは主にデータマネジメントについてのお話が多いのですが、今回は趣向を変えて、当DAMA日本支部の運営のお話をしようと思います。
このブログを読んでくださる会員をはじめとしたみなさんにも、是非この機会に当会の運営や課題について知っていただければと思っています。

日本支部の歩み

2020年7月現在、DAMA日本支部の会員数は現在121名で、法人の会員は13社になっています。
設立時の会員数は100名弱だったのですが、2014年をピークに年々減少し、2017年には75名程度まで減少していました。しかしその後、2代目会長の林さんの下、お試し会員の募集やDMBOK2の日本語版の発刊、DMBOK概説セミナー開催などの積極的な対策を取り、データ活用機運の高まりとともに会員数も回復してきました。
DMBOK2も早々に売り切れて増刷されるなど、今後もデータマネジメントへの関心が高まっていくと思われ、当会もサステナブルな組織運営基盤を作っていく必要があると考えています。

今は任意団体

データマネジメントを日本にも普及・定着させようという意図のもとで設立されたDAMA日本支部ですが、残念ながら未だに任意団体でしかなく、協賛や後援いただいているJDMC様やUMTP様のように一般社団法人やNPOではありません。
任意団体でもできることはたくさんありますし、当面の問題にはなっていないのですが、法人格を持っていないといろいろ不都合なこともありまするようです。
例えば、任意団体では法人としての銀行口座が作れないために会長名義で口座作成せざるを得ず、会長交代時には名義変更が必要になります。
その他にも商標登録しにくいとか、法人によっては任意団体では社内申請が行いにくいなどの弊害もあるようです。
理事会でも一般社団法人化を進めようという話になっていますが、素人が進めるには中々にハードルが高く、遅々として進められていないのが実情です。

これから

CDMPの日本での普及、DMBOK3の日本語化など、これからもパワーを要する課題は山積です。
これまでは、データマネジメントの普及に情熱や志のある現在理事のボランティアシップで支えられてきましたが、いつまでもそこに頼っていては先細りになりかねません。なんといっても理事は現在13名ですが、設立から10年近く経ち、50歳台未満は数名のみと高齢化が進んでいます(失笑) 。
また、広く参加していただくことを目的に当会は会費も低廉に抑えているので、年間予算も十分にあるわけではなく、人を雇って業務依頼するということも困難です。
こういった背景を含めて、待ったなしで今後の運営を検討し、サステナブルな組織にして、 データマネジメントを普及するための DAMA日本支部という組織を成長させていく仕組みが必要だと感じています。

運営を手伝ってあげようというご危篤な方、こうしたらいいのではというご意見のある方、管理担当(admin@dama-japan.org)まで、是非ご連絡をいただけたらと思います。お待ちしています。

アフターコロナ時代だからこそ高まるデータマネジメントの重要性

コロナは我々の行動スタイルを変えてしまった

新型コロナウィルスは、我々のビジネス上や日常生活上の行動を根底から覆してしまいました。ワクチンが開発された後であっても、「仕事をすること=オフィスに行くこと」ではなくなり、これまでのノーマルでは「何はなくとも、定期的にお客様へ訪問営業すること」でしたが、ニューノーマルでは「本当に重要な商談以外は対面ではなく、リモートで済ませたい」となるでしょう。また、「賑わって混雑しているお店でショッピングを楽しむ」というノーマルな日常生活が、ニューノーマルでは「何かあったら怖いので、できるだけ”密”を避けて短時間で済ませたい」という行動を取る人が必ず一定層は残ると思いませんか。

このように、我々の行動が“密”を避け、“疎”を求めるようになると、これまで企業が対人・対面(リアル)で当たり前のようにできていたことができなくなり、自社のお客様とのリレーションシップをよりオンラインで、つまりデータを通じて良好に維持し、他社に奪われないように強固にしなければならない、と気付くと思います。では、ひとたび目を転じて、自社のリアルおよびオンラインにおけるお一人おひとりのお客様とのタッチポイントで発生しているデータが現状どのようになっているか?

多くの企業では、自社の様々なシステムにお客様に関するデータが散在し、相互につながっていなかったり、いちいち個別のシステムの中のデータを調べなければどのような対応履歴があったかを把握できない、そんな状態になっていませんか。お客様やお客様が買ってくださった商品などに関わる基軸データが社内の様々なシステムに分散し、「つながっていないので、行動履歴がバラバラになってしまっている」、「整合性や精度に難があるので、信頼できない」、「社内のどのシステムにどのデータが存在し、それらがどのように連携しているのかが可視化できていない」といった現状に直面する会社がほとんどだと思います。

改めて、データマネジメントの重要性が否応なく高まる

これまでマーケティング、営業・販売、設計・製造、デリバリー、アフターサポートなど、個別部門の業務処理の「電子化」を目的として構築されてきたシステムの中のデータを活用しようとすると、それらを「“疎”を求める自社のお客様との関係性を良好に維持するために活用できる状態」に再編成し直すための取り組み、すなわち、全社的なデータマネジメントが必要不可欠となります。

「情報(データ)は、ヒト、モノ、カネと並ぶ第4の経営資源である」といわれて久しく、昨今では「データは次のオイル」などと喧伝されるようになりました。また、巷ではデジタルトランスフォーメンション(DX)、つまりデジタル(=データ)による自社の事業変革の必要性が叫ばれ、AIやIoTなどの情報技術の進化と浸透によりネットだけでなくリアルの世界でも、ヒトやモノのあらゆる動きが「行動データ」で取得していくことが可能になりましたが、いくら膨大な「行動データ」が取得できたとしても、それらが自社の大切なお客様や商品としっかりつながっていない限り、活用することは決してできません。

データを真のオイルに変えるためには、「それを活用可能な状態に精錬するためのプロセスや体制」や「自社内外のデータ資源の可視化と整備」が重要になることは論を待たず、お客様とのリアルな接点が「疎」に傾倒するアフターコロナ時代だからこそ、データマネジメントの重要さが改めて認識されるでしょう。視界不良な環境であればあるほど、正しいファクト(=データ)に基づいた意思決定を行うべきは、国においても企業においても変わらず、データマネジメントに真摯に向き合う企業、そうした経営者やリーダーがいる企業こそがアフターコロナ時代でもお客様への価値を弛まずに提供し続けられるものと確信します。

DAMA Japan 企画担当理事/株式会社リアライズ 代表取締役社長 大西 浩史

DAMA-JとJDMC

国内のデータマネジメントを推進する団体は、企業や企業のユーザ向け研究会を除いて、DAMA-JとJDMC(Japan Data Management Consortium)がある。JUAS(Japan Users  Association of Information Systems)の中にもデータマネジメントの研究会があるが、JUAS自体はデータマネジメントに特化した団体ではないので、ここではDAMA-JとJDMCについて述べる。

JDMCは2011年4月に設立され、現在9年目を迎え、会員数200を超える団体となっている。私はJDMC設立からJDMCの研究会活動他に参加しており、DAMA-Jでの活動より長く携わってきた。
近年、JDMCのメンバやデータマネジメントを勉強しようとするメンバから、DAMA-JとJDMCはどこが違って、どちらに参加した方がよいのかと相談を受ける機会が多い。私見になるが、DAMA-JとJDMCの違い(棲み分け)について、今回は述べていく。

DAMA-JはDAMA Internationalでの活動を日本で推進することが主な活動となる。具体的には、DMBOK(DATA MANAGEMNT BODY OF KNOWLEDGE)の普及が主要活動としてあげられる。また、毎年ADMC(Asian Data Management Conference)を1日のカンファレンスとして開催し、海外からのデータマネジメント有識者やDAMA-Iからメンバを招聘して海外の事例も含め紹介している。
まとめると、DMBOKの普及、海外からのデータマネジメント有識者を招いての講演の提供はDAMA-Jの主要活動であり、これはJDMCの活動にはない。

JDMCは、企業、行政機関、大学など広い範囲のデータマネジメントに関わるメンバが参画されている。JDMCが主催するデータマネジメント2019では、1日のカンファレンスに1000名を超える参加者があった。2020年はコロナ対策として、急遽Webによる開催に変更したが、2019年の参加者を超えるメンバが参加された。
JDMCでは、毎年、データマネジメントにおいて、他の模範となる活動を実践している企業・機関などの中から優秀なものを選定しデータマネジメント賞を送呈している。JDMCの定例セミナーで、データマネジメント賞を受賞した団体からの推進活動の内容も聞くことができる。
また、青山学院や横浜国立大学で、学生に向けたデータマネジメントに関する講義も各大学教授からの依頼により、JDMCの有志メンバが講師となって開催されている。

上記以外にJDMCの最大の特徴は、研究会活動の充実にあると思っている。「デジタルマーケティング」、「MDMとデータガバナンス」、「AIとIOT」など特化した分野での研究会活動があり、この他に私が所属する「データマネジメントの基礎と価値」の研究会では、研究会メンバで合宿も含めて多くの議論の時間を費やし、データマネジメント概説書(JDMC版)を作成し、発刊に至っている。
データマネジメントに関わるメンバ(初心者を含む)が抱える課題をできる範囲で共有し、メンバと議論して気づきを得る場を提供しているのが、JDMCの特徴と思う。

DAMA-Jは有識者が多く、データマネジメントの初心者には参加は敷居が高いという声をよく聞く。ある程度のデータマネジメントの知識がないと、また、DMBOKを読んでいないとDAMA-Jに個人会員として入るには躊躇われるという声である。

DAMA-Jでは、この声に応えるため、「DMBOKに関する研究会」も立ち上がり、各章を1回の研究会の中で説明と議論を行う場が提供されている。
また、DAMA-J会員以外にもDMBOKの紹介を行う機会やデータマネジメントの概説を行う機会が企画されている。

私見だが、データマネジメント推進するメンバは、DMBOK(現在はDMBOK2)を読んでおくことは、必須であると思う。日本語版も出ているので、まずは購入いただき、読んでいただきたい。ただ、600頁を超える大書であるので、重要ポイントなどの概説を聞いて、読み込んでいく支援をDAMA-Jとしてはさらに行っていく必要があると考えている。

冒頭の「DAMA-JとJDMCはどちらに参加した方がよいのか」という質問に答えるとDAMA-J、JDMCともに参加し、DAMA-JではDMBOKの知識の習得と海外のデータマネジメントの推進事例の把握、JDMCでは自分のデータマネジメントに関する悩みにあった研究会に参画し、メンバとの議論による気づきの発見を行っていただきたい。

今までは、DAMA-JとJDMCでの交流はあまりなかったが、今後は国内でのデータマネジメントの推進をさらに加速するために手を組みあうべきと思う。一つの例として思っているのは、JDMCでDAMA-JからDMBOKの紹介や講義が行えないかである。DAMA-JとJDMCが共存してその相乗効果をあげられるよう、微力ではあるが努力していきたい。

以上

パッケージシステム導入時のデータモデル

パッケージシステムでは、多くの業種とその業務プロセスに対応できる、柔軟な標準機能が用意されています。そのためパッケージ導入プロジェクトでは、新規業務をこうした標準機能でどこまで対応できるか、Fit&Gap分析を行います。

たいていのプロジェクトでは、この分析時にプロセスモデル図を作成し、
・どのプロセスにどのパッケージ標準機能が対応するのか
・パッケージ標準機能が対応できない業務は、アドオンを導入するのか、追加開発するのか
を明らかにしていきます。

データ構造もFit&Gap分析が必要

一方、パッケージは機能だけではなく、データを格納する標準データ構造(テーブルなど)も用意しています。
機能をプロセスモデル図でFit&Gap分析するのと同じように、新規に管理すべきデータと標準データ構造をデータモデルで図化して分析すれば、より漏れ無く無駄の無いパッケージ導入ができるはずです。

ただ実際のパッケージ導入プロジェクトの多くで、プロセスモデル図は作られてもデータモデルはあまり作られないようです。
それで問題が起きなければいいのですが、そういったプロジェクトではテーブルやI/F設計の手戻りが発生したり、データの移行設計が見直されたりすることが多いように思えます。

データモデルに工数をかける価値

なぜパッケージ導入プロジェクトで、データモデルは作られないのでしょうか。
まず、パッケージ導入が短期間のシステム構築を目的としているため、データモデル作成の工数を懸念されるのかもしれません。既存システムからパッケージの移行設計をしなくてはいけないのに、データモデルまで作るのは負荷が高い、などなど。
ただ移行範囲全体を表すデータモデルが一枚あると、詳細な移行設計前に移行元と移行先の関係を確認でき、対象データの漏れや重複の確認ができます。移行設計の手戻りは移行作業の負荷とテストの精度にも影響を与えるので、早い段階で移行検討できるのは価値が高いでしょう。

モデリングコミュニティとしてのDAMA

データモデルが作られないのは、パッケージ導入の現場にデータモデルを読み書きできる人材が少ないこともあるでしょう。データモデラーはどうしても手組みシステム開発の現場にアサインされがちです。
またプロセスモデル図がプロセス間の関係を順に追って読めるのに対して、データモデルは記法による表現の違いが大きく、読むのにもある程度の学習が必要です。

もしこのエントリーを機にデータモデルを学びたいという方がいらっしゃったら、書籍を読んだりセミナーに参加したりするのに加えて、DAMA日本支部に入会されることをオススメします。実はDAMAには、メインフレームのシステム開発時代からデータモデルと格闘してきた、データモデラーの“猛者”たちが集っているからです。
特に、第10分科会「データモデリングの実践的検討会」では具体的なデータモデルをベースにノウハウの共有を行っていますから、パッケージ導入時のコツについて聞くことができるかもしれません。