デジタル・トランスフォーメーション(DX)とデータ・マネジメント(DM)②

11月10日に開かれたADMC(Asian Data Management Conference)2020は、成功裏に終了できました。ありがとうございました。お申し込みは300名を超え、瞬間視聴者は200名に迫り、大変なご好評を頂きました。

さて、このADMCカンファレンスのタイトルでもある「」世界各国におけるDXの取り組みとデータマネジメント」について、前回に続き、つらつらお話ししたいと思います。

ご存知のように、Digital Transformationとは、DigitalizationとTransformationの2つの変化が同時に起こることを意味します。ところが現在世の中に広まっているDXのイメージにはその2点が含まれているのでしょうか。いきなりDXに予算を付ける前に、少し立ち止まって考えて見ることも必要だと思います。

まず、Digitalizationとは、増大するデジタル情報を如何に効率的に処理して、ビジネス価値に結び付けることを意味します。ちなみに、https://en.wikipedia.org/wiki/Digital_transformation では、以下のように定義されています。

「Digitalization (of industries and organizations) 
Unlike digitization, digitalization is the ‘organizational process’ or ‘business process’ of the technologically-induced change within industries, organizations, markets and branches.

日本語訳:デジタル化とは異なり、デジタルライゼーションとは、業界、組織、市場、支店内で技術的に引き起こされた変化の「組織プロセス」または「ビジネスプロセス」」

これを見ると、Digitalizationには既に「Transformationを意味する変化」という言葉が含まれていることがわかります。実は以下が、https://www.etymonline.com/word/digitalizeに掲載されている語源です。

ではDigitalの語源は、https://www.etymonline.com/word/digital?ref=etymonline_crossreferenceに以下のように示されています。

元々「指先」という意味だったんですね。指で数える、10以下の整数にする、それが0と1に置き換える(デジタル情報化)ということになったということですね。当然ですが、この時点では「変化」という意味合いは全く含まれていません。最近になってITと絡めたマーケティング的な意味合いになってきたということでしょうか。

このブログでは、デジタル化に伴う変化については別途取り上げることとし、デジタル情報に話を絞ります。

デジタル情報とは、もちろんコンピュータが処理可能なデータのことを指します。画像や音声情報でも全てデジタル化され処理されます。ここでデータを処理することと、データを管理することは全く異なります。管理されていないデータを処理してしまうと、そこからどんな品質のアウトプットが出てくるのかわからない。

一方で、データはコンピュータで処理するためにディスクなどに保存されているのだから、管理されているではないか、という方もいます。つまりPDFやMS Officeファイルがフォルダーに保存されている、データがデータベースに保存されている。フォルダーは階層構造で名前が付けられて分類されているし、データベースでも個々のデータが入る場所が決まっているではないか。

本当にこの状態でデータが管理されていることになるでしょうか。何かを管理するということは、それらをビジネスに役立てることができるということです。いや、もちろん今でも業務に役立っていると言われるでしょう。ファイルをコピペして修正しあっという間に業務文書が作れるではないかと言われるでしょう。その通りです。紙がなくなっただけましだということです。

ただ、より大きなビジネス価値を生み出すためには、管理方法も進化しなければなりません。価値の増大にはレベルがあります。例えば、「社内日常業務の効率化」は属人的な作業からより共通化した業務プロセスに進化するするでしょう。今までのITはこのレベルの達成を狙っていたことは事実です。つまり業務効率化のコストセーブの分が、IT予算よりも大きいことが予算獲得のキーでした。

基本的に情報は基本的に階層構造では分類できません。情報と情報を関連付けることしかできません。一方で情報を構成する最小単位にまで分解(データ化)すれば、データモデルに落とし込むことができます。ただデータモデルは階層構造ではなく、ネットワーク構造です。

何を言いたいかと言うと、デジタル化された対象(ファイル、情報、データ)を処理したり分析するためには、前提として「関連付け」が行われなければならないということです。もちろんこの関連付け自体がデジタル処理でもあります。

ここで重要なのはデジタル化された情報や、分解されたデータの定義です。よくものの定義はその関連性においてのみ意味をもつということが言われます。逆に言えば、定義と関連性は一対ということになります。

次回はこのTransformationについてお話ししたいと思います。

データ品質管理の具体的な成果物(その2)

前回私が担当したブログでは、第8分科会で整理しているDQワークシートの概要をご紹介しました。今回は、その中でも「ビジネスニーズ整理ワークシート」にフォーカスしてご紹介したいと思います。
(※DQワークシートはこちらよりダウンロードいただけます)

実は、第8分科会でワークシートの議論を進める中で、最も時間がかかったのがこの「ビジネスニーズ整理ワークシート」です。

ビジネス要件を品質要件に落としていく部分は、DMBOK1の記述でも抽象度が高く、様々な議論がありましたが、何かしら軸になる整理の仕方が必要ということで、「5W1H」の観点をベースに据えて定義すべき項目を整理しています。

ビジネスニーズ整理ワークシート

このワークシートでは、下記の要素を整理していきます。

  1. ビジネスニーズ(Why/What)
  2. 業務プロセス(Where/When)
  3. 業務プロセス関連組織/担当者(Who)
  4. 情報要求(What)
  5. データ品質要件(How)

今回は、 1.ビジネスニーズ、4.情報要求、5.データ品質要件に触れて、メインの流れをご説明していきます。

ビジネスニーズ(Why/What)

まず、背景、目的とビジネス観点での要求事項を明らかにします。実現したいことを理解する上で、背景や目的が重要なのはもちろんですが、では、要求事項はどの程度まで明らかにすれば良いのでしょうか。

ワークシートのサンプルでは下記のように定義しています(一部抜粋)。

  • 背景:改正派遣法の遵守
  • 目的:客先に派遣する社員に対するキャリア形成制度を維持すること
  • 要求事項:新入社員は3年連続で技術系の研修(8h/年)を受講しなければならない
    →技術系の研修で8h/年を満たしていない該当年次者が居ないこと

要求事項をデータ品質要件につなげていくためには、ここで、必要な情報の「範囲」と「粒度」をある程度明らかにする必要があります。サンプルの要求事項からは下記が読み取れると思います。

  • 範囲:
    • 入社3年目までの社員
    • 年間の研修時間
  • 粒度:
    • 社員個人
    • 研修の分類(技術系など)×時間数(h)

このくらいまで定義できれば、求められる情報が具体的にイメージできるかと思います。

情報要求(What)

要求事項を満たすために必要な情報を整理します。最終的にはデータ品質管理はカラムをベースに実施していくことになるので、一つの要求事項を満たすために必要な情報について項目をイメージしながら分解し、定義していきます。上記のように情報の範囲と粒度を意識すると、定義しやすいと思います。サンプルでは下記のように定義しています(一部抜粋)。

  • 受講者個人を特定できること
    • 社員の年次が正しいこと
    • 研修が技術系/ヒューマン系のいずれかがわかること
    • 受講年度単位の研修時間がわかること

この段階では、特定のデータセットに引きずられないように、業務的に必要な情報の定義にとどめます。要求に適したデータセットを探すのは後続のワークシートで実施します。

データ品質要件(How)

1つの情報要求に対して、データ品質評価軸(正確性、完全性、・・など)を当てて、データ品質の観点から求められることを洗い出します。後で実データを見てから追加することもできるので、まずは、机上で重要なポイントを定義します。

例)情報要求:受講者個人を特定できること
    →【完全性】 社員を識別する項目に抜け、モレがないこと

この他にもこのワークシートで定義すべき項目はありますが、大きくは上記のような流れで進めます。

終わりに

先日の第8分科会では、この「ビジネスニーズ整理ワークシート」を利用して、少し別の角度から、データ整備の進め方について検討されている方々とお話しすることができました。 実プロジェクトで活用されている事例も出てきており、 私達のアウトプットがデータマネジメントに取り組まれる方々の活動に、具体的に寄与できるのは非常に喜ばしいことだと改めて感じています。

半径2メートル雑感2題

ここ最近の出来事で感じた半径2メートルでの出来事の雑感を書いてみようと思います。

ADMCの字幕付け
今回のADMC2020は、初めてのZoomウェビナーでの開催です。
現在、企画担当理事を中心に鋭意準備をしています。
今回は外国人スピーカーは招聘せず、スピーカーからビデオを事前にいただき。理事で分担して日本語字幕を付けて流す形にしましたので、英語の苦手な方も視聴しやすい形になっていると思います。
とは言え、私は英語がサッパリなので英語堪能な林会長の補助として、会長が翻訳した内容の校正のお手伝いを行いました。担当は欧州・イタリア代表のNinoさんの分担でした。
内容は是非ご参加いただいて視聴いただきたいのですが、欧州では国を超えての活動や交流、研究成果の共有などが活発なようで、アジアとは随分様相が違うなぁと感じた次第。
言語の壁はありますが、今後はAsian Data Management Conference の名に恥じないカンファレンスにしていきたいものです。
近隣の中国、韓国をはじめとして、東南アジアの各国とも連携強化していきたいですね。(その前に英語をなんとかしないとですが…)

ITモダナイゼーションとデータ
縁があって、最近ITモダナイゼーションの仕事をしています。
メインフレームからのOPEN化が主な業務ですが、なかなかに難しく、過去に作りこまれた謎解きに追われています。
そういった中、データの移行や更改などは二の次になっていて、プログラム資産の移行が主題になることが多いなと改めて感じています。
もちろん、言語変換やリビルドはテストも含めて工数もかかりますので、どうしてもそちらがメインテーマになってしまい、データ整備が劣後してしまうのは致し方ないのかもしれません。
しかし、データを見ると様々な過去の残滓が残っていて非効率なことも多々あるので、この際一気にきれいにしてしまおう!とすると追加の費用がかかり、かつプログラムへのインパクトが少なくないということで、データは現在のまま、そーっと新環境にもっていこう、という結論になってしまい勝ちなようです。
システム更改の時期になってしまってから何とかしようとしても、現状ではそれをなんとかするソリューションは無いように思います。
なので、いざシステム更改の時に一番大事な資産であるデータが置いてきぼりにならないように、日頃から少しずつデータマネジメントを進めておく必要があるなぁと今更ながらに感じています。