座学でデータマネジメントを学ぶには

データ利活用を推進するために、データマネジメントやデータガバナンスに関心を持つ組織が増えています。それとともに、組織内にデータマネジメントの知見が無いため、まずは一般的な教育を受けるところからはじめたい、という方も増えてきています。
効率的に自社に必要な知識を学び、同時に組織内のデータマネジメントを実践するには、外部の専門家に入ってもらい、プロジェクト化するのが手っ取り早いでしょう。今後組織のデータマネジメントの中核を担うメンバにもプロジェクトに参加してもらい、OJTで手を動かしながら学んでいくやり方です。
ただ組織が必要とする特定のデータマネジメントの専門家を見つけられない場合、独力で座学で学んでいくことも必要です。

座学でデータマネジメントを学ぶ3つのステップ

私はデータマネジメントについてわからないことがあると、次のようなステップで調べ、学んでいます。

その1 DMBOKで基本に立ち返る

なにかわからないことがあれば、まずはDMBOKを開いています。
データマネジメント知識体系ガイド 第二版
https://www.nikkeibp.co.jp/atclpubmkt/book/18/270160/

翻訳メンバだったこともあり、英語原本も日本語版ももうすでに何度となく読んでいます。ですが新たに経験した現場の成果物や組織体制を踏まえて読み返すたびに、「この成果物や考え方は別の場面にも適用できるな」などと、新しい気づきが得られます。
データマネジメント未経験者の方も、DMBOKを何度も読み返せば、全般的な知識を学べるはずです。
ただし、DMBOKは日本語版の本文だけでもおよそ650ページあり、また具体的な成果物やルールの記述が少ないため、ひとりで最初から最後まで通して読み切るには、なかなか歯ごたえがあります。
おそらく英語圏でも同じような悩みがあるのでしょう。DMBOKの出版責任者の方が、DMBOKの概説書を英語で出版されています。英語が堪能な方は、まずはこちらを読み込み、より深く学ぶときにDMBOK本体にあたられるといいかもしれません。
Navigating the Labyrinth: An Executive Guide to Data Management
https://technicspub.com/dmbok/

その2 WEB教育プラットフォームで最新情報を押さえる

現在のDMBOK第2版の英語原本が出版されてから、すでに3年が経過しています。データマネジメントも、新しい技法や考え方が出てきています。
私はこうした情報を、WEBの教育プラットフォームのコースや解説記事を通じて仕入れています。特に、毎年DAMA-Internationalと国際的なデータマネジメントカンファレンスEDW(Enterprise Data World)を開催しているDataversityのサイトは頻繁に巡回しています。
Dataversity
https://www.dataversity.net/

有料のトレーニングコースもありますが、その時々のデータマネジメントやガバナンスのトレンドを押さえるのであれば、Webinarをチェックすれば十分でしょう。(https://www.dataversity.net/category/education/webinars/upcoming-webinars/
ここでWebinarを開催しているDMBOKの著者もいます。彼らのWebinarではDMBOKには載せていなかった事例や成果物イメージを確認できることもあるので、おすすめです。

その3 SNSで疑問を直接専門家にぶつける

書籍やWebinarの疑問は、著者または講演者本人にSNSを通じて質問します。海外、特にアメリカの著名なデータマネジメント専門家の多くが、LinkedinかTwitterのアカウントを持っていて、直接コンタクトを取ることができます。
またLinkedinではグループ機能で専門家を中心にディスカッションが行われているので、参加してみるとおもしろいでしょう。

日本語で学ぶならまずはDAMA日本支部へ

上記以外に日常的に参照している書籍やサイトもありますが、だいたいなにか知りたいことがあると、この3ステップのどこかで解消されます。
また書籍代以外は基本無料なので、金銭コストを避けたい学生や若手の方にもおすすめです。ご参考ください。
ただ、その2もその3もそれなりの英語力が必要になります。
やはり語学のハードルは高い、日本語で幅広く学びたい、という方はDAMA日本支部にご参加ください。
テーマ別の分科会だけでなく、最近では2~3ヵ月に一度DMBOKの概説セミナも実施しています。また国内の専門家が所属しているので、分科会/セミナの場で直接質問をぶつけてみてはいかがでしょうか?

マネジメントへの挑戦

データ管理は何のためにやるのでしょうか?
企業であれば,競争に打ち勝つため,極論をいうと生き抜くためのマネジメントの一環だと私は思っています。

であれば,データに携わる我々はもっと経営について関心をもつべきかと思います。ということで,今年のお正月は、復刻版の「マネジメントへの挑戦(一倉定)」を読んでみました。私にとっては遠縁かつ高校(旧制中学)の先輩にあたる方ですが,これまで著作は読んだことはなく,名前のみ知っていました。

基本的に読みやすい本なのですが,目から鱗の個所が多々あり,今年はいいスタートが切れた感じです。その中で,いくつか内容を紹介したいと思います。

① バランスのとれた組織ではダメ
「すぐれた会社,成長する企業は,組織面だけでなく,いろいろな面でつねにバランスをやぶって前進している。アンバランスが成長途次の姿なのである。」

組織のアンバランスさを大事にする,組織がどんどん変化する。こうしたことに情報システムはポジティブに反応できていないのではないか。組織変更するとシステム改修が発生して大変とか,時間がかかるとかはよく聞く話ですよね。要件定義の要素として可変性分析がありますが,組織については可変であるという前提で,データモデリングしておきたいところです。

② 二つの原価計算
全部原価計算と直接原価計算
すごく乱暴な言い方をすると,全部原価計算とは,間接費も案分・配賦して製品ごとの原価を算出する財務会計としての原価,直接原価計算は直接費と間接費に分けて管理する管理会計としての原価

本書では,どの製品を捨て,どの製品を伸ばしていくかは直接原価計算でなければ判定できないということを主張しているわけです。詳細は省きますが,全部原価計算の場合,配賦ということが経営判断を誤らせる元凶ではないかと思います。

企業が大きく,複雑になってくると,この配賦コストの仕組みも複雑になり,これを取り去った直接費を取り出して分析することが困難になってきます。これは,情報システムが全てのデータを最小粒度で保持していれば,直接費と間接費を分離できるかもしれませんが,事業部門,子会社,関連会社を通して原価を正しく分析しようとしても,データフローの途中でデータが合算され分離できなくなっているケースが多々あります。トランザクションデータを加工前の状態で保持していれば,集計軸を変えれば良いだけですが,合算されてしまうとどうにもなりません。

他にも企業レベルで情報システムとそのデータモデルを考えるうえで,多くの示唆を得られる個所が多々あります。機会あれば,他の個所もデータ管理やデータモデルと絡めて紹介したいと思います。

標準化における、計画時や標準文書作成時、適用・運用時のポイント・コツ

前回までの私のブログ「標準の作成と定着化について」、「標準化の進め方について」に続き、標準化に関する最後のブログになります。

今回は、標準化における、計画時や標準文書作成時、適用・運用時のポイント・コツを記載します。

大きく以下の3つの分類毎に記載することにしました。

①計画段階
②作成段階
③適用・運用段階

標準化の進め方との関係は以下です。青色部分が、標準化のステップです。
今回記載するポイント・コツは、オレンジ色部分になります。

①計画段階の【5つ】のポイント・コツ

ここは、 これまでのブログ「標準の作成と定着化について」の最後に記載した、 「今後、標準化・標準文書作成を検討するにあたって・・・。」部分も参考にして頂けたらと思います。
また、プロジェクトと同様、きちんと計画書を作成し、関係者と合意した上で進める必要があります。

  • ポイント・コツの1】
    標準化もプロジェクトと同様、目的、範囲等を明文化し、標準化の計画書を作成、計画書を基に関係者と合意した上で進める。
  • ポイント・コツ その2】
    標準文書は、会社、組織で遵守しなければいけないものと、参考文書の位置付けのものとで、内容や用途が変わってくるため、計画時に標準文書の取り扱い方針を明確にする。
  • ポイント・コツ その3】
    誰のための標準文書であるかが重要。最初に方針を決めて、関係者に周知、合意してから進める。
  • ポイント・コツの4】
    ビジネス、業務において、どこの、どの部分の位置付けかを常に意識、明確化し、計画書にも記載し、実施する。
  • ポイント・コツ その5】
    いつの間にか勝手に作ったと思われ抵抗感をもたれることのないよう、現場を巻き込み、本取組みに参加してもらうよう現場を巻き込んだ体制を検討、計画をする。
    これにより、現場からの参加者が標準文書の伝道師となってくれる効果も見込めます。

②作成段階の【5つ】のポイント・コツ

  • ポイント・コツ その1】
    標準文書のはじめに、標準文書策定の責任者(もしくは経営層)のメッセージを記述し、会社全体の取り組みであることをアピールする。
  • ポイント・コツ その2】
    プロセスとインプット/アウトプットが明確で、そのフェーズ・タスクで何をやらなければいけないか、どの役割の人がやるか、どういった承認行為があるかが分かるものにする。
  • ポイント・コツ その3】
    標準文書は、知識や経験の少ない人のレベルに合わせて作成するが、それでも細かい技法や手法まで行き過ぎず、書き過ぎない。
  • ポイント・コツ その4】
    標準文書はページ数が膨大になると読まれなくなるため、適切な量とする。
  • ポイント・コツ その5】
    作成する標準文書は、要約版(説明会、上層部用)と詳細版(現場用)に分けると活用しやすい。

③適用・運用段階の【5つ】のポイント・コツ

  • ポイント・コツ その1】
    本格適用アナウンスや現場への説明会に経営層が参加し、会社全体の取り組みであることをアピールする。
  • ポイント・コツ その2】
    本格適用アナウンスや現場への説明会では、「どのようなものか」「何をするか」「どのようにするか」といった標準文書の説明だけでなく、「なぜ必要か」「どのようなメリットがあるか」といった動機付けをするための説明を欠かさないようにする。
  • ポイント・コツ その3】
    定着化するために、教育、啓蒙活動、定着状況の把握をする。
    会社の研修カリキュラムに標準文書の教育を組み込むと、認知・啓蒙につながり、転入者も勉強できる。
  • ポイント・コツ その4】
    標準文書の改善要望の反映や、組織・外部環境(法令等)の変化への対応ができずに実態と乖離して使われなくなるのを防ぐため、標準文書の管理者を明確にし、定期的にブラッシュアップする。
  • ポイント・コツ その5】
    標準文書はいつでも活用・閲覧できるように会社のポータルサイトに掲載し、バージョンアップ情報もタイムリーに分かるようにする。

今回で標準化は最後です。

以上、3回にわたり記載させて頂きました「標準化」に関する内容は、今回で終わりになります。これはデータマネジメントの標準に限らず、他の標準文書にも共通的に言えることと思います。 標準化を検討・実施する際の参考にして頂ければ幸いです。

蛇足になりすが、標準文書の構成要素をメタモデルとしてER図に表すことも過去実施したことがあります。標準文書に記載すべき構成要素について、議論・明確にするといった観点・方法としても面白く、有意義な取組みでした。

以上

ITベンダーとの関係を考える

 データマネジメントを始めるのに、「データモデリングから始めませんか?」というお話をし、その次に「データモデラーのお噺」と続けました。

 では、 データモデラーが居れば、或いは獲得すれば、すぐにデータマネジメントが始められるのでしょうか?その前にもう少しやっておきたいことがあります。
 データマネジメント自体が、業務部門の人とIT部門の人が一緒になって行う企業活動であることはDMBOKに記載されています。

 ここでは、データマネジメントに始まり、情報システムの開発(もちろん再構築を含みます)に至る話を書いていきます。

企業とITベンダー(古いスタイル)

  これまで少なくない企業で、情報システム部門、或いは情報システム子会社が次のような形での発注を行い、システムを構築して来ました。ITベンダーも様々ですが、こちらでは主にシステムインテグレータ(SIer)を指しています。

  • 企業内では、業務部門からの要望を情報システム部門が取りまとめ、これらを要求事項としてITベンダーに発注を行っていました。
  • ITベンダーでは、これらから対象となる業務の単位を一つの機能として設計し、機能ごとにプログラムを作成します。
  • この際、主に「業務フロー」が用いられ、ビジネスレベルでのデータモデリングが行われることは稀なようです。
  • ITベンダーから、二次受け、三次受け、など多重請負が様々な問題を起こしてきたことは知られています。
  • 発注した企業側は、完成したシステムの納品を受け、受け入れテストとして、実際の業務が行えるかという視点で検証を行います。この時点で、データがどうなるかという点においては、過去のデータが継続して使えるか以上の関心が持たれることは少なかったようです。
  • 実際には、納品時点で機能が足りない、仕様に齟齬がある、移行したはずのデータに問題が発生するなどの不具合を沢山見てきました。

実際には、このようにIT部門が要望を纏めて発注を行ってくる形態の場合でも、データモデリングを行い、既存システムがあるならデータプロファイリングを行うなど、業務上の情報の構造と実際のデータによる可視化を進めれば問題は相当に小さくなり、いわゆる凝集度が高く結合度が低い、改修が容易なシステム構築を行うことは可能です。しかしながら、その場合でもIT部門だけではなく、業務部門の方の協力が必要です。
 それでも、複数のシステム間の問題を解決するためには、データマネジメントによる全体の調整が必要です。

企業とITベンダー(新しいスタイル)

 企業内でデータマナジメントを実践するには、何らかの形でそれを推進する組織が必要です。

専任かバーチャルかなど、その形は企業により、その段階により様々になると思いますが、業務部門の人、つまり業務のエキスパートの方と、情報システム部門の人からなる組織を形成します。
 ここでデータ要件の定義やアーキテクチャの定義から、データ品質のマネジメントや、データ統合やBIなどを担っていきます。これまでITベンダーに依存してきた多くのことを自社内で担っていくことになります。
 これまでに持っていなかったスキルが必要になる部分や、先ずは組織化を行っていく部分については、外部コンサルからの支援を受けて実現するのが有効です。プログラム開発のパワーが不足する部分は、外部プログラマを利用する形になります。
 既存のシステムの維持なども含めて、もちろん一気にこの形に変更するのは難しいと思います。しかしながら、一部からでもこちらの形に変えていかないと、これまでと状況が変わりません。
 まずは、現在依頼しているITベンダーに対して、このような形に変革していくこと、この外部パワー部分を担えるなら役割を変えていくことを検討してみましょう。現行のITベンダーでは、特に組織化の支援が担えないような場合は、その部分に別途専門のコンサルを導入することが必要となります。
 データの発生源となる部署、データを利用する部署、情報部門システムから人を出して検討を始めるグループを作るような形で始めても良いでしょう。最初は、情報システムが主導する形になることが多いでしょう。或いは利活用の要求が先行する場合なら、その対象の業務部門が中心となって進めた方が良いかも知れません。

 ともかく、実際に活動を始めるにはどうしたら良いのか、自社でできていることは何で、何が必要なのかわからないという方、DAMA日本支部に参加して、いろいろな分科会に参加してみてはいかがでしょうか?

情報通信白書2020年版の紹介

毎年刊行されている情報通信白書の令和2年版が8月から公開されています。

今回は、その概要について特にデータとの関連を中心に紹介します。

― 目次  ―

第1部  5Gが促すデジタル変革と新たな日常の構築

はじめに

第1章 令和時代における基盤としての5G

第1節    新たな価値を創出する移動通信システム

第2節    5Gの実現・普及に向けて

第3節    5Gをめぐる各国の動向

第4節    5Gが変えるICT産業の構造

第2章 5Gがもたらす社会全体のデジタル化

第1節    我が国が抱える課題と課題解決手段としてのICT

第2節    2020年に向けたデジタル化の動き

第3節    新型コロナウイルス感染症が社会にもたらす影響

第4節    5Gが促す産業のワイヤレス化

第3章 5G時代を支えるデータ流通とセキュリティ

第1節    5Gが加速させるデータ流通

第2節    デジタルデータ活用の現状と課題

第3節    パーソナルデータ活用の今後

第4節    5G時代のサイバーセキュリティ

第4章 5Gのその先へ

第1節    2030年代の我が国のデジタル経済・社会の将来像

第2節    Beyond 5G の実現に向けて

(第2部は、基本データと政策動向なので省きます。下記をご覧ください。)

https://www.soumu.go.jp/johotsusintokei/whitepaper/ja/r02/pdf/index.html)

昨年度は、「Society 5.0」がメインテーマでしたが、今年度版は、ご覧の通り5Gを中心にその浸透とデジタル化の進展が並行して説明されています。

はじめに」では、今年のCOVID19の感染拡大下でデジタル環境を利用せざるを得ない状況となり否応なくデジタルインフラに移行していく実態が描かれています。

デジタル化が進むのは一見良さそうに見えますが、システム化計画の無い中での局所的なデジタル化によってっ将来的な情報インフラに悪影響を及ぼしかねないことが無ければよいのですが。

第3章は、「5G時代を支えるデータ流通とセキュリティ」と題してデータとの関連で俯瞰しているので覗いてみました。

第2節 デジタルデータ活用の現状と課題」の「1 日本におけるデジタルデータ活用の現状」では、

ア 「データ活用の現状」で、『図表3-2-1-1分析に活用しているデータ』を参照し、『5年前に実施した調査と比較して、POS やeコマースによる販売記録、MtoM データを含む自動取得データの活用が大きく進展しており、各企業におけるIoTの導入が進んでいることがうかがえる』としています。

また、データ活用の割合はやはり中小企業と比べて大企業の方が大きく、データ活用は資本規模の小さい中小企業にとって有利という見方は、そうでもなかったということでしょうか?

イ 「デジタル・トランスフォーメーションの取組」では、『ICT化に関連する業務慣行の改善について尋ねたところ、「社内業務のペーパーレス化」が最も選択された。一方で直近3年以内に実施した取組を尋ねると「テレワーク、Web会議などを活用した柔軟な働き方の促進」が最も多かった。』と記されており、DXの本格的な取り組みはまだこれからというところのようです。

興味深いのは、「データに基づく経営」図でCDOを設置している企業が30%以上もあることです。また、『「データ分析人材の採用」、「データ活用戦略の策定」、「データ分析に基づいた経営判断の実施」を挙げた企業が4割程度あり』、総じて経営戦略・判断にデータを活かしていこうという意識は高まっているようです。

その一方、ウ 『今後のデータ活用の見通し』では、『今後もデータを活用していきたい』という領域が3割程度ある一方で、『今後もデータを活用していく予定はない』、という領域が35.7%~51.4%もある、という結果が出ています。この辺の意識についてはもう少し深く掘り下げてほしいところです。

データ活用という観点では、GAFAといわれるいわゆる情報プラットフォーム企業に大きく市場を奪われている現状で、今後日本企業がどう巻き返していくのか期待したいものです。

本情報通信白書は、日本の情報通信産業の現状を幅広く俯瞰的に捉えたものであり、ハード/通信よりの色合いが強いとも思えますが、日本の情報産業全般を鳥瞰するには良い資料と思えます。既にご覧の方もおられるでしょうが、大部ではありますがご興味があれば一読してみてください。

DXと用語の定義

DXについて多くが語られています。DXを進めて行くとはどういうことなんでしょう。いろいろなレポートを読んでも今まで今一つ腹落ちしませんでした。それが急にDXを推進することになった会社のガイドを見て、さらに先日のADMCの講演を聞いてストンと腹落ちしました。

DXの推進にはいくつかのステップがあるがDX1.0が大事である、すなわちそれは、顧客の価値を再定義し、デジタルソリューションの適用範囲を定め、全体を管理するKPIを設定する。データはこのデジタルソリューションとKPIに使われる。

デジタルソリューションとは何か?CJさんによればPython codeを書いて未来を予測できること(人達)。大量データを瞬時に読込み・組み換えとかもありますね。生産計画とかに使えそうです。

この次は何か。それは繋がること。今までの責任分界点を超えて繋がること。これにより今まで絵空事だった例えばグローバルSCMの最適化、なんてことがスコープに入ってくる。責任分界点を超えるとは、法人の中では機能組織の間でしょうし、製造・販売が分かれていればそれは法人間を超えて繋がることだと思います。

その時、何が起こるのか。今までは責任分界の中で自分最適で自分のシステムと仕事をしていれば良かったけど、今度は責任分界を超えてより大きな責任分界で最適化するために異なるシステムのデータを繋いでいく必要が生じる。今までは人間系で悠長に(月次?週次?日次?)翻訳しながら回していたけど、デジタルソリューションはリアルタイムにトランザクション毎に処理して行く?のでこのままだとデータが衝突してしまう。

残念ながら各所のシステムはこの意味で標準化されていないのです。世の中には標準化されている(いわゆるワンインスタンス)企業も数多あるとは思いますが、これが現実だ。データとデータをマッピングしながらデジタルソリューションを適用していかなければならない。CJさんとホバーマンさんの講演は一つ一つ私の胸に刺さりました。

デジタルソリューションから見て責任分界を再編することは、かつてBPRで多くの企業が討ち死にしたことを思い起こします。でもそれは例えばSCMの神の手を得るために必要なことだと思うけど、大丈夫かな?

DXと騒いでいるけど、多少未来が予測できるようになるかも知れないが、やるべきであったのに今までやれなかったことをやり通すことも、大きな割合を占めているように感じます。

やっぱり先ずは業務用語集とデータディクショナリーで今流に言えばデータカタログからかな。

デジタル・トランスフォーメーション(DX)とデータ・マネジメント(DM)②

11月10日に開かれたADMC(Asian Data Management Conference)2020は、成功裏に終了できました。ありがとうございました。お申し込みは300名を超え、瞬間視聴者は200名に迫り、大変なご好評を頂きました。

さて、このADMCカンファレンスのタイトルでもある「」世界各国におけるDXの取り組みとデータマネジメント」について、前回に続き、つらつらお話ししたいと思います。

ご存知のように、Digital Transformationとは、DigitalizationとTransformationの2つの変化が同時に起こることを意味します。ところが現在世の中に広まっているDXのイメージにはその2点が含まれているのでしょうか。いきなりDXに予算を付ける前に、少し立ち止まって考えて見ることも必要だと思います。

まず、Digitalizationとは、増大するデジタル情報を如何に効率的に処理して、ビジネス価値に結び付けることを意味します。ちなみに、https://en.wikipedia.org/wiki/Digital_transformation では、以下のように定義されています。

「Digitalization (of industries and organizations) 
Unlike digitization, digitalization is the ‘organizational process’ or ‘business process’ of the technologically-induced change within industries, organizations, markets and branches.

日本語訳:デジタル化とは異なり、デジタルライゼーションとは、業界、組織、市場、支店内で技術的に引き起こされた変化の「組織プロセス」または「ビジネスプロセス」」

これを見ると、Digitalizationには既に「Transformationを意味する変化」という言葉が含まれていることがわかります。実は以下が、https://www.etymonline.com/word/digitalizeに掲載されている語源です。

ではDigitalの語源は、https://www.etymonline.com/word/digital?ref=etymonline_crossreferenceに以下のように示されています。

元々「指先」という意味だったんですね。指で数える、10以下の整数にする、それが0と1に置き換える(デジタル情報化)ということになったということですね。当然ですが、この時点では「変化」という意味合いは全く含まれていません。最近になってITと絡めたマーケティング的な意味合いになってきたということでしょうか。

このブログでは、デジタル化に伴う変化については別途取り上げることとし、デジタル情報に話を絞ります。

デジタル情報とは、もちろんコンピュータが処理可能なデータのことを指します。画像や音声情報でも全てデジタル化され処理されます。ここでデータを処理することと、データを管理することは全く異なります。管理されていないデータを処理してしまうと、そこからどんな品質のアウトプットが出てくるのかわからない。

一方で、データはコンピュータで処理するためにディスクなどに保存されているのだから、管理されているではないか、という方もいます。つまりPDFやMS Officeファイルがフォルダーに保存されている、データがデータベースに保存されている。フォルダーは階層構造で名前が付けられて分類されているし、データベースでも個々のデータが入る場所が決まっているではないか。

本当にこの状態でデータが管理されていることになるでしょうか。何かを管理するということは、それらをビジネスに役立てることができるということです。いや、もちろん今でも業務に役立っていると言われるでしょう。ファイルをコピペして修正しあっという間に業務文書が作れるではないかと言われるでしょう。その通りです。紙がなくなっただけましだということです。

ただ、より大きなビジネス価値を生み出すためには、管理方法も進化しなければなりません。価値の増大にはレベルがあります。例えば、「社内日常業務の効率化」は属人的な作業からより共通化した業務プロセスに進化するするでしょう。今までのITはこのレベルの達成を狙っていたことは事実です。つまり業務効率化のコストセーブの分が、IT予算よりも大きいことが予算獲得のキーでした。

基本的に情報は基本的に階層構造では分類できません。情報と情報を関連付けることしかできません。一方で情報を構成する最小単位にまで分解(データ化)すれば、データモデルに落とし込むことができます。ただデータモデルは階層構造ではなく、ネットワーク構造です。

何を言いたいかと言うと、デジタル化された対象(ファイル、情報、データ)を処理したり分析するためには、前提として「関連付け」が行われなければならないということです。もちろんこの関連付け自体がデジタル処理でもあります。

ここで重要なのはデジタル化された情報や、分解されたデータの定義です。よくものの定義はその関連性においてのみ意味をもつということが言われます。逆に言えば、定義と関連性は一対ということになります。

次回はこのTransformationについてお話ししたいと思います。

データ品質管理の具体的な成果物(その2)

前回私が担当したブログでは、第8分科会で整理しているDQワークシートの概要をご紹介しました。今回は、その中でも「ビジネスニーズ整理ワークシート」にフォーカスしてご紹介したいと思います。
(※DQワークシートはこちらよりダウンロードいただけます)

実は、第8分科会でワークシートの議論を進める中で、最も時間がかかったのがこの「ビジネスニーズ整理ワークシート」です。

ビジネス要件を品質要件に落としていく部分は、DMBOK1の記述でも抽象度が高く、様々な議論がありましたが、何かしら軸になる整理の仕方が必要ということで、「5W1H」の観点をベースに据えて定義すべき項目を整理しています。

ビジネスニーズ整理ワークシート

このワークシートでは、下記の要素を整理していきます。

  1. ビジネスニーズ(Why/What)
  2. 業務プロセス(Where/When)
  3. 業務プロセス関連組織/担当者(Who)
  4. 情報要求(What)
  5. データ品質要件(How)

今回は、 1.ビジネスニーズ、4.情報要求、5.データ品質要件に触れて、メインの流れをご説明していきます。

ビジネスニーズ(Why/What)

まず、背景、目的とビジネス観点での要求事項を明らかにします。実現したいことを理解する上で、背景や目的が重要なのはもちろんですが、では、要求事項はどの程度まで明らかにすれば良いのでしょうか。

ワークシートのサンプルでは下記のように定義しています(一部抜粋)。

  • 背景:改正派遣法の遵守
  • 目的:客先に派遣する社員に対するキャリア形成制度を維持すること
  • 要求事項:新入社員は3年連続で技術系の研修(8h/年)を受講しなければならない
    →技術系の研修で8h/年を満たしていない該当年次者が居ないこと

要求事項をデータ品質要件につなげていくためには、ここで、必要な情報の「範囲」と「粒度」をある程度明らかにする必要があります。サンプルの要求事項からは下記が読み取れると思います。

  • 範囲:
    • 入社3年目までの社員
    • 年間の研修時間
  • 粒度:
    • 社員個人
    • 研修の分類(技術系など)×時間数(h)

このくらいまで定義できれば、求められる情報が具体的にイメージできるかと思います。

情報要求(What)

要求事項を満たすために必要な情報を整理します。最終的にはデータ品質管理はカラムをベースに実施していくことになるので、一つの要求事項を満たすために必要な情報について項目をイメージしながら分解し、定義していきます。上記のように情報の範囲と粒度を意識すると、定義しやすいと思います。サンプルでは下記のように定義しています(一部抜粋)。

  • 受講者個人を特定できること
    • 社員の年次が正しいこと
    • 研修が技術系/ヒューマン系のいずれかがわかること
    • 受講年度単位の研修時間がわかること

この段階では、特定のデータセットに引きずられないように、業務的に必要な情報の定義にとどめます。要求に適したデータセットを探すのは後続のワークシートで実施します。

データ品質要件(How)

1つの情報要求に対して、データ品質評価軸(正確性、完全性、・・など)を当てて、データ品質の観点から求められることを洗い出します。後で実データを見てから追加することもできるので、まずは、机上で重要なポイントを定義します。

例)情報要求:受講者個人を特定できること
    →【完全性】 社員を識別する項目に抜け、モレがないこと

この他にもこのワークシートで定義すべき項目はありますが、大きくは上記のような流れで進めます。

終わりに

先日の第8分科会では、この「ビジネスニーズ整理ワークシート」を利用して、少し別の角度から、データ整備の進め方について検討されている方々とお話しすることができました。 実プロジェクトで活用されている事例も出てきており、 私達のアウトプットがデータマネジメントに取り組まれる方々の活動に、具体的に寄与できるのは非常に喜ばしいことだと改めて感じています。

半径2メートル雑感2題

ここ最近の出来事で感じた半径2メートルでの出来事の雑感を書いてみようと思います。

ADMCの字幕付け
今回のADMC2020は、初めてのZoomウェビナーでの開催です。
現在、企画担当理事を中心に鋭意準備をしています。
今回は外国人スピーカーは招聘せず、スピーカーからビデオを事前にいただき。理事で分担して日本語字幕を付けて流す形にしましたので、英語の苦手な方も視聴しやすい形になっていると思います。
とは言え、私は英語がサッパリなので英語堪能な林会長の補助として、会長が翻訳した内容の校正のお手伝いを行いました。担当は欧州・イタリア代表のNinoさんの分担でした。
内容は是非ご参加いただいて視聴いただきたいのですが、欧州では国を超えての活動や交流、研究成果の共有などが活発なようで、アジアとは随分様相が違うなぁと感じた次第。
言語の壁はありますが、今後はAsian Data Management Conference の名に恥じないカンファレンスにしていきたいものです。
近隣の中国、韓国をはじめとして、東南アジアの各国とも連携強化していきたいですね。(その前に英語をなんとかしないとですが…)

ITモダナイゼーションとデータ
縁があって、最近ITモダナイゼーションの仕事をしています。
メインフレームからのOPEN化が主な業務ですが、なかなかに難しく、過去に作りこまれた謎解きに追われています。
そういった中、データの移行や更改などは二の次になっていて、プログラム資産の移行が主題になることが多いなと改めて感じています。
もちろん、言語変換やリビルドはテストも含めて工数もかかりますので、どうしてもそちらがメインテーマになってしまい、データ整備が劣後してしまうのは致し方ないのかもしれません。
しかし、データを見ると様々な過去の残滓が残っていて非効率なことも多々あるので、この際一気にきれいにしてしまおう!とすると追加の費用がかかり、かつプログラムへのインパクトが少なくないということで、データは現在のまま、そーっと新環境にもっていこう、という結論になってしまい勝ちなようです。
システム更改の時期になってしまってから何とかしようとしても、現状ではそれをなんとかするソリューションは無いように思います。
なので、いざシステム更改の時に一番大事な資産であるデータが置いてきぼりにならないように、日頃から少しずつデータマネジメントを進めておく必要があるなぁと今更ながらに感じています。