10月 2020 - DAMA日本支部公式ブログ

データがつながれば社会が変わる

　近年、データのつながりの拡大を肌身で感じることが多い。例えば、自宅PCによく検索した商品や類似の商品が、突如ポップアップされる。これは、自宅PCと商品サイトが検索履歴のデータでつながっているためである。また、スマフォを持って外出して地図情報から目的地の検索をかけると、近くのレストランやドラッグストアなどの広告が入り、ドラッグストアなどは検索すると割引チケットも入手できる。これは、自分のスマフォの位置情報とレストランやドラッグストアの地図情報を含むサイトがつながっているからである。
　このように、販促を目的とした情報のつながりは急速に拡大している。

マイナンバーは与えられたけれど

　マイナンバーは、2015年10月5日から、個人番号の指定が始まり、2016年1月からは、行政手続における個人番号の利用が開始された。https://ja.wikipedia.org/wiki/%E5%80%8B%E4%BA%BA%E7%95%AA%E5%8F%B7

　すでに5年近く経過しているが、このマイナンバーが、どれほどつながりをもっているだろうか？
市区町村の手続きにマイナンバーを使うことで、一部の書類提出は不要な経験はあったが、身近で便利になった、よりよいサービスを受けた実感は全くない。どちらかというと、マイナンバーを人に知られないため極力提示しない、マイナンバーカードは持ち歩かず自宅に保管など、秘守の扱いに注力している。

　個人を特定するIDがなければ、データのつながりは初められない。個人のデータのつながりの出発点として、マイナンバーはなくてはならないものである。
　個人情報保護の観点があまりにも強いため、マイナンバーの利用拡大はなかなか進んでいないと感じる。マイナンバーがしっかり管理され、漏洩や悪用ができない環境であれば、生まれた赤ちゃんにマイナンバーを付与する手続きだけで出生届は不要となり、年齢も把握できる。また、親のマイナンバーとつなげれば戸籍や住民情報に自動で登録ができる。年齢も把握できるので、小学校入学時に自動的に案内を出すことも可能となる(すでにこのようになっている国もあると聞いている)。このように、マイナンバーを管理し、マイナンバーをつなげることで、役所の管理作業の大幅な軽減の他に個人へのサービスが拡がる期待が膨らむ。

製品に不具合が起きた。この製品を作った工場のラインはどこ？

　これがすぐに把握できる会社は、少ないだろう。工場で作られた製品は、多くは工場⇒倉庫⇒販売店舗⇒客　のような流れで客にわたる。個々の製品にマイナンバーのような製品を特定するIDが付与されていないため、工場での製品番号、倉庫で管理する番号、販売店舗の商品番号がその場所の特有な番号で管理されている。このため、逆に客に渡った製品が客⇒販売店舗⇒倉庫⇒工場を特定するのに、個々の番号の対照表から辿らなければならず、時間がかかる。一気通貫のシステムになっていないためである。

　工場でラインを特定するには、その製品がいつ、どのラインで、どの部品を使って組み立てられたかの情報も必要となる。本来、やりたいことは、同一な不具合が起きることが想定されるため、その工場ラインが特定できたら、そこで同時期に作った他の製品がどの客に渡っているかを知り、その購入客に不具合を知らせ、重大な不良であれば使用をやめるように一刻も早く伝えることである。

　このように製品が特定できるIDを付与し、つなげていかないと十分なサービスを客に提供できない。

個人やモノの特定ができれば、サービスが膨らむ

　個人やモノを特定するIDの必要性は、認識できた。このIDにより、データが迅速につながっていけるからである。現在、個人のPCやスマフォが個人を特定するものとして使われている。しかし、個人のPCやスマフォを換えてしまえば、そこで個人の特定は途絶えてしまう。
　マイナンバーが個人を特定できるIDとして付与されたことは、意義深い。データをつなげる準備はできたのだ。

　マイナンバーのセキュリティが守られる環境となれば、データがつながることでサービスの観点から夢は膨らむ。マイナンバーカード一つあれば、買い物、ホテルのチックイン、交通機関への乗車などは、このカードをタッチするだけでできる。また、急病で病院に運ばれた際に病歴や毎日飲んでいる薬などを瞬時で把握でき、適格な治療が受けられる等々。

　このような社会を早く実現するためにも、データをつなげていく活動にさらに
関心をもっていただき、そのような機会があれば実活動に注力していただきたいと思います。データをつなげる意識の醸成が加速すれば、未来は急速に変わっていくと信じます。

以上

データマネジメントなき「デジタル庁」は”いつか来た道”

「デジタル庁」は救世主になるか？

長期に渡った安倍政権から菅首相にバトンが渡され、その政権の目玉政策として「デジタル庁」が注目を集めています。
デジタル、つまりはデータの存在が日本のビジネスパーソンだけでなく、一般の生活者や子どもたちにも広く耳目に触れるようになること自体は非常に良い傾向ではないかと感じますが、本当にお題目として謳われている行政サービスや国民の利便性の向上、既存規制の改革などに効果を発揮することができるのか？
その際に注意しなければならない点があることを私は指摘しておきたいと思います。

かつても「e-Japan構想」などのITによる行政改革の試みは多額の予算が投じられ、「政府エンタープライズ・アーキテクチャー（EA）」といった取り組みが何度も行われてきました。
ただ、それらがどのようなメリットをもたらしたというのか。
国民や民間事業者、行政職員の皆さんですら、そのメリットを実感できていないのではないでしょうか。

それはなぜかというと答えは簡単で、「電子化することが目的化した」という一点に尽きます。
既存の法令、制度、ルール、組織などを是として、そのままプロセスを電子化するだけでは帳票単位にシステムが濫立するだけです。
その帳票ごとにバラバラなデータが生み出され、活用できないばかりか、たとえば、住所変更の手続きを役所ごとに利用者に強いることになります。

デジタル庁においても「デジタル化すること」が目的になってしまえば、これまで何度も踏んでいた轍を踏み、無駄なプロセスを温存してデジタル化、要は電子化することに再度血道を上げることになるでしょう。
一時期ブームになった”オープンデータ”の政府の動きも「オープンデータ化すること」が目的化し、誰からも使われないオープンデータの数だけが競われ、価値あるデータの提供につながらない残念な結果に終わるでしょう。

データマネジメントを大前提とした「デジタル庁」に

では、真に行政サービスの向上や規制の改革などに資する「デジタル庁」にするためにはどうするか？
今度こそ、「データを中核に捉え、行政サービスのお客様である国民や民間事業者を主役としたデータマネジメントを、府省横断的に徹底すること」ではないかと思います。

これまで複雑に築き上げてしまった既存の巨大システムに存在するデータと向き合うには相当の困難を伴うことは間違いありませんが、ここにメスを入れない限り”いつか来た道”を通ることになることは必定です。
「デジタル庁の役割は行政データマネジメント」といった覚悟で取り組んでほしいと願います。

DAMA日本支部　企画担当理事
JDMC事務局長兼理事
株式会社リアライズ　代表取締役社長
大西　浩史

データ活用の成功を導く「データリーダーシップ」

今年の3月に、データマネジメントの国際カンファレンスEnterprise Data World（EDW）が実施された（https://edw2020.dataversity.net/）。今年のセッション毎のテーマを眺めてみると、「データリーダーシップ」をテーマとするセッションが多い。海外でもDXはキーワードとなっているが、それよりも上位である（下表、「EDWセッションの分類」を参照）。

データリーダーシップは組織の機能

そもそもデータリーダーシップとはなにか。
CDO（Chief Data Officer）のような社内のデータ責任者を思い浮かべる方もいるだろうが、そうした特定の人物は指していない。
データマネジメントとデータガバナンスのあるべき姿（ビジョン）や目的を明確にし、そこに至るステップを戦略として策定すること。
または、そうして策定されたビジョン・目的と戦略を見直すことが、データリーダーシップである。

DMBOK第2版でも、データマネジメントのリーダーシップについて述べている箇所がいくつかある。
第１章「データマネジメント」では、データマネジメントの原則として
「効果的なデータマネジメントにはリーダー（※原文では”leadership”）のコミットが必要（Effective data management requires leadership commitment）」
「管理スキルだけでなく、ビジョンや目的が必要」
と述べている（DMBOK 第2版日本語版 P46）。
また、第17章「データマネジメントと組織の変革」では、米国の専門家ジョン・コッターのリーダーシップ論を紹介しながら、リーダーシップとは変革を実現するための能力で、合理的で魅力的な将来像であるビジョンを描き、どうしたらビジョンを達成できるかという筋道である戦略を作成することだと紹介している（DMBOK 第2版日本語版 P636 図117）。

データの価値を収益・コスト・リスクで評価する

ビジョンと戦略を作成するだけなら既存の「データ戦略」（またはデータマネジメント戦略/データガバナンス戦略）となにが違うのか。

データリーダーシップの提唱者の一人、Anthony J. Algmin氏によれば、データの価値とはつまるところ収益の増加・コストの減少・リスクの管理の３つのどれかだと言う。

データの価値とは、「データを使い何をするのか」と「そのデータ無しで何ができるか」の差分によって具体化される。
収益の増加、コストの減少、リスクの管理によって価値は測定される
これら３つは、実際にデータの価値を生む「唯一の」方法である。
“Data Leadership: Stop Talking About Data and Start Making an Impact!” https://algmin.com/book/

データ戦略の目的は企業によって様々だが、究極的にはデータの価値によってビジネスに貢献することを目指す。
つまりAlgmin氏の上記意見に拠れば、データ戦略の目的とは収益の増加・コストの減少・リスク管理というビジネス視点で具体化・定量化されたものになる。
また彼は、こうして目的が定量化・具体化されれば、目的に対して現在どこまで達成できたのか測定し、問題点があれば特定して改善し続けることができるとも言っている。

すなわち「データリーダーシップ」とは、
・データ戦略の目的を、ビジネス視点で具体化・定量化する
・定量化された指標に基づき、戦略自体が定期的に評価され、見直される
のふたつを前提条件としている点が、通常の「データ戦略」との違いとして位置づけられる。

データリーダーシップで変化に対応し、無駄を省く

ではEDWに参加しているような海外の企業や組織は、目的の具体化・定量化とそれに基づく改善活動をどれだけ実施できているのか。
あまりできなくて悩んでいるからこそ、「データリーダーシップ」をテーマにしたセッションが増えているのではないだろうか。

たとえば、ビジネス環境が急速に変化して戦略自体を見直すべき状況になっていても、目的を定量化できていないので測定できず、変化に気づかないまま、もはや無駄かもしれない施策を継続する。また、施策実行の結果得られる収益を、そのために費やしたコストが上回っていても気づけない。そんな企業が多いのではないだろうか。

海外では、2010年代前半からデータ戦略の策定に取り組む企業が増えた。それから10年近く経つが、戦略立案と推進で成功したという事例は、それほど多くはない。
一方、日本は最近になってデータ戦略策定に取り組む企業が増えてきたところだ。
もし貴社もそうした企業なら、今からできるだけ目的の具体化・定量化に取り組んでみてはどうだろう。
目的の定義に時間がかかるかもしれないが、変化に対応し、無駄な作業を省くことで、最終的にはデータ活用成功の近道になるかもしれない。

ワインのデータモデル

DAMA日本支部データモデル分科会では、データモデルについてであれば、DMBOKの枠にとらわれずに様々な話題を取り上げて議論・情報共有をしています。今年度は具体的なモデルについて、それぞれの考え方を議論・共有するという取り組みもしています。

さて、このblogではお題をワインとデータモデルとしてみました。ワインは歴史が長いだけあって、バリエーションが非常に多いです。データモデルのちょっとした題材に使えそうです。このモデルの拡張といったお題も、そのうち分科会で取り上げてみるかもしれません。興味を持たれた方はぜひ分科会への参加をご検討ください。DAMA会員であれば、どなたも参加できます。

ワインの基本要素としては、ブドウの種類、色（赤、白、ロゼ）、発泡性かどうか、場所といったことになるかと思います。

オールドワールド（フランス、イタリア、スペイン等）は地名（地方、村、畑など）がまず書かれて、ブドウの品種は書かれていなかったりしますが、ニューワールド（カルフォルニア、オーストラリア、チリ等）は、ブドウの品種がまず書かれるパターンがかつては主流でした。

また、オールドワールドでは、複数のぶどう品種を組み合わせることも多いのですが、ニューワールドでは単一品種で勝負したワインが主流です。カルフォルニアワインが有名になったきっかけはカベルネ・ソーヴィニヨンですし、今、コスパの良さで人気のチリカベはチリのカベルネ・ソーヴィニヨンの略語です。

こちらはイタリアのワイン一族（サッシカイア）がチリで作っているワイン
ピノ・ノワールというブドウ品種名が記載されています。これはフランス、ブルゴーニュ原産です。

カベルネ・ソーヴィニヨンはフランスのボルドーが原産ですが、ボルドーではカベルネ・ソーヴィニヨンは単独でワインを作るのではなく、メルローという品種と組み合わせることが圧倒的に多いです。

さて、これらを念頭においてデータモデルにしてみます。

中心となるデータはワインですので、まず、これをエンティティとします。「ワイン」エンティティのインスタンスですが、同じ名前のワインでも作り手、ヴィンテージが違うとものすごく値段が違うので、それごとにインスタンスを作成することにします。主キーは「ワインコード」としてみましたが、これだと粒度がわからないので、「ワイン名」＋「ヴィンテージ（ブドウを収穫した年）」＊「作り手コード」を代替キーとします。シャンパーニュは原則としてヴィンテージは入らないので、その場合はNV（ノン・ヴィンテージ）と設定することにします。

「ブドウ品種」エンティティの主キーは「ブドウ品種名」とします。インスタンスはカベルネ・ソービニヨン、メルロー、シャルドネ、ソービニヨン・ブランなど。いま、日本で売っているワインの大部分はここであげた４品種から作られたものですね。

ワインによっては複数のワイン品種から作られますので、データモデルでは、「ワイン」エンティティと「ブドウ品種」エンティティはn:nの関連があることになります。n:nを1:nにするために交差エンティティ（関連エンティティという呼び方もあります）をモデルに追加しましょう。ここでは「ワインブドウ品種」というエンティティ名とします。「ワインブドウ品種」エンティティの主キーは、「ワインコード」＋「ブドウ品種コード」の複合キーとするのが普通かと思います。

交差エンティティによってn:nを２つの1:nに変換しましたが、この２つにはどのような違いがあるでしょう？

「ワイン」のインスタンスなしで、「ワインブドウ品種」のインスタンスはありえません。

一方、ブドウ品種はワインに向くものと生食に向くものがありますので、「ブドウ品種」のインスタンスをワインに使われるものに限定しない限り。「ワインブドウ品種」に対応しない「ブドウ品種」のインスタンスがあり得ます。こういったことは「ブドウ品種」エンティティに、その定義を書いておくことで明確になります。

そう考えると、２つの1:nの関連には違いが出てきます。

カーディナリティを厳密に書くと、１：1..nと１：0..nとなります。

サンプルに掲げたER図にはそれ以外の要素もあります。「地方」エンティティに再帰リレーションシップがあることや、格付が「地方」と「ワイン」の両方にあるところ、「ワイン分類」の「バランス分類コード」とは何を意味しているのかなど。これを発展させてワインの販売管理のモデルを考えてみるなどは次回のお楽しみにとっておきます。