デジタルトーク

この記事をシェア
2019.06.28

ハイテク そのデータから何が見えますか?

データの活用方法が変わってきている

スマート家電や工場の自動運転などで進むIoT(Internet of things)の普及や、官公庁の統計情報に代表されるオープンデータの整備が進展していることによって、我々が扱えるデータは年々増大している。それに伴い「データをいかに活用するか」というテーマが、社会的に重要な論点となっている。

データを活用すること自体は、論理的に意思決定をする上で昔から行われてきたことであり、決して新しい流れではない。しかし、現在では多様なデータを取得することが容易になったこともあり、データ活用の方法が変化していることをコンサルティングの現場で感じる局面も増えている。

この「変化」を具体的に言うとするならば、「物事の事象を把握するために直接的にデータを用いる」ことから、「データの背景にある事象を捉えるために間接的にデータを用いる」ということへの変化である。

直接的なデータ活用と間接的なデータ活用

たとえば、電気の使用量というデータを用いて見てみると、従来の直接的なデータ活用では

「今月の電気代が高いな、どの時間帯に電気を使っているのだろう」

「電気の使用状況を見ると夜の時間帯がたくさん使用している、何に電気を使っているのだろう」

「そういえば、先月から寒いので、寝る前にオイルヒーターを使っていた」

「オイルヒーターってどれくらいの電気代だろう」

「え!こんなに高いの?」

「使い方を調整しよう」

といった流れで、物事の事象(電気の使用量が多くなっている状況)に対し、順を追って把握していた。

一方、間接的なデータ活用では

「子供がいつも夜更かしして親より遅く寝ている」

「子供部屋に戻ってもまだ起きているみたいだ」

「いつも一体何時まで起きているのだろう」

「子供部屋は何時まで電気が点いているのだろう」

「電気の使用状況を見ると夜2時まで電気を使っているようだ」

「子供に対して早く寝るように注意しよう」

といった、データの背景にある事象(=子供が夜更かししている状況)を捉えるためにデータを用いることになる。

後者の場合、データの内容を理解するだけでなく、データからどこまで事象を説明できるのかを考慮する必要がある。これを見誤ると、データを用いて行いたい主張を適切に行うことが難しくなる。

データ活用を誤ることで生じる弊害

今回のケースにおいては、子供部屋の電気が深夜2時まで使われていたということはデータから直接的に把握可能な事実である。ただ、用途まではわからず、遅くまで子供が起きているようだから、電気を点けていたと推測している。

電気が遅くまで使われていた実際の理由は、エアコンのタイマー設定(夜2時まで)により電気が使われていたことだったとしよう。更に、子供は電気を消していたものの、スマートフォンを使用していたため、夜2時まで起きていたという事実もあったとしよう。

その場合、夜2時までに起きていたという事実はあったとしても、「起きている=電気を点けている」という仮定や「電気を使用している=部屋の電気を点けている」という仮定は、誤っていたことになる。

夜2時まで起きていた理由を明確にせず、仮定をもとに子供に接すると、

「深夜2時まで部屋の電気を点けていたでしょう、早く寝なさい」

と指摘しても、

「部屋の電気は消しているよ」

「エアコンだったら、タイマー設定で2時に切れるようにしているよ」

といった切り返しをされて、終わってしまうことになるだろう。

これでは、データの背景の検証が十分でない(=夜更かしの根拠付けを誤って推測してしまった)ために、遅くまで起きていたという事実があったにもかかわらず、適切な指摘ができないことになる。

データ活用の誤りを防ぐために必要なこと

そうした誤った指摘を避けるために、データがどこまで事実を言い表しているのかを明確にすることが重要になってくる。また、保持しているデータだけでは根拠として乏しいと考えられる場合、更に別のデータを取得することも必要だ。

今回においては、電気を何に使っているかを把握するためには、子供部屋の設備の電気の使用状況を個別にセンサ等を用いて把握するか、使用者(今回は子供)にヒアリングする等して追加検証により状況を特定する必要がある。そして仮定が外れていた場合、他の可能性を検証し、適切な打ち手を講じる必要がある。

追加検証を行い、12時に電気を消していたということがわかった場合、電気は消していたものの起きている可能性はないか、それはどのようにしたら検証可能かということを更に検討する必要がある。

データを適切に捉え、正しい判断や主張を実施していく

以上のように、誰もが容易に大容量のデータを扱えるようになったことにより、膨大なデータが、現状見えていない事実を教えてくれるかのように思えることもある。

しかしながら、今回の例に限らず、そもそもそのデータがどのような精度で、どのように補正されているか、更には、そのデータと事象の関連性を論理的に説明できることが可能かを把握しておかないと、事象を捉えることが難しくなることが多々ある。誤った仮説を立ててしまい、それを検証せずにデータを根拠として用いてしまうと、本来の目的を果たせないばかりか、そのデータを逆手に取られて予期せぬ方向に結論づけられてしまうこともあり得る。本当にデータから目的の事象を説明できるのか、実は他の可能性がないのか、自分が説明するときはもちろん、他者の説明を受けるときも、その観点で分析結果を見返してみることが重要である。

ビジネスの現場に限らず、日常においてもインターネットのサイトやテレビ番組、新聞等で、データを用いた根拠付けが多く見られる。そこでの主張は、発信者の立場や思い込みによっては、一見正しそうに見えるが本来読み取れることとは別の結論が導かれ、その方向に誘導していることもある。自身が発信者のときは、偏った主張になっていないかを、自身が受け手のときは、発信者の主張を鵜呑みにせず、データの背景や内容を適切に把握し、正しい判断や主張ができているかを、意識していきたい。

パートナー 竹平 勝博

外資系コンサルティングファームを経て現職。
製造、エネルギー、メディア、金融を中心に、新規事業の立ち上げ、組織改革、IoTデータ活用等のプロジェクトに従事。
直近では、IoTデータを活用した新サービスの開発やそれに伴う組織編成、システムの構想策定等に携わる。