Practice

Practice04-2.データレバレッジを増幅させるために

PracticeDX推進の実用書

SHARE

支点・力点・作用点を効果的に機能させるためにはどうすればよいだろうか。

データレバレッジの構成要素となるそれぞれのレバレッジ指標を読み解きながら、

それらの関係性を強めるアクションについて考えたい。

打ち手のインパクトを左右するレバレッジ指標

 DXを前に進めるデータ活用を実現するために、突き抜けた目的と、それに向かう打ち手を設定できたとする。しかし、その打ち手が小さなインパクトで終わるケースが散見される。たとえ、打ち手のスジが良かったとしてもである。データ活用の打ち手のポテンシャルは、データレバレッジの要点を押さえていないと引き出すことができない。

 では、データにレバレッジを利かせるうえでの要点とはいかなるものだろうか。

 それを探るために、データレバレッジを構成する力点(データ)・支点(データ分析)・作用点(打ち手)を因数分解してみたい。因数に分解することで、漏れなく工夫が凝らされているかをチェックし、対策できる粒度になる。すなわち、どこに手を入れれば、よりテコを利かせられるかがわかるようになるのだ。

 ベイカレントでは、そのような因数を「レバレッジ指標」と呼んでいる。

 テコをより利かせるべくレバレッジ指標を高めたければ、各指標が何を指すのか、そしてそれぞれの指標がどのような関係性にあるのかを深く理解しなければならない。各指標と関係性の理解が不十分では、モグラ叩きのように目の前の事象の解決に没頭してしまうことになる。

 レバレッジを増幅させるために、まずは、各指標が何を指すのか、具体例を交えながら見ていこう。

力点(データ):勘と経験を生かし、重要度が高いデータを見出す

 力点(データ)における要点は、「重要度」×「データ量」×「データ品質」の3つに因数分解できる。蓄積しているデータについて語る際、データ量とデータ品質の視点はよく目にするが、データを表現するうえでは、データの「重要度」の視点が特に大切だ。

 重要度とは、「予測モデルの学習におけるある特徴量の重要性」を意味している。特徴量とは、求めたい分析結果を特徴づけるデータ項目を表しており、重要度はそれぞれの特徴量を相対的に評価したものと言える。

 例えば、3年以内に糖尿病になるリスクを予測するとしよう。特徴量として身長と運動状況を選定したとする。相対的に比較してみると運動状況のほうが、重要度が高いと言える。

 重要度の高いデータを集めなければならない。だが、重要度が高いデータを見極めるのはなかなか難しい。見極めのコツとしては、ビジネスについての理解が深い現場担当者へ質問を投げかけることである。勘と経験をデータに翻訳すると、重要度の高いデータを発見できることが多い。例えば、医療ビジネスを手掛けている担当者に糖尿病の原因をヒアリングすると、糖尿病と運動不足が密接に関係している、などと教えてくれる。これをデータに翻訳すると、消費カロリーや歩数が重要度の高いデータだとわかるのである。

 力点(データ)を工夫するには、重要度、データ量、データ品質の3つの視点を持つこと。特に、データの重要度に目を向けることである。既に持っているデータだけを見ていると、重要度の視点が欠けてしまいがちである。より重要度の高い新たなデータを、現場担当者の勘と経験から引き出して生成する選択肢を忘れてはいけない。

支点(データ分析):ビジネスで結果を出してこそのデータ分析

 「精度を上げるにはどうするか」を数か月かけて議論している現場を目の当たりにすることがある。目指す先が精度向上になっているケースだ。このような議論の大方が、データ活用を推し進めるうえで的外れなものだ。

 分析はビジネスで結果を出すための手段に過ぎない。ビジネスの視点を忘れてはならないのである。

 支点(データ分析)における要点は、「ビジネス貢献度」×「汎化性能」×「性能分岐点」の3つに因数分解できる。では、この3つのレバレッジ指標は、ビジネスで結果を出すことにどのようにつながっているのだろうか。

 まず、ビジネス貢献度とは「分析結果が目的実現に貢献する度合い」を指す。例えば、向こう一週間の商品売上を予測できたとしよう。予測できたのが、売れ方が不規則な商品ならば、ビジネスへ与える影響は大きい。向こう一週間の売上を予測できれば、不要な在庫を抑えることができるからだ。一方で、経験則である程度売上を予測できる商品であればビジネスへの影響は小さく、いくら正確に予測できたとしても「だから何?」と言われる結果に終わるだろう。

 次に、汎化性能とは「予測モデルが未知のデータにも対応できる度合い」を指す。機械学習の分野では、学習データに対する予測精度と、未知のデータに対する予測精度(汎化性能)は分けて考えるものだ。PoC段階では学習データに対する予測精度によってモデルを評価することが多いだろう。しかしビジネスにおいては、日々生まれる新たなデータをインプットに結果を予測していく。現実に予測モデルが役目を果たしているか否か継続的に観察することが必要になる。すなわち、汎化性能こそがビジネスにとって意味ある予測精度と言えるのだ。

 最後に、性能分岐点であるが、これは「ビジネスとして許容できる汎化性能の閾値」を指す。汎化性能が性能分岐点の条件を満たせば、打ち手を実行する。条件を満たさなければ、ビジネス貢献度との兼ね合いで条件を再設定する、または汎化性能を高めるといった対応をとることになる。

 売上向上をいくら見込めれば打ち手を実行するのか、あるいは、どの程度なら予測が間違ってもよいと判断するのか、打ち手によってその基準は異なる。したがって、性能分岐点は注意深く設定しなければならない。

 あえて繰り返すが、分析はあくまで手段である。技術力に長けている者が陥りやすい罠として、もう一度ここで問いかけておきたい。

作用点(打ち手):組織全体でデータに従う

 作用点(打ち手)における要点は、「IT化率」×「データに従う勇気」の2つに因数分解できる。IT化率が作用点の力の大きさを、データに従う勇気が作用点にかかる力の向きを決める。

 IT化率とは、人手を介さず、「打ち手がIT化されている度合い」を指す。打ち手のIT化率が低ければ、データと分析に工夫を凝らしても増幅させた力は弱まってしまう。

 One to Oneマーケティングを例に説明しよう。顧客体験を改善する打ち手として、MA(マーケティングオートメーション)が整備されていれば、顧客一人ひとりのニーズに合わせて、すべての顧客接点でデータに基づいた打ち手を自動的に講じることができる。

 一方、IT化率が低ければ、人手を介すことでリアルタイム性と正確性が損なわれる。つまり、作用点の力が弱まってしまうのだ。どれくらい打ち手をIT化できているかが、作用点の力の大きさを増減させるのである。

人間が組織で動く場合、データ(分析結果)に従って打ち手を講じることが、実は案外難しい。分析結果を信用できない、人が判断した結果の方が優れている、という考えを変えられない人間が組織には少なからず存在するからだ。

こういった抵抗勢力を抑え、組織的に分析結果を信用することを、「データに従う勇気」と呼んでいる。

この因数は、半数が従っていれば50%、全員が従っていれば100%の力を発揮する。目的への向きを変えないためには、組織的にデータに従うべきである。

レバレッジ指標の関係性にも目を向ける

 各レバレッジ指標について、その意味するところをつかんでもらえたことと思う。

 ここではもう一段踏み込んで、以下の3つの視点からレバレッジ指標間の関係性の理解を深めたい。

 ビジネスで結果を出すデータサイエンティストは、レバレッジ指標の関係性を理解し、関係性を強めることを考えているのである。

  • 目的実現に直結する指標の整合をとる

 まず、打ち手を設定できたとして、その打ち手は全自動化するのか、人が分析結果を見て判断するのか、IT化率を設定する。

 次に、何を予測することができれば打ち手を実行できるのか、予測する対象を定める。機械学習の分野では、これを目的変数の設定と呼んでいる。

 そして、目的変数を予測するために必要な重要度の高いデータにあたりを付けていく。

 データにレバレッジを利かせるうえで、目的実現に直結する指標の整合をとることが求められる。

  • 組織の壁を越えてデータを調達し、汎化性能を高める

 重要度、データ量、データ品質が汎化性能を左右する。データを工夫すればするほど、汎化性能が向上するのだ。

 しかし、頭ではわかっていても、この関係性が損なわれている組織が多い。例えば、データサイエンティストが新たに必要となるデータを閃いても、データ生成や、データの加工・蓄積は、IT部門が担当することが多い。このようなケースでは、新しいデータの重要性が理解されず、データの工夫が後回しになることが少なくない。これではさすがのデータサイエンティストも汎化性能を高めることはできない。

  組織間の連携を強め、手を携えて汎化性能を高めていくべきである。

  • 予測が外れることも想定してシナリオを描く

 過去のデータを使って学習し、確率的なモデルを使っている以上、予測は外れる場合もあり得る。

 そこで求められるのは、予測が外れることも想定し、それを許容するシナリオを描くことである。許容の仕方には二通りある。

 1つ目は、外れても構わないケースだ。例えば、ECサイトで商品レコメンドを行う。外れても直接的な損害を被ることはない。

 2つ目は、外れたら人が対処することで許容するケースである。

 例えば、書類チェックの正解率が80%であれば、残りの20%は人が目視で対応する。

 データに従う勇気とは、予測が外れた場合のシナリオを描き、ビジネスとして許容できる性能分岐点に落とし込み、それに従うことなのである。

  

 スジの良い打ち手を考えたにもかかわらず、データにレバレッジを利かせることができない。そのようなときは、レバレッジ指標のいずれかに問題があり、指標間の関係が弱まっている証拠である。

 データにレバレッジが利いていないことに気付いた人は、部門の垣根を越えて、レバレッジ指標の改善をリードしてほしい。

 レバレッジの増幅が最高潮に達したとき、それがデータ活用の打ち手のポテンシャルが完全に解放されるときである。

Baycurrent-Digital_Practice04-2

ダウンロードをするにはニュースレターへの登録が必要となります。
お手数ですが下記よりご入力をお願いいたします。
ご登録完了後、ダウンロードが可能になります。

    貴社名必須
    部署名必須
    役職
    お名前必須
    メールアドレス必須
    メールアドレス(確認用)必須
    電話番号

    個人情報の利用目的と取扱いについては
    こちらからご確認下さい。
    プライバシーポリシー

    個人情報の利用目的と取扱いについて

    SHARE