統計学が最強の学問である

ビジネス

『統計学が最強の学問である』西内 啓

更新日:

内容

ムダなリスクやコストを避けることはもちろん重要だが、統計学的な裏付けもないのにそれが絶対正しいと決めつけることと同じくらい、統計学的な裏付けもないのにそれが絶対誤りだと決めつけることも愚か

正解がないのであればとりあえずランダムに決めてしまう、という選択肢の価値はもっと認められるべき

 

標準偏差

標準誤差というのがどういったものかというと、サンプルから得られた割合(たとえば失業率)に対して標準誤差の2倍を引いた値から標準誤差の2倍を足した値までの範囲に真の値が含まれている信頼性が約95%、という値

 

ビジネスに使う

【問1】何かの要因が変化すれば利益は向上するのか?

【問2】そうした変化を起こすような行動は実際に可能なのか?

【問3】変化を起こす行動が可能だとしてそのコストは利益を上回るのか?

 

利益というゴールまでの道筋をもう少し細かく考えれば、顧客の需要が伸びるか、社内の生産性が上がるか(ムダなコストをかけずに商品が産出できるか)、といった当たり前の要素に還元できる。

ビジネスにおいて解析すべき指標は、直接的な利益か、あるいはそこに至る因果関係の道筋が明らかな何か

 

現代においては多くの企業のさまざまな部署において、大量のデータが存在している。

また何らかの新しい調査を行なうことも、今では大したコストがかかることではない。

ここで重要になるのは「ここから何かわからないか」という漠然とした問いではなく、そのようなデータのうち何が、どのような関係で利益と繋がっているのかなのだ。

もしみなさんがこれから社内のデータを解析して経営に活かそうとするのであれば、まず部署の垣根を超えて一元的に「どのようなデータを持っているか」という情報を共有してみてほしい。

そしてそれらを統合して、「どう利益に繋げられるか」「何が一番利益に繋がりそうなのか」という視点に立つことができれば、自ずと何を比較し、どのような差異を明らかにするのか、という点についてはクリアになるはずだ。

 

カイ二乗検定とp値

「意味のある偏り」なのか、それとも「誤差でもこれぐらいの差は生じるのか」といったことを確かめる解析手法に「カイ二乗検定」

「実際には何の差もないのに誤差や偶然によってたまたまデータのような差(正確にはそれ以上に極端な差を含む)が生じる確率」のことを統計学の専門用語でp値という。

このp値が小さければ(慣例的には5%以下)、それに基づいて科学者たちは「この結果は偶然得られたとは考えにくい」と判断するというわけである。

 

回帰分析

データ間の関係性を記述する、あるいは一方のデータから他方のデータを予測する数式を推定するのが回帰分析という考え方であり、こうした数式で記述される直線のことは回帰直線と呼ぶ。

重要なのはこの実線で示された実際の関係性と、点線で示された理論上の関係性の違いだ。

 

回帰係数の推定値:切片・傾き(x)ともにデータから算出された値だがあくまでデータに基づき「真値」を推定した結果だということに注意。

標準誤差:推定値の誤差の大きさ。回帰係数の推定値と比べて大きければあまり推定値は信頼できないが、この値自体を問題にするよりは後述の信頼区間で考えたほうがいい。

95%信頼区間:「回帰係数が0」の場合だけでなくさまざまな回帰係数を想定して、「p値が5%以下になる真値としてあり得ない値」とはならない範囲。「ほぼこの範囲内に真値があると考えて間違いない」と考えて大丈夫。

p値:仮に回帰係数が0だった場合にデータのバラつきのせいだけでこれぐらいの回帰係数が推定されてしまう確率。やはり慣例的には5%を下回ると「さすがに回帰係数0と考えるのはキビシイ」と判断される。

 

どのような分析軸で(これを説明変数と呼ぶ)、どのような値を比較したいか(こちらは結果変数と呼ぶ)、ということさえ決まれば、用いるべき手法は簡単に選べる。

重回帰分析は、説明変数すなわち予測したい結果に影響する要因が複数ある状況へ拡張された回帰分析

もともと0か1かという二値の結果変数を変換し、連続的な変数として扱うことで重回帰分析を行なえるようにした、というのがロジスティック回帰の大まかな考え方

 

相乗効果のことを英語ではインタラクションと呼び、統計学的な訳語として交互作用

形態素解析とは一般的に、文章を単語ごとに分割し、どのような単語が何度使われているかを集計する作業のこと

 

面白かったポイント

内容がわかりやすいので統計学を知るとっかかりとしておすすめ。

統計学の使いどころをつかむためのポイントが書かれているのはよい。

統計学がすべてを解決できるわけではないし、使えないケースがあるからといってこの武器を使わないというのももったいない。

 

満足感を五段階評価

☆☆☆☆☆

 

目次

◎社会調査法
◎疫学・生物統計学
◎心理統計学
◎データマイニング
◎テキストマイニング
◎計量経済学

-ビジネス

Copyright© まさたい , 2024 All Rights Reserved.