みかんとコーヒー

金融/政治/その他

社会現象データを統計学が扱うことへの考察

 統計学を大学で「齧る」と、この世界は全て正規分布で出来ているかのように錯覚する。 そこまでいかなくとも、「中心極限定理のお陰で、平均や分散という概念は常に有用」というとんでもない勘違いをしたままの人間が世に放たれているのは事実だ。

 これは、初歩の統計学では正規分布までしか扱わないことや、往々にしてその難解な前提を理解できないことに起因している。

 個人の理解力の欠如にも落ち度はあるが、教える方にも問題がある。理論の限界と前提を確り理解させなければ、「絵にかいた餅」を打って金を稼いでいると謗りを受けても否定できまい。

 そもそも、中心極限定理とは何なのか。

  「母集団」からランダムに一部のサンプル(「標本」)の取り出し、その平均(「標本平均」)をとるという作業を繰り返す。こうして得られた、作業の回数分得られた「標本平均」は、分布をみると正規分布しており、「標本平均」の平均は母平均に収束する。以上は「母集団」の分布に関係なく成り立つ。

 ここで、(あまり教科書に書いていないことで)素人が気を付ける点は以下である。

  1. 標本平均を多数集めなければならない。あなたの目の前にある標本の平均をとっても、それは1個の標本平均でしかない。だから、とりあえず持っているデータの平均をとって意味を見出せるなんて勘違いはしないほうがいい。まあ、あなたが持っている標本の平均が母集団のミニチュア版であることが分かっているとか、母集団が正規分布していることが分かっていれば別だけど。
  2. 仮に母集団が正規分布していない場合、あなたが持っている標本の意味するところはなんだろうか。正規分布しているかどうか分からない場合は、ノンパラを使えというが、多くの場合、とりあえず正規分布性を仮定していることの方が多いはずだ。その時思う。お前はなんで母集団の分布を知っているのだ。

2つ目の議論は、統計学を学び始めてからずっと疑問に思っていることであり、今の時点でも自分のなかで納得できる理解がある訳ではないが、現時点では以下のように整理している。

  • 母集団の分布が、「平均」が意味を持たない代表値となってしまう分布である場合、標本平均の平均が母集団平均に限りなく近づく形で収束するとしても、その収束した値は代表値ではない。
  • 母集団において「平均」が定義できない場合、収束する標本平均の平均という値は意味を持たない。

 重箱の隅をつついているように思われるかもしれないが、全くそんなことはない。株価・所得・会社売上・都市の人口等、社会的な現象に関するデータは正規分布しないことが示されている。

 あなたは、平均5%のリターンを20年維持している株を勧められたら迷いなく買うのか?日本の平均所得が400万円だといって、それを本当に「平均的な人の所得」だと思うのか?

 前者は、株価のリターンは正規分布しているという仮定や、常に社会情勢が変化するなかで、時間平均と集合平均が一致しない可能性を無視していることが問題だ。株価のリターンが21年目にマイナス50パーセントとなることもあるし、戦争が起きてその前の20年のデータなんて全く意味がなくなったり、あなたが観測しているある長い歴史の間独立だった事象が、次のある瞬間だけ相関を持つように変わることだってある。 後者は、そもそも所得がパレート分布しているであれば全体を表す代表値には全くなっていないから、代わりの指標を使うほうがベターだ(中央値や25%、75%タイル値やジニ)いう話だ。

 でも、社会現象のデータについて、平均(や分散)という値が意味を持たないことがある例も多いのに、なぜ全体的に見て、現代社会は平均や分散の概念にここまで拘っているのか。

 一つは、正規分布しない場合のデータへの対処法が確率していないからではないか。実際、正規分布していないデータは統計学では扱いにくいし、科学主義的な風潮のなかで、統計的な意味を持たない数字を持ち出すのは、自らの研究の信頼性を貶める結果にもなりかねない。

 二つ目は、こちらの方が大きいように感じるが、正規分布・平均哲学が広く信じられている宗教だからだ。

 啓蒙されし高度な現代人の多くは、身近に理解できない事象があることを認めたり、「分からない」としておくことは許されず、あらゆる不合理な仮定を置いて「科学的な」説明を付ける宗教衝動にどっぷり漬かっている。そういう人間が、代替できる便利な「科学的な」指標や哲学がないなかにおいて取りうる道は、間違っていても権威のある(その時代の)学説・教説を盲信することである。残念ながらこれはどの時代にも普遍的に起こる「伝統」であり、伝統を重んじるわが国においては、特にそういった姿勢は評価され続けるであろう。

 いま根本的に必要なのは、代替指標や哲学的な視点の提供という作業であるが、哲学・思想の重要性が軽視され、実際世界に影響を与えるような思想家や哲学者を全く生まない文化を維持させてきたこの国で、問題解決の糸口が生まれることはない。