今日は、3月3日。
いかがお過ごしですか。

もうすぐ春です。
いい感じです。

さあ、それでは・・・。

合衆国にあって日本にない会話の代表格は、「The study's margin of error was plus or minus 6%.(その統計の確からしさは、プラスマイナス6%です)」というものだろう。合衆国では政府の公表統計やジャーナリストのアンケート調査結果などの統計資料には必ず「margin of error」が表示されていて、現実の数値との乖離度をプラスマイナスX%で知らせてくれる。日本では、「60%の人々が賛意を示しています」とのアンケート結果を伝えても、その数値が現実とプラスマイナス何%乖離しているかを明かにしないことが慣習となって久しい。

私たち日本の民衆は「mean(平均値」)」を重用し、それがさも実数値(実態)を現しているかのように取り扱っている。これはデータが左右対称である場合に限り、意味のある要約となる。加えて、「median(中央値)」と「mode(最頻値)」を今以上に援用した方が良いでしょう。medianは「50パーセンタイル」とも呼ばれ、世帯所得のように歪んだ分布(左右非対称や外れ値)を持つデータの場合には、実態に近い数値を示してくれる優れものだ。

統計データを解明する際には、平均値・中央値・最頻値などの要約を鵜呑みにすることなく、データ分布を見るよう心がけたい。例えば「バイモダル」のようなデータ頻出の山が2つあるタイプの分布に関しては、平均値と中央値を知っていても、分布状況を知らずして、データの特性を理解することは困難です。「mean(平均値)」に惑わされてはいけません。

さて今話題の「統計不正問題」は、次の4点に収斂されるだろう。

500人以上の事業所をすべて調査(全数調査)することになっている毎月勤労統計が、適正な手続きを経ずに、2004年から東京都で抽出調査に切り替えられた。

⊃値復元処理の指示があったが、その実施確認をしていない。全数調査ならば平均給与の計算は、調査を行った事業所の合計支払額を総労働者数で割ると計算できる。だが、抽出調査ならば、計算に際して復元処理が必要。調査した事業所の合計支払額に抽出率の逆数を乗じるのだ。例えば、全数の3分の1の調査ならば、調査した事業所における合計支払額を3倍すること。これにより抽出調査の結果と全数調査の結果が比較可能となる。

2014年、厚生労働省はマニュアルから東京都の500人以上の事業所が抽出調査であることを示す記述を削除したが、その手続きの正当性と意図を告知していない。

2018 年1月以降のみ復元処理を行うことにした結果、給与関連の数値が上振れしたこと。にもかかわらず、数値の連続性が失われていることと、その告知がされなかった。実態に比べて小さな抽出になってしまった東京都分について補正を行うことで、実態に近づけることを意図したのだろう。しかしながら、なぜ18年1月以降のみを復元し、それ以前については復元処理を行わなかったのだろうか。その手続きの根拠が不明。

機械化の推進や民間事業者へのデーター提出の義務付け等を活かして、人員とコストを削減した知識集約型の標準化・簡素化されたスピーディーな統計処理システムを導入したいものです。政府の統計職員数は平成30年4月1日現在1,940人と平成21年4月1日現在の3,810人よりさらに49.08%減少しているが、それに反比例して統計処理システムが高度化しているはずでした。人員の削減ばかりに目がいってしまい、システムの改善・電子化が疎かになってしまいました。この問題の発生を機に日本の賃金をいかにして上げるのかを国会で討議してもらいと思いました。なぜなら実質賃金が上がるなら、自然、統計データーの数値も上がるからです。生産性を上げることと最先端の技術を開発できる国になることを課題として、未来志向で参りたいものです。「修正エンゲル係数」という目眩ましを導入しても、低所得者層の生活の厳しさは変わりません。幸せな未来を創る道具の一つとして活用できる電子化された統計システムを手にしようではありませんか。

参考:総務省「我が国の統計機構」
http://www.soumu.go.jp/toukei_toukatsu/index/seido/2-2.htm


大きな笑顔の佳き一週間を。
4801-0037[1]