2013年

6月

04日

特集:使える統計学 2013年6月4日号

◇使える学問に熱い視線

◇ビッグデータの登場が追い風

 

望月麻紀

(編集部)


 今年4月27日、東京大学(東京都文京区)で公開講座「統計」が開講した。快晴のゴールデンウイークの初日ながら約660人が「統計とは何か」と題した4時間20分の初回講座に耳を傾けた。

 6月までの3回講座で、定員は700人。募集を開始すると瞬く間に定員いっぱいとなり、募集が打ち切られた。公開講座常連のシニア層も多いが、この日、受付作業をしていた事務局の担当者は「普段の講座よりも若い世代が多い」と統計人気に驚いていた。
 なぜ今、統計学なのか。講座に参加した若い世代に参加理由を聞いてみた。
 東大卒で製薬会社勤務の女性(31)は「仕事で、薬の効果をわかりやすく、しかも統計学的に正しく伝える能力を求められる。正しい伝え方を知りたくて参加した」。
 同じく卒業生でシステムエンジニアの男性会社員(23)は「これから仕事で必要になると考えた。ビッグデータ時代を迎え、データを生かす能力が求められている。経営判断に役立つようなデータ分析を行うには、感覚や勘では無理。統計学の知識が必要だ」と話した。
 大学時代に一度は授業を受けたことがあっても、社会に出て改めて「今、統計学が必要」と認識し、連休の初日に4時間を超える座学に臨む。実社会での統計学ニーズの高まりがうかがえる。
 統計学はあらゆる業界、あらゆる場面で有効なツールだ。それは以前から知られてきた。古くは製造現場での品質管理に力を発揮し、保険会社のアクチュアリー(保険数理士)は統計学を駆使して商品を設計している。


 ◇保険商品、新薬承認、公的統計


 新薬承認には統計学的なエビデンス(根拠)が欠かせない。政府や日銀は政策判断のため、国内総生産(GDP)や消費者物価指数(CPI)など公的統計を算出する。
 多用されてはいても、統計学は裏方の目立たない存在だった。その統計学が注目されるようになった背景には、ビッグデータの存在が大きい。
 企業や役所が持つ情報(ビッグデータ)は膨大かつ形式が多様なうえ、更新頻度も高い。具体的には、ツイッターなどのソーシャルメディアのテキストデータやネット通販の購買・検索履歴といったインターネット上のデータのほか、ICカード乗車券や電子マネーなどの利用履歴、橋や道路の劣化や破損を感知するためのセンサー機器が集めたデータなどが挙げられる。その解析は一筋縄ではいかない。統計学のほか、IT(情報技術)やビジネスの知識と経験が必要だ。そのため三拍子そろった人材は貴重で、日本よりも一足早くビッグデータ時代を迎えた米国では「データ・サイエンティスト」として厚遇されている。
 2009年、ミクロ経済と情報経済の学者で米グーグルのチーフ・エコノミストであるハル・ヴァリアン氏が「今後10年間で最もセクシーな仕事は統計家である」と表現したほどだ。
 米国のシリコンバレーで、ビッグデータ関連のベンチャー企業を日本人3人で立ち上げた芳川裕誠最高経営責任者(CEO)は「米国でも数学の専門家の受け皿は金融業が中心だったが、製造業や流通業が自社のビッグデータ解析を始めたことで、統計家に光が当たるようになった」と話す。
 この波は日本にも到来するのだろうか。
 大学に統計学部もなく、人材の育成が遅れている日本。突貫工事での人材育成が始まっている。
 世界トップのストレージ(外部記憶装置)を手掛ける米EMCの日本法人は12年5月、データ・サイエンティストの養成講座を日本で開講した。連続5日間で定員12人のコースの費用は30万円と高額だ。
 それにもかかわらず「ビッグデータの分析チームを発足するため、一度に9~10人を送り込みたい」といった企業の要望が多数寄せられ、数カ月先までキャンセル待ちの状態だ。就活に向けて受講を希望する大学生もいるという。
 EMCで人材育成サービスを担当している浜野崇さんは「日本にはデータ・サイエンティストと呼べる人材は100人もいないと推定される。企業からは人材育成の要望が多数寄せられているので、講座の定員を増やしたり、企業のビッグデータ分析班の立ち上げ支援サービスにも取り組んでいきたい」と意気込む。
 とはいえ、ビッグデータを本格的に活用している企業はまだ一部だ。データ・サイエンティストになり得る金の卵たちの進路は意外と狭い。国内トップ大学で統計学とIT技術を身につけた学生でも、その就職先はネット通販やオンラインゲーム会社が中心だという。ネット通販事業者は、マーケティングのためネット閲覧や商品購入などの履歴から顧客の志向性を分析、ゲーム会社は、いつどこでゲームをするかといった細かな顧客の動きまで追いかけているという。


 ◇統計学本、売れて25万部


 一方で、統計家の西内啓氏が書いた『統計学が最強の学問である』は25万部を売り上げ、統計学関連本では異例のベストセラーになった。西内氏自身はビッグデータには懐疑的だ。本を書いたきっかけも「ビッグデータにだまされるな」という思いからだったという。
 著書では、膨大なデータをまるごと解析するためにデータの蓄積や分析に過大な費用をかけなくても、サンプル調査で事足りることもあると訴えている。
 その西内氏の著書で統計学に魅せられ、冒頭の東大の公開講座に参加した人たちも複数いた。
 人事担当の男性会社員(26)は「学生時代は統計学が嫌で仕方なかったが、西内さんの本を読んで統計学に興味を持った。人事部でも将来の人員構成を予測するなど統計学が役に立ちそう」と話す。ビッグデータとは異なるもう一つの流れがありそうだ。
 この日の講座で佐藤俊樹東京大学教授(社会学)も「自分が感覚的に知っていることを数字で見せることができる」と統計学の意義を解説。統計学を使うことがコミュニケーションにおいても有効であると指摘した。社会は、データに基づくエビデンスや「見える化」による共通認識を求めている。話の出発点になるデータを求め、統計学への関心が高まっているともいえそうだ。
 本来、その最たるものであるはずの数字が公的統計だ。景気や物価、雇用や賃金、消費など、ありとあらゆるデータを政府は集計している。


 ◇課題多い公的統計


 しかし、その足元は危うい。内閣府は5月、12年10~12月期の名目国内総生産(GDP)速報値について、季節調整済みの伸び率を前期比0・3%減から同0・1%減(年率換算1・3%減から同0・5%減)に訂正した。財・サービスの名目輸出入金額から季節要因を除く計算の過程にミスがあった。
 日本の経済動向を知り、政策決定にも影響する重要指標でのミス。内閣府は「単純な人為的計算ミス」と説明したが、発表後、民間エコノミストに指摘されるまで気づかなかっただけに、チェック機能を果たす専門性の高いスタッフの不足が指摘されている。
 日銀が物価目標2%を掲げたことで、注目を集める総務省の消費者物価指数(CPI)も、その集計方法には課題がある。30ページ掲載の梅田雅信・首都大学東京教授のリポートに詳しいが、デジタル家電の価格下落の影響が、実際の下落幅ではなく、算出方法によるパターン化されたクセとして指数に表れやすい。また、売れ筋商品の価格が反映されにくいという事情もある。
 後者の課題を解消するため、東京大学の渡辺努教授は販売時点情報管理(POS)データを使った物価指数の公表を始めた。
 物価の評価軸が増えたことで、日銀の物価目標達成か否かを評価する2年後、CPIの精度が議論になることは間違いないだろう。


 ◇大学入試ではまだ日陰者


 人材育成では、10年度以降、小中学校の学習指導要領が順次改訂され、学校教育で統計分野の指導が手厚くなった。問題解決能力の向上を目標に、それを可能にする知識の一つとして統計学をしっかり指導する。これ自体は期待できるのだが、実は話はそう単純ではない。このカリキュラム改訂にあたり、東京大学と京都大学は早々と、大学入試では統計分野を出題しないと公表した。
 統計学関連の7学会はそろって反論し、出題範囲とするよう要望しているが、改められる様子はない。数学界において、統計はメーンストリームではないこともあり、大学の数学者たちは統計学を出題することを好まない。生物や医学、経済などそれぞれで必要な統計の知識は、各学部の統計学担当の教官が教える仕組みになっていることも、統計学者の発言を弱めている。
 日本では長年、“日陰者”だった統計学。価値あるデータを求める世界的な潮流、社会のニーズの高まりで、その位置づけは変わるのか。それとも、啓蒙本の人気で終わるのだろうか──。