政府統計データの可能性を掘り起こそう! 統計データベース・アイデアソン開催中

2013年3月7日 in News


 

クラウドテストベッドコンソーシアム(CTC)は、統計データベースAPI・政府統計データの活用アイデアを広く募集する「統計データベース・アイデアソン」を3月15日(金)まで開催しています。

アイデアソンへの参加は、Facebookアカウントを持っている人であれば誰でも可能で、「統計データベース・アイデアソングループ」に参加申請し、事務局からの承認後に投稿できるようになります。

詳細は、以下のCTC内特設ページを御覧ください。
統計データベース・アイデアソン特設ページ

 

統計データベースAPIは、総務省所管の統計センター運営の「政府統計の総合窓口(e-stat)」にある政府統計データをWebAPI経由で取得できるサービスで、現在は試験期間中のためCTC会員に限定的に提供されていますが、2013年度以降に一般利用が開始される予定となっています。

現時点では、e-statで公開されている政府統計のうち、20の統計データが搭載されており、その中には国勢調査や家計調査、経済センサス、事業所・企業統計調査などの主要な統計データが含まれています。

 

 

Japan, right now.

~今、”日本人”は何をしているのか~

 

今回、既に搭載されている統計データの一つの中から「社会生活基本調査」の活用事例をご紹介します。

社会生活基本調査とは、”1日の生活時間の配分” や ”余暇時間における主な活動の状況” などの国民の社会生活の実態を明らかにすることを目的として調査されており、1976年(昭和51年)以降5年ごと、2011年(平成23年)には8回目の調査が行われています。

総務省による調査結果の報道資料からでも多くのことを知ることができるのですが、都道府県別や性年代別、15分刻みの時間帯別など、分析者の持つ課題・目的によって視点は異なるので、まだまだ様々な切り口からの分析が可能です。

 

米国のブルックリンでクラウドソースによって様々な教育プログラムを提供するBrooklyn Braineryを手がけるJonathan Soma氏(@dangerscarf) は、今から4年半前の2008年10月に、日本の統計局内の社会生活基本調査の英語サイトからデータを取得し、インタラクティブなデータビジュアライゼーション”Tokyo Tuesday“(Javaが必要)を作成しています。

 

ロードするごとにランダムな条件のスタックグラフ表示され、横軸に24時間、そして現在時刻と同じ場所にリアルタイムに線が引かれています。グラフをダブルクリックすると深堀でき、対象とする曜日を変更したり、更に下段には性別や雇用形態別でのグラフも用意されています。

マトリックスになっているオリジナルの帳票を機械識別可能な形に成形し、まとめて全体を可視化することによって、これだけでも国民の生活実態が少見えてきた気がしませんか?

まさしく、これが”典型的な日本人の生活”を表しています。

 

もちろん、このデータからだけでも多くのことを得ることができますが、この他のオープンデータや企業が保有しているデータと組み合わせることによって、更に多くのことを得られるでしょう。

”生活者の実態”を明らかにするという目的から、「社会生活基本調査」だけでなく、博報堂が昨年公開した「生活定点」(改変は認められていません)と合わせて見ることによって、”行動”と”心理”がどのように変化してきているのかを読み解くことができるかもしれません。

また、焦点を絞り、共働き世帯の就業時間や家事にかける時間がどのように経年変化してきているのかを性年代別などで把握し、そこから例えば、「年代ごとの特徴は、年を取るにつれ変化するのか? それともその特徴はそのままシフトしていくのか? やはり経済環境とともに変化するのか? 雇用環境の変化ならば就業構造基本調査を詳細に見てみよう」 などといった見方ができるかもしれません。

Twitterなどのフローデータから、普段の生活に関係する言葉を抽出し時間軸で並べてみると、何か面白い結果が出てくるかもしれません。

 

是非、皆様も「このデータをこのように可視化すれば、このようなことがわかるのではないか」「このデータだけでなく、このデータと合わせると、このようなことがわかるのではないか」といったようなアイデアがあれば、今回の統計データベース・アイデアソンに積極的に参加し、政府統計データの可能性を掘り起こしましょう!

2 responses to 政府統計データの可能性を掘り起こそう! 統計データベース・アイデアソン開催中

  1. 先日もある業界団体の方と、e-Statをデータポータルと位置付ければ大きな前進になるという話をしたばかりなので、グッドタイミングな記事でした。ありがとうございました。

    e-Statではデータ収集のプロセスが既にあり、データ収集業務が末端の地方公共団体や公的機関にまで徹底されているわけですから、データを集めるための追加コストはかかりません。また、最近のe-Statはcsvでデータを公開するケースも増えています。その上に今回のようなAPIが乗れば、とりあえず第一歩としては言うことなしです。統計センターが処理後のデータ公開から無理なく始めて、徐々に末端のロウデータにまで拡げていけば良いと思います。

    残る問題はライセンスです。利用目的を制限しないオープンなライセンスでデータ/APIを公開すれば、もう立派なデータポータルになります。ライセンスは法的な議論だけでなく、政策・戦略としてどうするかという観点からも決めるべき問題だと思います。

  2. e-statをデータポータルにする件、大賛成です。
    もともとe-statはデータポータルを目指していたわけですし、そのまま「データポータルだ!」といえば、ある程度はOKだと思います。
    機械可読やAPI(※)、ライセンスの件は、徐々に改善していけばいいので、まずは「日本にもデータポータルがあるぞ」と宣言することが重要だと思います。
    (※これまで、オーダーメイド集計である点が課題だと思っていましたが、今回のAPI公開に向けた試行などで、この点も改善されていくことと思います。)

    一方、OpenDATA NETIのような取り組みも重要ですので、データポータルとデータカタログが並列しても、当面はいいのかなと思います。

Leave a reply

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

次のHTML タグと属性が使えます: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>

Naoyuki Ito

Written by

マーケティングリサーチ会社にて、データ分析によるマーケティング支援やデータ分析環境の開発・構築。2014年4月からは、デジタルマーケティングへの3D(オープンデータ、パーソナルデータ、ビッグデータ)活用によって、生活者主導で豊かな生活が送られる社会の実現を目指しています。