You are browsing the archive for オープンガバメントデータ.

千葉市のオープンガバメント、その本気度をチェック!

2013年8月22日 in Events, News

まち歩き後に市民からの質問に答える熊谷市長

まち歩き後に市民からの質問に答える熊谷市長

 8/17(土)に市長と一緒に”ちばレポ“を使ったまち歩き体験会を開催した千葉市ですが、そのオープンガバメント/ガバメント2.0に向けた本気度はどの程度でしょうか?

 国連経済社会局行政開発管理課による市民参画のためのオープンガバメント・データに関するガイドラインにある「オープンガバメントデータ・レディネス評価用チェックリスト」を使って評価してみました。これはオープンガバメント/オープンデータを推進するための準備がどの程度整っているのか、政府・自治体が自己診断する為のチェックシートです。カテゴリごとに全部で40件のチェック項目があります。今回、このチェックシートに基づき、試験的に評価してみました。なお、これは僭越ながら筆者が外から見た、主観による評価なのであくまで参考程度に見てください。■は準備OK、□は準備NGもしくは不明を表します。『』内は筆者のコメントです。

  • A.政治的コミットメントおよび適切な政策
  • ■1.ガバメント・データをオープンにするためのトップレベルの意思決定者からの政治的コミットメントがありますか?『市長の強いコミットメントあり』
    ■2.透明性、説明責任および参加のためのトップレベルの意思決定者からの政治的コミットメントがありますか?『市長の強いコミットメントあり』
    ■3.腐敗と戦うトップレベルの意思決定者からの政治的コミットメントがありますか?『市長の強いコミットメントあり』

  • B.市民社会、メディアおよび他の再利用者の能力
  • ■4.透明性、説明責任および参加の概念を促進する増幅者として動機づけられた変革推進者がいますか?『業務改革推進課。OKFJもその支援団体のひとつ。』
    □5.これらの変革推進者は、独力で処置を取り講ずる権限を与えられますか?『不明』
    □6.これらの変革推進者は、OGD創設に従事するために必要な能力(知識、技術)リソース(人的、財政的)を持っていますか?『財政的リソースが不明。他はOK』
    □7.市民社会とメディアに透明性、説明責任および参加に対する需要がありますか?『メディアの関心は強い。市民の方はまだこれから(現時点でも一部に活発な市民はいる)』
    □8.市民社会とメディアに情報の自由とガバメントデータをオープンすることに対する需要がありますか?『メディアの関心は強い。市民の方はまだこれから(現時点でも一部に活発な市民はいる)』
    □9.技術的なリテラシーを持つ市民社会がありますか?CSO(市民社会組織)あるいは「市民ハッカー」がいますか?『一部にいるが連携、組織化はこれから』
    □10.自分たちのアドボカシーまたは市民サービスプロジェクト用に実際にOGDを再利用しているCSOはありますか?『これから』

  • C.法制度と規制の枠組み
  • □11.情報へのアクセスに関して組織内の規定がありますか?『不明』
    ■12.情報へのアクセスに関する法制度がありますか?『情報公開法』
    □13.情報制度へのアクセスは、受け身的な開示と同様に率先した開示に対する規定を含んでいますか?『不明』
    ■14.データ・プライバシーに関する組織内の規定がありますか?『通常あるはず』
    ■15.データ・プライバシーに関する法制度がありますか?『個人情報保護法』
    □16.オープンデータに関する法制度がありますか?『これから』
    □17.データ・プライバシーに関する国際協定の批准がありますか?『不明』
    □18.PSIの中に知的財産権を規制する法制度がありますか?また、それは、PSIの再利用を支援しますか?『不明』

  • D.制度的枠組と組織的な条件
  • ■19.情報(あるいはプライバシー)コミッショナーがいますか?『CIO補佐監』
    □20.情報コミッショナーかそれに準ずる人は幹部から独立していますか?『不明』
    □21.全国レベル、あるいは準国家レベルにオープンガバメント・データに責任を持つ単独の政府機関がありますか?『なし』

  • E.文化的、人的リソースの状況
  • ■22.人間の価値と市民の権利は、社会の中で広く認められていますか?『はい』
    □23.市民とコミュニティーのエンパワーメントおよび自決を支援する環境がありますか?『一部あり』
    □24.市民の教育と知識の共有を支援する環境がありますか?『一部あり』

  • F.財政的な状況
  • □25.オープンガバメント・データの費用は問題となりそうでしょうか?『不明』
    ■26.OGDイニシアチブを実施する利点はコストより大きくなり得ますか?『大きくなることが見込まれる』

  • G.技術的インフラ
  • ■27.国全体でインターネットは充分に浸透していますか?都市/地方で『はい』
    ■28.モバイルは充分に浸透していますか?また、人々はどのようにモバイルのデータサービス(SMS、3Gなど)にアクセスしていますか?都市/地方で『はい』

  • H.データと情報システム
  • □29.OGDとしてのPSIの作成と公表を支援するデータ管理および情報システムが適所にありますか?『これから。CKANは設置済み』
    □30.適所のデータ管理と情報システムは、PSB(公共機関)の間のデータの有効な交換を可能にしますか?『不明』
    □31.データはウェブ(形式を問わず)上で、オープンなライセンスで利用できますか?『これから』
    □32.データは構造化された機械可読なデータとして利用できますか?『これから』
    □33.上記全てに加えて非プロプライエタリな形式ですか?『これから』
    □34.上記全てに加えてW3Cのオープン・スタンダードを使っていますか?『これから』
    □35.上記全てに加えてLinked Data ですか?『これから』
    ■36.ガバメント・データあるいはガバメント・データの編纂は、現在著作権あるいは他の知的財産のような体制によって保護されていますか?『はい』
    □37.データは、再利用を制限するなんらかのライセンスを前提としていますか?『これから』
    □38.料金はアクセスおよび再利用に対して、限界費用(例えば原価の回収を支援するため)を超えて請求されますか?『これから』
    □39.データは商用再利用を含め、目的を問わず自由に再利用できますか?『これから』
    □40.「表示」や「継承」以外の制限は何かありますか?『これから』

 今回は全40項目中、13項目が準備OKという結果となりました。一見残念な結果に見えますが、やや厳し目に評価した点、外部からは分からない部分がある点、市民や中央政府の果たすべき役割部分もある点などから、取り組みを始めてまだ日が浅い現時点としては実際のところこれはかなり良い数字だと言えます。

 筆者も市長とのまち歩きに参加しましたが、市民側の反応はほとんど好意的なものでした。今回の試みは実験段階であり参加者数は30名と限定的なものでしたが、従来から公園の清掃などのボランティア活動をやられている方々や、これまであまりそういった活動の経験が無い方々など多様なバックグラウンドの方々が参加していました。リタイア世代の方々が7割ほどの印象でしたが、現役世代の方々も見受けられ、中には高校生も参加していたようです。従来型の市民活動も尊重しつつ、新しい枠組みでの市民協働の可能性が見えてきた印象があります。また、運営側もひとつの部局ではなく、市民局、総務局、都市局、建設局など幅広い組織が関与し、うまく横連携されている様子が窺えました。

 自治体だけが頑張っても「まち」は変わりません。県・中央政府の後押しや市民との連携が今後のカギになりそうです。千葉市の次の一手が楽しみです。

(参考:熊谷市長とのまち歩きイベントの様子は下記記事にまとまられています。)
街の問題 スマホ活用して改善(NHK NEWSWEB)
ちばレポ実証実験 市長とまち歩き(千葉市長・熊谷俊人Blog)
ちばレポ実証実験 ~市長とまち歩き~(千葉市議会議員 福谷章子のまちづくり)
ちばレポ実証実験、市長とまち歩きに参加してきました。(千葉市議会議員(美浜区選出)たばた直子「真っ直ぐな視点を千葉市に!」)

市民参画のためのオープンガバメント・データに関するガイドライン

2013年6月1日 in News, Special

OGDCEガイドライン

以前の記事でご紹介した「開発管理における市民参画のためのオープンガバメント・データ 指導ツールキット(OGDCE Toolkit)」の第2版が名称を「市民参画のためのオープンガバメント・データに関するガイドライン」に改めて5/17にリリースされました。

主な変更点は名称の見直し、一部情報の追加、文法的な訂正などです。

オープンデータの中でも、オープンガバメントに関わる「オープンガバメント・データ」に焦点を当てた内容です。全105ページとやや分量が多くなっていますが、これらの概念の違いや関連を把握したいお方にはオススメです。

原文はこちら

オープンデータの提供における課題を考える(1)ローデータから原始データへ

2013年5月24日 in Special

出展:http://www.w3.org/2009/Talks/0204-ted-tbl/#(15)

出典:http://www.w3.org/2009/Talks/0204-ted-tbl/#(15)

 オープンデータの提供形式についてはExcel形式の是非などいろいろな議論があるが、ティム・バーナーズ=リー言うところの「ローデータ(Raw Data)」に関する議論が抜け落ちている気がしてならない。

ローデータとは加工、集計前の生データのことである。例えば「県別に集計した人口」という集計値が公開されている場合、県別や全国計の人口を俯瞰したい人にとっては有用だが、その内訳となる市町村別の人口を精査したい人にとっては使えない。

オープンデータを幅広く有効活用(二次利用)するためには、ローデータが公開されていることが理想的だ。人口に関するローデータは住民基本台帳であろう。住民基本台帳のデータが1件ごとに全て公開されていれば市町村別はもとより、町丁目別、性別、年齢別等々あらゆる角度から人口を分析することが可能だ。

しかしながらそのためにはクリアすべき課題がいくつかある。

情報のマスク

 まず明らかなのは個人情報やプライバシーの問題だ。住民基本台帳には以下のような項目が含まれる。

住所、氏名、生年月日、性別、世帯主名、続柄、本籍、転入/転出日、(以下略)

これをそのまま公開してしまうとまさに個人情報の塊となってしまう。公開するためには個人を特定できないように情報に一部マスクをかける必要がある。以下はその考え方の一例だ。

まず住所は町丁目までとし、それ以下は個人を特定できないように伏せる。氏名は完全にマスク。生年月日も万一他のデータとの関連で個人を特定された場合のことを考えると、年月までにするとか、あるいは年齢に変換して公開することになる。性別はまぁ良いだろう。世帯主名や続柄は世帯数や家族構成を知る重要な情報なので数値やコードに抽象化して表現すると良いだろう。本籍以降は省略。

コード化とその規格化

 続柄は日本語をそのまま使うと微妙な表記揺れの懸念があったり並び替えが難しかったりするのでコード化するのが適当だろう。ここでは仮に(1:世帯主,2:配偶者,3:第1子)とするが、全国版の集計をとることを考えると、こういったコード化や下記の例のようなCSV形式は全国統一の規格として制定することが望ましい。

この時点でのデータはCSVだと例えばこんな感じだ。(値は架空のものです)

住所,年齢(2013/1/1時点),性別,世帯数(世帯主に1),続柄(1:世帯主,2:配偶者,3:第1子),人口
東京都千代田区千代田,34,男,1,1,1
東京都千代田区千代田,30,女,0,2,1
東京都千代田区平河町,49,男,1,1,1
東京都千代田区平河町,45,女,0,2,1
東京都千代田区平河町,17,男,0,3,1
東京都千代田区平河町,27,男,1,1,1
東京都千代田区平河町,35,女,0,2,1

しかし年齢は時点で変化するので、より細かな情報という点ではやや冗長になるが生年月日の日をマスクした項目もあった方がベターであろう。このあたりはプライバシーが漏れるリスクとの兼ね合いになる。

住所,生年月,年齢(2013/1/1時点),性別,世帯数,続柄,人口
東京都千代田区千代田,1978/1,34,男,1,1,1
東京都千代田区千代田,1982/5,30,女,0,2,1
東京都千代田区平河町,1963/1,49,男,1,1,1
東京都千代田区平河町,1967/8,45,女,0,2,1
東京都千代田区平河町,1995/1,17,男,0,3,1
東京都千代田区平河町,1988/2,27,男,1,1,1
東京都千代田区平河町,1977/10,35,女,0,2,1

さらに、このままでは、その町丁目の人口が1や2の場合は個人を特定されるリスクが高いので、そういったデータは人口0として、つまりそのデータは隠した状態で公開されることになる。
上の例だと千代田区千代田のデータはマスクされるか、除外されてこんな感じになる。

住所,生年月,年齢(2013/1/1時点),性別,世帯数,続柄,人口
東京都千代田区平河町,1963/1,49,男,1,1,1
東京都千代田区平河町,1967/8,45,女,0,2,1
東京都千代田区平河町,1995/1,17,男,0,3,1
東京都千代田区平河町,1988/2,27,男,1,1,1
東京都千代田区平河町,1977/10,35,女,0,2,1

「原始データ」なう

 ここであらためて考えるとティム・バーナーズ=リーが言うローデータは、生データをそのまま出せる場合には良いが
個人情報やプライバシーなどが混じる場合は部分的にマスク加工せざるを得ない。その意味でオープンデータとして必要とされるローデータとは、必要に応じて加工された最小単位の「原始データ」と捉えるべきであろう。今、必要なのはこの「原始データ」である。もしくは後工程でコンピュータ処理するための「トランザクションデータ」という言い方もできる。

利用例

 一例を挙げると「少子化」を考察する場合には「子育て世帯数」や「子どもの数」といった数値的な把握が不可欠であるが、上記のような原始データがあれば条件を付けてデータを絞り込んだり集計することで目的に応じた分析が可能になる。

まとめ

 オープンデータの提供を考える場合に、まずはあるものを出すという取り組みから始めるのは重要な一歩である。しかし、既にあるデータは当然ながらそれぞれの本来の目的に最適化された集計や表記が行われていることが多い。このためその内訳を掘り下げたり、特定のデータだけを選択することができず、二次利用が広がりにくい面がある。
二歩目に来るべきは既にあるものに対する表記法やファイル形式のあるべき論よりも、原始データの構造やその出し方をまず検討することからなのではないだろうか。(続く)