オープンデータのロードマップ(案)及びガイドライン(案)に関するパブリックコメントを提出

2013年6月7日 in Featured, Special


Open Knowledge Foundation Japanは本日、「電子行政オープンデータ推進のためのロードマップ(案)」及び「二次利用の促進のための府省のデータ公開に関する基本的考え方(ガイドライン)(案)」に関するパブリックコメントを内閣官房IT担当室に提出しました。以下に提出したパブリックコメントの全文を掲載します。

————————————————————————————————————

オープンデータのロードマップ(案)及びガイドライン(案)に関する意見

Ⅰ「電子行政オープンデータ推進のためのロードマップ(案)」に対するコメント

1.「2-(1)二次利用を促進する利用ルールの整備」(p.2)

(a)ユーザーコミュニティとの対話に基づくルールづくり
基本的なルール作りのあり方について漸進的に取組みを進めるため、また公開した後の利用を後押しするために、ユーザー参加型、ユーザーコミュニティとの対話に基づく共同規制的アプローチで進めていくことをルール形成の基本的な方針とするべきである。KPIとして「ユーザーコミュニティとのミーティングをいつまでに何回開催するかを加えるなども検討する必要がある。

(b)世界標準ライセンスの採用
データの利用価値はデータを組み合わせることによってさらに高まることは周知の事実である。そのためには、組み合わせるデータのライセンスはできる限り同じものが望ましい。データ公開にあたって、日本固有のライセンスを設計し適用することは、データを組み合わせる可能性を狭めることになり、日本の国民や企業にとって不利益となる。日本独自ライセンスではなく、パブリックドメインやCC BYなど、世界で広く使われているライセンスの採用を最優先に検討すべきである。オープンデータ先進国をできるだけ早くキャッチアップするためにも、独自ライセンスの設計に時間をかけるべきではない。

2.「2-(2)機械判読に適したデータ形式での公開の拡大」(p.3)

(a)防災分野での機械可読データの早期提供
防災は国民にとってまさに命にかかわる最重要課題の1つであり、他の重点分野よりも優先して早急に取り組むべきである。道路、橋、港/空港、建物等の社会インフラの状況に関するデータを集約し機械可読な形式にすることで、行政組織が地域を越えて防災や災害対応に使うことができる体制を早期に整備するとともに、緊急時にはそれらのデータを一般にも公開する。本件については、ただちに防災関係の会議のアジェンダに追加し、早期実施を図る。

(b)「原始データ」の優先的公開
いちばん細かい「原始データ」さえあれば、それを集計したデータ(統計値に多い)はいかようにでも作成可能である。まずは各データの原始データとはどういったものなのかを整理し、それを出すことを優先すべきである。
【参考】

http://okfn.jp/2013/05/24/rawdata/

個人情報やプライバシーなど、配慮の必要な事項を踏まえた上で公開する項目を具体的に決めていかないと原始データの公開は広がらないのではないか。
オープンデータの利用者には、公開された状態で(例えばExcel形式で)使いたい、いわばカジュアルなユーザーと、原始データを入手して、加工やクレンジングは自分でやりたいヘビーユーザーが想定される。前者は個人や小さな団体が何らかの用途でデータを少量使う場合が多いであろう。後者はデータに付加価値を付けて二次的に提供したり、専門的な分析を行うビジネス用途が中心であろう。
カジュアルなユーザーはExcelなどで見やすく加工されたり、集計されたものが使いやすいかもしれないが、ビジネス用途には原始データが不可欠である。
よって、今ある統計データの出し方を整理するにあたっては、まずその原始データを定義し、公開することを最優先とすべきである。その際、一見不要に見えるものであっても、公開できる項目についてはできるだけカットせずに公開内容に含めるべきである。加工済みのものを正規化して公開するような作業は優先順位としては低く、データ提供側の負担が増えてデータが出にくくなることが懸念される。

(c)機械判読よりも公開を優先
注記事項に記載されている「国民への情報公開の観点から、人が読むという従来からの利用形態に適したデータ形式での公開も継続する。」ことを必ず遵守させるよう徹底すべきである。データを機械判読可能な形式に整えるには時間もコストもかかる。データを機械判読可能にしなければ公開してはならないという誤解をデータ保有者に与えてしまうと、データ公開そのものが阻害される恐れがある。
同じ理由により、現在公開されているデータや、すぐに公開できるデータに関しては、形式を問わず、適切なライセンスのもとで公開することを最優先すべきである。機械判読可能にする作業は公開後行い、機械判読可能なデータがそろった段階で順次追加していけばよい。

(d)民間による機械判読可能化
機械判読可能なデータへの変換は各省庁で主体的にやるだけでなく、データを必要とする民間に任せる方策も考えるべきである。データは鮮度も価値である。機械判読可能にするために時間がかかるようならば、その価値を失うことになる。ビジネス上データを必要とする企業が機械判読可能化を担うことについて大きな支障はないと考えられる。一方、政府や地方自治体は、利用されるかどうか分からないデータに必要以上にコストをかけなくても済む。政府は機械判読可能に変換したデータを公開するためのデータカタログを整備し、機械判読可能化に協力してくれた企業名を公開するなどの方法で、企業に協力を促すことも可能である。

3.「2-(3)データカタログ(ポータルサイト)の整備 」(p.4)

(a)すでに機械判読可能な形で公開しているデータの省庁横断的なカタログ整備
復興DB、気象庁防災情報XML、財務省予算書決算書、国会図書館、基盤地図情報、財務省貿易統計、農林水産関係試験研究機関総合目録等、すでに機械判読可能な形で公開しているデータが多数存在している。これらのデータはそもそも再利用を前提に作られていると考えられる。しかし、こうしたデータは各省庁がバラバラに公開しており、一般の人にはどこに存在しているのかを知る手段がない。価値あるデータの再利用を促すためにも、こうしたデータに関する省庁横断的なカタログを整備し、再利用可能なライセンスのもとで、直ちに公開するべきである。

4.「2-(4)公開データの拡大」(p.5)

(a)各省「白書」の早期公開
各省が作成するすべての「白書」は、情報通信白書と同じく直ちにCC BYライセンスのもと、機械可読形式で公開するべきである。公開にあたっては、全白書をポータルサイトを通じて公開し、一括検索など横断的な操作が容易にできるようにする。

(b)市町村レベルなど、より「原始データ」に近い統計データの公開
公開されているデータがより細かい「原始データ」であればあるほど、データのビジネス活用の可能性が高まるのは先に指摘した通りである。また、国民の生活に密接に関係している課題については、集約したデータでは役に立たない場合が多い。
そこで、都道府県レベルに集約して提供している統計データについて、個人情報やプライバシーの問題を考慮しなくて済む範囲で、且つ、できるだけ「原始データ」に近い形でもデータも提供すべきである。例えば、各種統計データを市町村レベルまで公開することによって、エリアマーケティング等には非常に有用なデータとなる。また、待機児童数などを保育所ごと、さらには各保育所内の年齢ごとに公開することによって、保育所を探している人には非常に大きな助けとなる。こうした例はここでは指摘できないほど多数存在している。

(c)非商用目的限定で既に公開しているデータの商用利用化
省庁や自治体のサイトには、非商用目的限定で公開されているデータが多数存在している。こうしたデータは各省庁や自治体などが市民にとって重要であり公開すべきとの判断に基づいて公開していることから、改めて重要であるか否かの議論を行う必要なない。これら非商用目的限定で既公開のデータに関しては、オープンデータ戦略の基本原則に基づいて、商用・非商用を問わず利用できるようにライセンスを直ちに変更すべきである。ライセンスについては、パブリックドメインあるいはCC BYが適当であると考える。

(d)経済界のニーズ調査に基づく優先的なデータ公開
これまでに経団連をはじめとする経済界からのオープンデータに関するニーズ調査がすでに複数回実施されてきた。こうしたビジネスニーズが明らかなデータに関しては、新たに議論を重ねることなく、直ちに公開すべきである。経済界からのオープンデータに対する期待を損なわないためにも、早急な対応が必要である。

(e)国民の関心度に基づいた公開優先度の決定
政府統計の総合窓口e-Statでは、主要統計についての月間アクセスランキングを公開している。このランキングを見れば、国民がどの統計データに対して関心を持っているのかを知ることができる。ロードマップで公開を優先するとしている重点分野(白書、防災・減災情報、地理空間情報、人の移動に関する情報、予算・決算・調達情報)には含まれていないデータがランキングでは上位を占めているケースが多々見受けられる。国民の関心の高いデータから優先的に公開することで、オープンデータに対する国民の関心や理解もさらに深まることは間違いないため、こうしたe-Statの月間アクセスランキングなど、国民の関心度を反映した公開優先基準も取り入れるべきである。

(f)情報公開法改正
情報公開法の改正については、民主党政権時に議論を重ね法案が提出されたものの、審議されず廃案となっている。情報公開法を改正し、より国民に分かりやすく利用しやすいものに改正すべきである。
参考:「改正法案は、現在の情報公開法の解釈運用上の問題や非開示処分取消請求訴訟手続上の問題を踏まえ、これらを改善すべく、不十分ながらも、知る権利の保障の明文化、不開示情報の範囲の限定、裁判所が行政機関に対し行政情報の提出を命じて裁判所のみが見分できる手続(インカメラ審理)の導入などを盛り込んだ内容となっている。さらに、『国民に分かりやすい形で、かつ、国民が利用しやすい方法により提供するものとする』旨の積極的な情報提供の規定も提案されている」(日弁連)

(g)クローズドデータのガイドブック整備
オープンデータ化を進める前に、何をクローズドにするのかの方針をはっきりとさせ、具体的なものについてガイドブックを作成するなどして公表すべきである。それがあれば、地方自治体なども二次利用の公開を積極的に推進できる。

5.「2-(5)普及・啓発、評価」(p.6)

(a)地方自治体の実態調査
現状を正しく把握するために、地方自治体の取組状況を調査する必要がある。たとえば総務省自治行政局地域情報政策室が行なっている調査(「地方自治情報管理概要」参照)の調査項目にオープンデータに関する項目を入れるたり、実態調査に基づいて民間で地方自治体をランキングしたりすることで、地方自治体の関心を喚起できるという効果も期待できる。2013年度実施の調査から行うべきである。

(b)政府・地方自治体による実践的イベントの開催
2013年の6月1日から2日にかけて、米国ではNational Day of Civic Hackingが行われ、オーストラリアではGovHackが政府主催で実施された。また地方自治体が主催するオープンデータを活用したイベントAppsForXXXなどは、アフリカやラテンアメリカなどを含む世界中で開催され、オープンデータの普及・啓発に大きな効果を上げている。こうした世界のベストプラクティスを参考に、日本でも政府や地方自治体主催で実際にオープンデータを活用して公共サービスを革新するイベントを開催すべきである。
オープンデータの普及・啓発にはシンポジウムのような座学ではなく、実際にアプリケーション開発を実践できるハッカソンなどが有効である。オープンデータを活用したビジネスモデルは、従来のクローズドデータをもとにしたビジネスモデルとは大きく異なり、最先端の国でもまだ手探り状態にある。ハッカソンなどの実践を通じて、試行錯誤の中から新しいモデルを作り出す必要がある。

6.「3-(1)ロードマップ(工程表)の考え方」(p.6)

(a)キャッチアップ戦略だけでは不十分
オープンデータ戦略も「世界最先端IT国家創造」宣言の中の1つの柱として実施する以上、最先端のキャッチアップだけでは不十分である。「平成27 年度末において、他の先進国と同水準のオープンデータの公開と利用を実現する」とあるが、現在最先端をいく米英が2年後にどのような形に進化しているのかが考慮されておらず、これでは2年後に米英との差が縮まっているのか、さらに開いているのかもわからない。また、ラテンアメリカ、アフリカなどの新興国・途上国が急速にオープンデータ戦略、オープンイノベーションを進めている現状から見て、このスピードでは2年後に新興国・途上国にも抜かれている可能性もある。
世界標準やベストプラクティスの採用を主とするキャッチアップ戦略、米英などの戦略分析と将来予測に基づくリープフロッギング戦略、世界トップで居続けるための継続的革新戦略の3つが必要である。

7.「3-(2)ロードマップの進捗状況等のフォロー」(p.7)

(a)目標(KPI)の設定と進捗状況の一般公開
ロードマップの進捗状況等のフォローについて、ロードマップに記載された施策や取組状況や課題等もオープンデータにすれば、内閣府が適宜報告・説明を求めなくても、都度把握できる。「世界最先端IT国家創造」(案)ではKPIを設定しているため、ロードマップにおいても各作業項目について定量的に測定できる目標(KPI)を設定すると共に、担当する省庁を明らかにし、常に最新の進捗状況を公開するべきである。KPIをさらに進めてKGI(重要目標達成指標)まで落とし込み、それをオープンにすることで、民間は政府が具体的に何をしようとして、自分たちはどう協力することで自身の企業活動につなげることができるのか想像できるようになる。その上でアイデアボックスなどを活用することで一般から広く解決策やアイデアを求めるなど、早期解決を目指す取り組みが有効であると考える。また、これら指標を評価するときに、CSF(主要成功要因)を一般からも検証できるようオープンデータ化する仕組みを作ってほしい。

 

Ⅱ「二次利用の促進のための府省のデータ公開に関する基本的考え方(ガイドライン)(案)」に対するコメント

1.「3-(1)目指すべきデータの構造やデータ形式」(p.5)

(a)「Ⅰ『電子行政オープンデータ推進のためのロードマップ(案)』に対するコメント」における「2.『2-(2)機械判読に適したデータ形式での公開の拡大』(p.3)」の「(b)『原始データ』の優先的公開」と同等の内容を指摘する。

(b)CSV形式の標準化
CSV形式には方言が多いため、CSV形式の標準化を望む。
【参考】

http://codezine.jp/article/detail/2364

2.「4 インターネットを通じて公開するデータの拡大についての考え方」(p.6)

(a)「Ⅰ『電子行政オープンデータ推進のためのロードマップ(案)』に対するコメント」における「4.『2-(4)公開データの拡大』(p.5)」の(a)から(e)と同様の内容を指摘する。

(b)オープンバイデフォルトの徹底
分野を絞ったり、ニーズの高いものから公開したりする手法はそれなりの効果が見込めるが、データには意外なものの組合せで新たな価値を産み出す性質があるため、オープンバイデフォルトの考え方で、とにかく出せるものは出してみる、課題は公開しながら(提供側と利用者側がともに)考える、といった進め方も併せて必要ではないか。

 

Ⅲ「数値(表)、文章、地理空間情報のデータ作成に当たっての留意事項(ガイドライン別添)(案)」に対するコメント

1.「1.数値(表形式)データの作成にあたっての留意事項」(pp.1-12)

(a)「Ⅰ『電子行政オープンデータ推進のためのロードマップ(案)』に対するコメント」における「2.『2-(2)機械判読に適したデータ形式での公開の拡大』(p.3)」の「(b)『原始データ』の優先的公開」の指摘とも重なるが、ここに細かく書かれたExcel表の作り方ガイドのような内容は、確かにそうした方がベターな内容ではあるが、それを使うのは主にカジュアルなユーザーである。ヘビーな使い方をするユーザーにとってはCSV形式の原始データの方がコンピュータ処理の起点になるという点においてはるかに重要である。提供側にExcelの作り方を改善することを強いるあまり、データが出にくくなることの方を懸念する。

2.「(3)表形式データにおけるデータ形式の留意事項」(pp.13-15)

(a)@で始まるヘッダ情報が定義されているが、これは現時点でどの程度認知された規格なのか。データ提供側がこのヘッダ情報をつけるにはそのようなことができるアプリケーションが必要になり、利用者側もこのヘッダを解釈できるアプリケーションが必要である。こういった規格を新たに制定するのはデメリットが多すぎる。
このようなヘッダ情報は既に使われている、あるいは使われつつある形式があればできるだけそれを使うことを検討し、難しい場合は単にデータの説明書など、人間可読なものを用意し、それへのポインター(URI等)さえあれば良いのではないか。データを大量に使うのはビジネス用途で使うヘビーユーザーであり、データを大量に扱うためにはクレンジングや名寄せの操作は不可欠であり、どうしても例外処理や手作業は残る。全てを機械可読にすることにこだわる必要は無い。

3.「3.地理空間情報の作成に当たっての留意事項」(pp.31-35)

(a)GML形式はよくできた形式であるが、一般的に普及しているのはKML形式、SHP形式、GPX形式などである。
地理空間情報に関しては、例えば単純な「避難所一覧」のようなものであればCSVが最も汎用的で使いやすい。他の形式への変換も容易である。やや複雑な線や面を表現する場合には地理空間情報独自の表現形式が必要となるが、その際に重要なのはどれかひとつに絞ることではなく、形式間で相互に変換しやすいことである。そのためにはどうしたら良いか、検討を進めるべきではないか。地理空間情報は専門性が高いため、現状ベースでの公開を進める一方で、引き続き何らかの検討や議論が必要なのではないだろうか。
また、住所などの位置情報を持つデータには全て緯度経度をつける考え方には賛成である。しかし、緯度経度の取得方法が明確ではない。例えば特定の地理空間情報提供事業者のサービスで住所から緯度経度を求めた場合、それはオープンデータであるのか、その事業者に何らかの権利を主張されるおそれはないのか、そのサービスが返す緯度経度値が妥当な内容なのかどうか、といった課題が残る。何らかの公的な緯度経度の決定方法、もしくはそういったサービス(いわゆるジオコーディング)が誰でも権利関係を気にせず使えるようにするべきである。

以上

————————————————————————————————————

参考:「電子行政オープンデータ推進のためのロードマップ(案)」及び「二次利用の促進のための府省のデータ公開に関する基本的考え方(ガイドライン)(案)」に関する パブリックコメントの募集について

2 responses to オープンデータのロードマップ(案)及びガイドライン(案)に関するパブリックコメントを提出

  1. 皆さんの競争入札の結果ですか?

Leave a reply

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

次のHTML タグと属性が使えます: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>

Tomihiko Azuma

Written by

Chief Fellow, Institute for International Socio-Economic Studies (株式会社国際社会経済研究所 主幹研究員)