You are browsing the archive for 2013 6月.

「がん」と闘うための世界最大のデータベース公開へ

2013年6月13日 in News

英イングランド公衆衛生サービス(Public Health England, PHE)は2013年6月12日、がんに関するデータを集めた世界最大のデータベースを公開すると発表しました。

イングランドの5千万人の住人のうち、毎年がんと診断される人は35万人にのぼります。今回公開するデータベースはそれらの患者に関する詳細な臨床情報をすべて集めたものです。

国営保健サービス(National Health Service, NHS)が管轄する全医療機関から以下のデータがほぼリアルタイムに収集され、データベースを通じて公開されます。

  • 組織病理学のレポート
  • 総合医療チームによる意思決定会議の情報
  • 放射線治療および化学療法のデータ
  • 管理上の詳細データ(入院ルートなど)
  • がんの進行段階の正確な判定を可能にする画像情報

さらにデータベースには、過去30年間1,100万人のがんに関する記録も含まれます。

がんの専門家は、さまざまな治療法に対して腫瘍がどのように反応したかなど、詳細なデータにすぐアクセスできるようになり、将来はそれぞれの人ごとに最適なパーソナライズされたがん治療の提供が可能になります。

さらに究極的には、がんのサブタイプ(亜種)ごとに治療に対してどう反応するのか追跡することが可能となり、比較的少数のがん患者群を対象に最も効果的に働くよう開発された新世代の薬によって、突然変異を狙い撃ちにすることもできるようになると期待されています。

出典: World’s largest cancer database launched by PHE

抗生物質耐性がG8サイエンスミーティングのトップアジェンダに、オープンデータで新薬開発を加速

2013年6月12日 in News

イギリスで開催されるG8のサイエンス・ミーティングでは、抗生物質に対する耐性問題がトップアジェンダとなる見込みです。イギリスのデビッド・ウィレッツ大学・科学担当大臣は、新しい抗生物質の開発と効果的な使用方法を見出すために、G8各国がどのような協力ができるのかを話し合いたい意向です。

公衆衛生における最も深刻な問題の1つは、ほとんどの抗生物質が効かない”Superbugs”と呼ばれる抗生物質耐性菌です。専門家は”Superbugs”によって日常的な感染でさえ治療不可能になる日が急速に迫っていると警告しています。実際に世界では毎年、多剤耐性結核が約44万件発生し、約15万人が死亡しています。

2011年にイギリスでは6件の多剤耐性結核が発生し、1995年以来最悪の状態となりました。一方で、過剰な抗生物質投与が薬剤耐性を増やす原因にもなっており、欧州疾病予防管理センター(European Centre for Disease Prevention and Control)は、病院で処方される抗生物質の約半分は必要ないと試算しています。

ウィレッツ大臣は、公衆衛生のような世界規模の問題を解決したり、研究成果を社会的・経済的に最大限活用するためには各国が協調して取り組む必要があり、今回のG8では抗生物質に対する耐性問題を是非議論したいと述べています。さらにウィレッツ大臣は、オープンデータと研究成果に対するオープンアクセスも国際的な重要課題であり、政府の透明性の根幹をなすだけでなく、新薬などの科学的な新発見を加速させ、経済成長をもたらすものであるとも指摘しています。

EUでは2008年1月から2012年6月にかけて、多数の医療機関が保有するデータを集めて解析し、抗生物質耐性と闘う方法をEU加盟国の14の医療機関が協働で発見するDebugITプロジェクトを実施し、大きな成果を上げました。イギリスの医療機関もDebugITに参加しました。ウィレッツ大臣はDebugITのG8版、あるいはワールドワイド版も視野に入れているかもしれません。

さらにイギリスでは先日、Guardianがオープンデータをもとに一般開業医が処方した抗生物質の量を計算し、地図にマッピングして公開しました。イギリスでは不要な抗生物質の投与を減らすために、こうしたオープンデータに基づく情報を活用できる状態に既にあります。

G8加盟国はカナダ、フランス、ドイツ、イタリア、ロシア、イギリス、アメリカ、日本です。日本とロシア以外は、いずれもオープンデータ先進国です。さらに、グラクソ・スミスクラインやロシュなど民間企業の治験データの公開も、新薬開発をスピードアップします。日本が国際的な活動から取り残されないために、官も民も一刻も早いオープンデータ化が望まれます

 

参考:

ハッカソンのためのガイド&ツール

2013年6月12日 in Special

ハッカソンを成功させるためのガイドやツールも増えてきました。代表的なものをチリのジャーナリストMiguel Pazがまとめていましたので、紹介します。

出典: How to Organize a Successful Hackathon

CITOプレイベントを開催しました

2013年6月10日 in Events, Special

スマートフォンでキャッシュを探す様子

スマートフォンでキャッシュを探す参加者

 ジオキャッシングをご存知でしょうか。2000年に米国でそれまで民生用のGPS電波に行われていた精度低下の加工が解除された際、それを祝ってGPS受信機を使った宝探しパーティが開催されたのがきっかけで始まった、だれでも参加できる世界規模の宝探しゲームです。
 全体的には海外での参加者が多いのですが、このところ国内でも会員サイトの日本語化が進み、手軽なGPS受信機としても使えるスマートフォンの普及ともあいまって参加者が増えています。

 キャッシュとはお宝を指しますが、実際には高価なものではなく、バッジなどの小物が防水性の容器に入れられています。キャッシュは誰でも探せるのはもちろん、誰でも隠すことができるというセルフサービスで運営が行われています。キャッシュの設置場所はその地域の名所案内を兼ねていることが多く、その案内文は英語と日本語の両方で書く決まりなので、外国からの訪問者も数多くキャッシュ探しに訪れます。

 このジオキャッシングの楽しみ方にはバリエーションがあり、そのひとつがCITO(Cash in Trash out) という、宝探しを楽しみながらゴミ拾いもやってしまおうというものです。日本では式根島で毎年開催されています。(関連記事

キャッシュの位置を表す地図

キャッシュの位置を表す地図


 今回開催されたのは、自治体がCITOを開催するとしたらどのような課題があるのかを探るためのプレイベントです。自治体関係者、地元でボーイスカウトをお手伝いされている方、ジオキャッシングの経験者、民間企業に勤める方など7名に参加頂き、2時間半ほど千葉市の中心部を歩いて都合9個のキャッシュを見つけました。その後、室内に移動し、開催に関わる課題を話し合いました。その結果下記のような意見がいくつか出されましたが、みんなで議論するうちにいずれも解決のメドを立てることができました。

Q)コンピュータに不慣れな人に対する考え方は?
A)広い層を対象とするなら、スマートフォンやGPSが使えない方は紙地図でも楽しめる。子どもを中心に考えると、親御さんはスマートフォン所有層が多いので、スマートフォン利用を前提としても良いかも。

Q)キャッシュを発見するにはある程度サポートが必要な気がするが、少人数のチームが複数できた場合にそういった体制が取れるか。
A)運営側で全てやると考えるのではなく、構想段階から想定する参加者(例えば子ども)を巻き込んだ進め方が良いのでは。子ども自身に企画段階から事前準備に参加してもらってはどうか。

 町内の清掃日もゲームに仕立てることで、楽しみながら参加することができます。子どもが参加したいと言えば親御さんもついてくるでしょう。地域への関心が薄い方でもゴミの捨てられ方を自分の眼で見ると、何らかの意見が出てくるかもしれません。自分の町を知るきっかけにもなります。つまり、行政との対話の受け皿としての様々なステークホルダーによるコミュニティ作りや市民参画のきっかけとなる可能性を秘めているのです。

 あなたの町でも試してみませんか。

新EUデータ保護法、だれが強化し、だれが緩和したのか、LobbyPlagですぐにわかります

2013年6月10日 in News

EUでは欧州議会において新しいデータ保護法が審議されています。このEU法は加盟国へ直接適用され、EU域内でのデータ保護のルールを一元化するための新しい法律です。新しいEU法がどのように制定されるのかはEU各国にとって非常に大きな影響があるため、欧州議会では膨大な数の修正条項が提出されています。

誰がどんな修正条項を出したのか、それはデータ保護法を強化する方向なのか、緩和する方向なのかについて、誰でも簡単に調べることができるようLobbyPlagは開発されました。LobbyPlagは、フェイスブックがどんな個人情報を集めているのかを調べ上げたことで有名なeurope-v-facebookと、データジャーナリズムを推進するOpen Data Cityとが共同で開発したツールです。実に3,100にも上る修正条項を分析し、国ごと、政党ごと、さらに個人ごとに、強化派(緑)か緩和派(赤)かをビジュアライズしています。

例えば、国ごとのマップを見れば、イギリスやイタリアが緩和派、フランスやドイツが強化派であることがわかります。強化派、緩和派の個人別トップ10ランキングも表示されており、気になる議員を名前で検索することもできます。ここまで透明性を高めれば、議員もきちんと筋の通った行動をとらざるを得なくなるでしょう。

出典: LobbyPlag benchmarks MEPs’ support for data privacy

 

NYの支出をチェックするCheckbook NYC、ついにオープンソース化。民間企業が100万ドル相当の支援提供

2013年6月10日 in News

ニューヨーク市の会計監査役John C. Liu氏はPersonal Democracy Forum 2013において、ニューヨーク市の日々の支払いデータを公開しているサイト”Checkbook NYC“をオープンソース化し、githubに公開したと発表しました。

Liu氏はOracleCGIに対して、両企業が市当局の財務管理情報システムとCheckbook NYCとをつなぎ、データを自動的に供給するアダプター開発に協力してくれたことに感謝の意を表しました。このアダプターによって、OracleやCGIを利用している他の自治体はCheckbook NYCを格段に導入しやすくなります。さらにLiu氏は、Checkbook NYCのオープンソース化や、アダプター開発のための技術支援や開発環境整備に尽力してくれたとして、REI Systemsに対しても謝意を表しました。

Oracle, CGI, REI Systemsがニューヨーク市に対して提供した支援は、合計で100万ドル相当に上ると試算されています。こうした新しいオープンな協働の取組に対して、 Personal Democracy Forumの創設者Andrew Rasiej氏は、ニューヨークはまさに20世紀の”E-Government”から21世紀の”We-Government”へ進歩しようとしていることの表れだと述べています。

Checkbook NYCのオープンソース化については、U.S. Public Interest Research GroupSunlight FoundationCode for Americaなども支持を表明しており、今後の広がりが期待されています。

出典:Liu Open-Sources Checkbook NYC

オープンデータのロードマップ(案)及びガイドライン(案)に関するパブリックコメントを提出

2013年6月7日 in Featured, Special

Open Knowledge Foundation Japanは本日、「電子行政オープンデータ推進のためのロードマップ(案)」及び「二次利用の促進のための府省のデータ公開に関する基本的考え方(ガイドライン)(案)」に関するパブリックコメントを内閣官房IT担当室に提出しました。以下に提出したパブリックコメントの全文を掲載します。

————————————————————————————————————

オープンデータのロードマップ(案)及びガイドライン(案)に関する意見

Ⅰ「電子行政オープンデータ推進のためのロードマップ(案)」に対するコメント

1.「2-(1)二次利用を促進する利用ルールの整備」(p.2)

(a)ユーザーコミュニティとの対話に基づくルールづくり
基本的なルール作りのあり方について漸進的に取組みを進めるため、また公開した後の利用を後押しするために、ユーザー参加型、ユーザーコミュニティとの対話に基づく共同規制的アプローチで進めていくことをルール形成の基本的な方針とするべきである。KPIとして「ユーザーコミュニティとのミーティングをいつまでに何回開催するかを加えるなども検討する必要がある。

(b)世界標準ライセンスの採用
データの利用価値はデータを組み合わせることによってさらに高まることは周知の事実である。そのためには、組み合わせるデータのライセンスはできる限り同じものが望ましい。データ公開にあたって、日本固有のライセンスを設計し適用することは、データを組み合わせる可能性を狭めることになり、日本の国民や企業にとって不利益となる。日本独自ライセンスではなく、パブリックドメインやCC BYなど、世界で広く使われているライセンスの採用を最優先に検討すべきである。オープンデータ先進国をできるだけ早くキャッチアップするためにも、独自ライセンスの設計に時間をかけるべきではない。

2.「2-(2)機械判読に適したデータ形式での公開の拡大」(p.3)

(a)防災分野での機械可読データの早期提供
防災は国民にとってまさに命にかかわる最重要課題の1つであり、他の重点分野よりも優先して早急に取り組むべきである。道路、橋、港/空港、建物等の社会インフラの状況に関するデータを集約し機械可読な形式にすることで、行政組織が地域を越えて防災や災害対応に使うことができる体制を早期に整備するとともに、緊急時にはそれらのデータを一般にも公開する。本件については、ただちに防災関係の会議のアジェンダに追加し、早期実施を図る。

(b)「原始データ」の優先的公開
いちばん細かい「原始データ」さえあれば、それを集計したデータ(統計値に多い)はいかようにでも作成可能である。まずは各データの原始データとはどういったものなのかを整理し、それを出すことを優先すべきである。
【参考】
http://okfn.jp/2013/05/24/rawdata/
個人情報やプライバシーなど、配慮の必要な事項を踏まえた上で公開する項目を具体的に決めていかないと原始データの公開は広がらないのではないか。
オープンデータの利用者には、公開された状態で(例えばExcel形式で)使いたい、いわばカジュアルなユーザーと、原始データを入手して、加工やクレンジングは自分でやりたいヘビーユーザーが想定される。前者は個人や小さな団体が何らかの用途でデータを少量使う場合が多いであろう。後者はデータに付加価値を付けて二次的に提供したり、専門的な分析を行うビジネス用途が中心であろう。
カジュアルなユーザーはExcelなどで見やすく加工されたり、集計されたものが使いやすいかもしれないが、ビジネス用途には原始データが不可欠である。
よって、今ある統計データの出し方を整理するにあたっては、まずその原始データを定義し、公開することを最優先とすべきである。その際、一見不要に見えるものであっても、公開できる項目についてはできるだけカットせずに公開内容に含めるべきである。加工済みのものを正規化して公開するような作業は優先順位としては低く、データ提供側の負担が増えてデータが出にくくなることが懸念される。

(c)機械判読よりも公開を優先
注記事項に記載されている「国民への情報公開の観点から、人が読むという従来からの利用形態に適したデータ形式での公開も継続する。」ことを必ず遵守させるよう徹底すべきである。データを機械判読可能な形式に整えるには時間もコストもかかる。データを機械判読可能にしなければ公開してはならないという誤解をデータ保有者に与えてしまうと、データ公開そのものが阻害される恐れがある。
同じ理由により、現在公開されているデータや、すぐに公開できるデータに関しては、形式を問わず、適切なライセンスのもとで公開することを最優先すべきである。機械判読可能にする作業は公開後行い、機械判読可能なデータがそろった段階で順次追加していけばよい。

(d)民間による機械判読可能化
機械判読可能なデータへの変換は各省庁で主体的にやるだけでなく、データを必要とする民間に任せる方策も考えるべきである。データは鮮度も価値である。機械判読可能にするために時間がかかるようならば、その価値を失うことになる。ビジネス上データを必要とする企業が機械判読可能化を担うことについて大きな支障はないと考えられる。一方、政府や地方自治体は、利用されるかどうか分からないデータに必要以上にコストをかけなくても済む。政府は機械判読可能に変換したデータを公開するためのデータカタログを整備し、機械判読可能化に協力してくれた企業名を公開するなどの方法で、企業に協力を促すことも可能である。

3.「2-(3)データカタログ(ポータルサイト)の整備 」(p.4)

(a)すでに機械判読可能な形で公開しているデータの省庁横断的なカタログ整備
復興DB、気象庁防災情報XML、財務省予算書決算書、国会図書館、基盤地図情報、財務省貿易統計、農林水産関係試験研究機関総合目録等、すでに機械判読可能な形で公開しているデータが多数存在している。これらのデータはそもそも再利用を前提に作られていると考えられる。しかし、こうしたデータは各省庁がバラバラに公開しており、一般の人にはどこに存在しているのかを知る手段がない。価値あるデータの再利用を促すためにも、こうしたデータに関する省庁横断的なカタログを整備し、再利用可能なライセンスのもとで、直ちに公開するべきである。

4.「2-(4)公開データの拡大」(p.5)

(a)各省「白書」の早期公開
各省が作成するすべての「白書」は、情報通信白書と同じく直ちにCC BYライセンスのもと、機械可読形式で公開するべきである。公開にあたっては、全白書をポータルサイトを通じて公開し、一括検索など横断的な操作が容易にできるようにする。

(b)市町村レベルなど、より「原始データ」に近い統計データの公開
公開されているデータがより細かい「原始データ」であればあるほど、データのビジネス活用の可能性が高まるのは先に指摘した通りである。また、国民の生活に密接に関係している課題については、集約したデータでは役に立たない場合が多い。
そこで、都道府県レベルに集約して提供している統計データについて、個人情報やプライバシーの問題を考慮しなくて済む範囲で、且つ、できるだけ「原始データ」に近い形でもデータも提供すべきである。例えば、各種統計データを市町村レベルまで公開することによって、エリアマーケティング等には非常に有用なデータとなる。また、待機児童数などを保育所ごと、さらには各保育所内の年齢ごとに公開することによって、保育所を探している人には非常に大きな助けとなる。こうした例はここでは指摘できないほど多数存在している。

(c)非商用目的限定で既に公開しているデータの商用利用化
省庁や自治体のサイトには、非商用目的限定で公開されているデータが多数存在している。こうしたデータは各省庁や自治体などが市民にとって重要であり公開すべきとの判断に基づいて公開していることから、改めて重要であるか否かの議論を行う必要なない。これら非商用目的限定で既公開のデータに関しては、オープンデータ戦略の基本原則に基づいて、商用・非商用を問わず利用できるようにライセンスを直ちに変更すべきである。ライセンスについては、パブリックドメインあるいはCC BYが適当であると考える。

(d)経済界のニーズ調査に基づく優先的なデータ公開
これまでに経団連をはじめとする経済界からのオープンデータに関するニーズ調査がすでに複数回実施されてきた。こうしたビジネスニーズが明らかなデータに関しては、新たに議論を重ねることなく、直ちに公開すべきである。経済界からのオープンデータに対する期待を損なわないためにも、早急な対応が必要である。

(e)国民の関心度に基づいた公開優先度の決定
政府統計の総合窓口e-Statでは、主要統計についての月間アクセスランキングを公開している。このランキングを見れば、国民がどの統計データに対して関心を持っているのかを知ることができる。ロードマップで公開を優先するとしている重点分野(白書、防災・減災情報、地理空間情報、人の移動に関する情報、予算・決算・調達情報)には含まれていないデータがランキングでは上位を占めているケースが多々見受けられる。国民の関心の高いデータから優先的に公開することで、オープンデータに対する国民の関心や理解もさらに深まることは間違いないため、こうしたe-Statの月間アクセスランキングなど、国民の関心度を反映した公開優先基準も取り入れるべきである。

(f)情報公開法改正
情報公開法の改正については、民主党政権時に議論を重ね法案が提出されたものの、審議されず廃案となっている。情報公開法を改正し、より国民に分かりやすく利用しやすいものに改正すべきである。
参考:「改正法案は、現在の情報公開法の解釈運用上の問題や非開示処分取消請求訴訟手続上の問題を踏まえ、これらを改善すべく、不十分ながらも、知る権利の保障の明文化、不開示情報の範囲の限定、裁判所が行政機関に対し行政情報の提出を命じて裁判所のみが見分できる手続(インカメラ審理)の導入などを盛り込んだ内容となっている。さらに、『国民に分かりやすい形で、かつ、国民が利用しやすい方法により提供するものとする』旨の積極的な情報提供の規定も提案されている」(日弁連)

(g)クローズドデータのガイドブック整備
オープンデータ化を進める前に、何をクローズドにするのかの方針をはっきりとさせ、具体的なものについてガイドブックを作成するなどして公表すべきである。それがあれば、地方自治体なども二次利用の公開を積極的に推進できる。

5.「2-(5)普及・啓発、評価」(p.6)

(a)地方自治体の実態調査
現状を正しく把握するために、地方自治体の取組状況を調査する必要がある。たとえば総務省自治行政局地域情報政策室が行なっている調査(「地方自治情報管理概要」参照)の調査項目にオープンデータに関する項目を入れるたり、実態調査に基づいて民間で地方自治体をランキングしたりすることで、地方自治体の関心を喚起できるという効果も期待できる。2013年度実施の調査から行うべきである。

(b)政府・地方自治体による実践的イベントの開催
2013年の6月1日から2日にかけて、米国ではNational Day of Civic Hackingが行われ、オーストラリアではGovHackが政府主催で実施された。また地方自治体が主催するオープンデータを活用したイベントAppsForXXXなどは、アフリカやラテンアメリカなどを含む世界中で開催され、オープンデータの普及・啓発に大きな効果を上げている。こうした世界のベストプラクティスを参考に、日本でも政府や地方自治体主催で実際にオープンデータを活用して公共サービスを革新するイベントを開催すべきである。
オープンデータの普及・啓発にはシンポジウムのような座学ではなく、実際にアプリケーション開発を実践できるハッカソンなどが有効である。オープンデータを活用したビジネスモデルは、従来のクローズドデータをもとにしたビジネスモデルとは大きく異なり、最先端の国でもまだ手探り状態にある。ハッカソンなどの実践を通じて、試行錯誤の中から新しいモデルを作り出す必要がある。

6.「3-(1)ロードマップ(工程表)の考え方」(p.6)

(a)キャッチアップ戦略だけでは不十分
オープンデータ戦略も「世界最先端IT国家創造」宣言の中の1つの柱として実施する以上、最先端のキャッチアップだけでは不十分である。「平成27 年度末において、他の先進国と同水準のオープンデータの公開と利用を実現する」とあるが、現在最先端をいく米英が2年後にどのような形に進化しているのかが考慮されておらず、これでは2年後に米英との差が縮まっているのか、さらに開いているのかもわからない。また、ラテンアメリカ、アフリカなどの新興国・途上国が急速にオープンデータ戦略、オープンイノベーションを進めている現状から見て、このスピードでは2年後に新興国・途上国にも抜かれている可能性もある。
世界標準やベストプラクティスの採用を主とするキャッチアップ戦略、米英などの戦略分析と将来予測に基づくリープフロッギング戦略、世界トップで居続けるための継続的革新戦略の3つが必要である。

7.「3-(2)ロードマップの進捗状況等のフォロー」(p.7)

(a)目標(KPI)の設定と進捗状況の一般公開
ロードマップの進捗状況等のフォローについて、ロードマップに記載された施策や取組状況や課題等もオープンデータにすれば、内閣府が適宜報告・説明を求めなくても、都度把握できる。「世界最先端IT国家創造」(案)ではKPIを設定しているため、ロードマップにおいても各作業項目について定量的に測定できる目標(KPI)を設定すると共に、担当する省庁を明らかにし、常に最新の進捗状況を公開するべきである。KPIをさらに進めてKGI(重要目標達成指標)まで落とし込み、それをオープンにすることで、民間は政府が具体的に何をしようとして、自分たちはどう協力することで自身の企業活動につなげることができるのか想像できるようになる。その上でアイデアボックスなどを活用することで一般から広く解決策やアイデアを求めるなど、早期解決を目指す取り組みが有効であると考える。また、これら指標を評価するときに、CSF(主要成功要因)を一般からも検証できるようオープンデータ化する仕組みを作ってほしい。

 

Ⅱ「二次利用の促進のための府省のデータ公開に関する基本的考え方(ガイドライン)(案)」に対するコメント

1.「3-(1)目指すべきデータの構造やデータ形式」(p.5)

(a)「Ⅰ『電子行政オープンデータ推進のためのロードマップ(案)』に対するコメント」における「2.『2-(2)機械判読に適したデータ形式での公開の拡大』(p.3)」の「(b)『原始データ』の優先的公開」と同等の内容を指摘する。

(b)CSV形式の標準化
CSV形式には方言が多いため、CSV形式の標準化を望む。
【参考】
http://codezine.jp/article/detail/2364

2.「4 インターネットを通じて公開するデータの拡大についての考え方」(p.6)

(a)「Ⅰ『電子行政オープンデータ推進のためのロードマップ(案)』に対するコメント」における「4.『2-(4)公開データの拡大』(p.5)」の(a)から(e)と同様の内容を指摘する。

(b)オープンバイデフォルトの徹底
分野を絞ったり、ニーズの高いものから公開したりする手法はそれなりの効果が見込めるが、データには意外なものの組合せで新たな価値を産み出す性質があるため、オープンバイデフォルトの考え方で、とにかく出せるものは出してみる、課題は公開しながら(提供側と利用者側がともに)考える、といった進め方も併せて必要ではないか。

 

Ⅲ「数値(表)、文章、地理空間情報のデータ作成に当たっての留意事項(ガイドライン別添)(案)」に対するコメント

1.「1.数値(表形式)データの作成にあたっての留意事項」(pp.1-12)

(a)「Ⅰ『電子行政オープンデータ推進のためのロードマップ(案)』に対するコメント」における「2.『2-(2)機械判読に適したデータ形式での公開の拡大』(p.3)」の「(b)『原始データ』の優先的公開」の指摘とも重なるが、ここに細かく書かれたExcel表の作り方ガイドのような内容は、確かにそうした方がベターな内容ではあるが、それを使うのは主にカジュアルなユーザーである。ヘビーな使い方をするユーザーにとってはCSV形式の原始データの方がコンピュータ処理の起点になるという点においてはるかに重要である。提供側にExcelの作り方を改善することを強いるあまり、データが出にくくなることの方を懸念する。

2.「(3)表形式データにおけるデータ形式の留意事項」(pp.13-15)

(a)@で始まるヘッダ情報が定義されているが、これは現時点でどの程度認知された規格なのか。データ提供側がこのヘッダ情報をつけるにはそのようなことができるアプリケーションが必要になり、利用者側もこのヘッダを解釈できるアプリケーションが必要である。こういった規格を新たに制定するのはデメリットが多すぎる。
このようなヘッダ情報は既に使われている、あるいは使われつつある形式があればできるだけそれを使うことを検討し、難しい場合は単にデータの説明書など、人間可読なものを用意し、それへのポインター(URI等)さえあれば良いのではないか。データを大量に使うのはビジネス用途で使うヘビーユーザーであり、データを大量に扱うためにはクレンジングや名寄せの操作は不可欠であり、どうしても例外処理や手作業は残る。全てを機械可読にすることにこだわる必要は無い。

3.「3.地理空間情報の作成に当たっての留意事項」(pp.31-35)

(a)GML形式はよくできた形式であるが、一般的に普及しているのはKML形式、SHP形式、GPX形式などである。
地理空間情報に関しては、例えば単純な「避難所一覧」のようなものであればCSVが最も汎用的で使いやすい。他の形式への変換も容易である。やや複雑な線や面を表現する場合には地理空間情報独自の表現形式が必要となるが、その際に重要なのはどれかひとつに絞ることではなく、形式間で相互に変換しやすいことである。そのためにはどうしたら良いか、検討を進めるべきではないか。地理空間情報は専門性が高いため、現状ベースでの公開を進める一方で、引き続き何らかの検討や議論が必要なのではないだろうか。
また、住所などの位置情報を持つデータには全て緯度経度をつける考え方には賛成である。しかし、緯度経度の取得方法が明確ではない。例えば特定の地理空間情報提供事業者のサービスで住所から緯度経度を求めた場合、それはオープンデータであるのか、その事業者に何らかの権利を主張されるおそれはないのか、そのサービスが返す緯度経度値が妥当な内容なのかどうか、といった課題が残る。何らかの公的な緯度経度の決定方法、もしくはそういったサービス(いわゆるジオコーディング)が誰でも権利関係を気にせず使えるようにするべきである。

以上

————————————————————————————————————

参考:「電子行政オープンデータ推進のためのロードマップ(案)」及び「二次利用の促進のための府省のデータ公開に関する基本的考え方(ガイドライン)(案)」に関する パブリックコメントの募集について

最も影響力のある米政府CIOトップ25

2013年6月6日 in Special

InformationWeekは、米連邦・地方政府のCIOの中から、政府革新に関する「ビジョン、他への影響力、業績」で判定した最も影響力のある25名のCIOを発表しました。

オープンデータでおなじみのTodd Parkや、NASA、NOAAはもちろん入っています。特徴的なのは、国防や国家安全保障、治安などに関する組織が圧倒的に多いことです。実に11の組織が入っています。

  • Air Force, U.S. Navy, U.S. Army, Department of Defense
  • National Security Agency, Defense Intelligence Agency, Homeland Security, U.S. Intelligence Community, CIA
  • FBI
  • Bureau of Alcohol, Tobacco, Firearms and Explosives

地方政府としては、シカゴ市、ボストン市、テキサス州が選ばれています。日本でも日々、政治・行政革新に奮闘しているCIOがたくさんいますが、縁の下の力持ちで、なかなか日が当たりません。こういう形で多くの方に知ってもらうのはとても良いことだと思います。

以下のリストはアルファベット順に並べたものであり、ランキングではありませんので注意してください。

  1. Lonny Anderson, CIO, National Security Agency
  2. Frank Baitman, CIO, Health and Human Services
  3. Lt. Gen. Michael Basla, CIO, Air Force
  4. Robert Brese, CIO, Department of Energy
  5. Adrian Gardner, CIO, NASA Goddard
  6. Brett Goldstein, CIO, City of Chicago
  7. Terry Halvorsen, CIO, U.S. Navy
  8. Karen Robinson, CIO, State of Texas
  9. Grant Schneider, CIO, Defense Intelligence Agency
  10. Malcolm Jackson, CIO, Environmental Protection Agency
  11. Joe Klimavicz, CIO, National Oceanic and Atmospheric Administration
  12. Lt. Gen. Susan Lawrence, CIO, U.S. Army
  13. Sasi Pillay, CTO for IT, NASA
  14. Luke McCormack, CIO, Department of Justice
  15. Rahul Merchant, CIO and Chief Innovation Officer, New York
  16. Terry Milholland, CTO, Internal Revenue Service
  17. Bill Oates, CIO, City of Boston
  18. Todd Park, Federal CTO, Office of Science and Technology Policy, White House
  19. Jerome Pender, CIO, FBI
  20. Margie Graves, Deputy CIO, Homeland Security
  21. Richard Holgate, CIO, Bureau of Alcohol, Tobacco, Firearms and Explosives
  22. Al Tarasiuk, CIO, U.S. Intelligence Community
  23. Teri Takai, CIO, Department of Defense
  24. Jeanne Tisinger, CIO, CIA
  25. Steven VanRoekel, federal CIO, Office of Management and Budget

 

出典: 25 Most Influential Government CIOs

イギリス国際開発省、国際援助資金追跡ツールを開発

2013年6月6日 in News

イギリス国際開発省(Department for International Development, DFID)は、国際援助資金の使い道を追跡できるツール”Development Tracker“を開発しました(現在はパブリックβ)。Development Trackerは約7000にも上る個々の国際支援活動を、約3000のプロジェクトにグループ分けし、各プロジェクトについての総予算、予算執行実績、援助を受け取った人や団体、プロジェクトの開始経緯がわかる計画書、進行状況を示すレビュー記録などを見ることができます。

Development Trackerによって、NGOは自分たちの活動地域で他にどのような支援活動が行われているのかを容易に知ることができ、活動の重複を避け、未支援地域へ重点的に支援することができるようになります。さらに貧困統計など他のデータと重ね合わせることによって、より精密な支援計画を立てることが可能となります。

DFIDは以前から、国際援助に関する透明性を確保する枠組みである国際援助透明性イニシアティブ(International Aid Transparency Initiative, IATI)の標準に従ってデータを公開してきましたが、こうしたデータを一般の人々が理解するのは容易ではないことからDevelopment Trackerの開発に踏み切りました。

DFIDの開発者によれば、Development Trackerの最大の特徴は、どのプロジェクトにいくら使われたというだけではなく、実際に誰がいくら援助資金を受け取ったかについても調べることができる点です。例えば、”Global Poverty Action Fund”というプロジェクトでは、Partnersというタブを開くことによって、Tearfundという組織に110万ポンドあまりが渡っていることがわかります。

現在、DFIDは信頼できるデータ源からデータを入手し、それをDFIDがIATI標準に変換して公開していますが、次の段階としてデータ提供者にIATI標準の採用を働きかけ、さらにデータ源のネットワークを拡げていく計画です。

出典: DFID’s Development Tracker, mapping the UK’s aid spending, launches in beta

6/6 オープンデータ・トークシリーズ(2)「オープンデータをめぐる最新動向の共有、意見交換」

2013年6月3日 in Events

(登壇者などは随時更新・お知らせします!)

日時: 6月6日(木) 19:30-21:30

会場: 国際大学GLOCOMホール
主催: Open Knowledge Foundation Japan、国際大学GLOCOM社会イノベーションラボ

概要:
オープンデータ活用の動きが加速しています。政府はオープンデータの推進などを柱とする新たなIT戦略「『世界最先端IT国家創造』宣言(案)」や「電子行政オープンデータ推進のためのロードマップ(案)」「二次利用の促進のための府省のデータ公開に関する基本的考え方(ガイドライン)(案)」を公開し、パブリックコメントを開始しました。また、国内では「税金はどこへ行った?」プロジェクトがついに10地域に広がりました。さらに海外では4月下旬に英国でW3CとOpen Data Institute(英国政府)およびOpen Knowledge Foundation共催による「Open Data on the Web」という重要なイベントが開催されました。今月のオープンデータ・トークは、こうしたオープンデータに関する国内外の最新動向について理解を深め、じっくり意見交換をする機会としたいと思います。ぜひこの機会にご参加ください。

◯トークセッション
深見嘉明さん Linked Open Data Initiative 理事
川島宏一さん (株)公共イノベーション代表 / OKFJ共同設立者

◯パブコメを考えるワークショップ
パブコメをみんなで考えてみるワールドカフェ形式のワークショップを行います

ファシリテーター:矢吹博和さん
(NPO法人 アイデア創発コミュニティ推進機構 代表理事 株式会社ラーニングプロセス 代表取締役)

◯参考資料
1.『世界最先端IT国家創造』宣言(案)に関するパブリックコメントの募集について
http://www.kantei.go.jp/jp/singi/it2/info/h250524-public.html

2.「電子行政オープンデータ推進のためのロードマップ(案)」及び「二次利用の促進のための府省のデータ公開に関する基本的考え方(ガイドライン)(案)」に関する パブリックコメントの募集について
http://www.kantei.go.jp/jp/singi/it2/info/h250524.html

3.「税金はどこへ行った?」はどこへ行く? 各地に広がるオープンデータ活用(日経新聞オープンデータ情報ポータル)
http://opendata.nikkei.co.jp/article/201305102055137147/

4.Berners Lee and Shadbolt join open data champions at ODI event (Open Data Institute)
http://www.theodi.org/news/berners-lee-and-shadbolt-join-open-data-champions-odi-event

申し込みはこちらから
http://peatix.com/event/14524/