なぜオープンデータにとってオープンの定義が重要なのか:品質、互換性そして単純性
オープンの定義は、あなたが「オープンデータ」と言い、私が、「オープンデータ」と言う時に、双方が同じものを意味することを保証し「標準」として不可欠な働きをします。次にこの標準化は「オープンネス」の主要な実益のうちのひとつを実現するのに不可欠な品質、互換性および単純性を保証します:すなわち、異なるデータセットを組み合わせてイノベーション、洞察及び変化を推進できる、大幅に増強された能力です。
近年、G8を含む多数の政府からオープンデータのリリースが爆発的に発生しています。マッキンゼーによる最近の評価では、オープンデータの潜在的利益を1000億ドル以上と仮定しています。それ以外にも、利益は全世界のGDPの1%以上という評価もあります。
しかしながら、これらの便益は品質の低下と、「オープン-ウォッシング」(オープンとみなされているが実際は非オープン)の両方の面から、エコシステムの分断と同様に重大な危機にあります。というのも、独自の微妙に異なる利用条件のオープンなライセンスが個々に増殖すると非互換性に結びつくのです。
オープンの定義は、こういったリスクを排除する支援をし、また私たちがオープンであることの便益を完全に達成することを保証します。それは、品質を保証し、非互換性を防ぐオープンコンテンツやオープンデータ用の「黄金律」として働きます。
この投稿では、なぜオープンの定義が重要か、そしてオープンデータやオープンコンテンツにおいて「オープン」が意味するもののために提供される明確な標準を持っていることがなぜ重要なのか、より詳細に見ていきます。
3つの理由
オープンの定義がオープンデータにとって重要な理由は主に3つあります:
品質:オープンデータは、そのデータに誰でもアクセスし、改変し、かつ共有するための自由を意味するべきです。しかしながら、それが意味するものを詳述する十分に定義された標準なしでは、私たちはすぐに希薄化された「オープン」を目にすることになるでしょう。多くの人々が、実際のところ、本質的な自由を提供せずに、そのデータが「オープン」だと主張しているように。この意味で、オープンな定義とは「品質管理」に関するものなのです。
互換性:合意された定義が無いと、あなたの言う「オープン」と私の言う「オープン」が同じかどうかを知ることができなくなります。これは、利用条件が実際のところ互換性がないかもしれない(少なくとも、単に私がそれを知ろうとすると弁護士に意見を求め始めなければならないでしょう)ので、あなたのオープンデータと私のオープンデータをともにつなぎ合わせても問題ないかどうか、私たちが知ることができない、ということを意味します。オープンの定義は、互換性と、それゆえオープンデータがもたらす重要な便益のうちのひとつである、様々なオープンなデータセットを混合し組み合わせる、自由な能力を保証する手助けをします。
単純性:オープンデータの大前提は利用の単純性および容易さです。これは単にデータの代価をそれ自体払う必要がないという意味だけでなく、ライセンスや契約を読む弁護士を雇う必要はないということであり、あなたができること、できないこと、そして例えばあなたのビジネスや研究にとって、その意味するところについて考える必要はない、ということです。明確で合意された定義は、どのようにオープンデータを利用し共有することができるかということに対する複雑な制限についてあなたが心配する必要はないことを保証します。
これらを少し詳細に肉付けしましょう:
品質管理(「オープン-ウォッシング」やオープンの「希薄化」を回避するために)
オープンデータの重要な約束事は自由にアクセスしたり利用できるということです。その意味するところの明確な定義が無いと(例えば、誰が利用するかとか、どんな目的のためにとか)特にオープンデータはデータ利用者にとって魅力的なので、希薄化するリスクがあります。例えばあなたは、人々がいわゆる「オープンデータ」を提示しているのをたちどころに見つけるかもしれません。しかし、非営利組織だけしかデータに自由にアクセスすることができないものであったりします。
したがって、適切な品質管理が無ければ、私たちは用語と概念としてのオープンデータの価値を下げたり、同様に、重要な参加者やコミュニティを欲求不満にさせる(最後には「オープンな」データと競合し非互換性のセットになるので)リスクを犯すことになります。
互換性
一片のデータそれ自体が有用であることは滅多にありません。そうではなく、他のデータと連結したり混ぜ合わせられた時、データは有用になります。自分の家が水害に遭うリスクを知りたければ、私は、自分の家が川にどの程度近いか、地理データを手に入れる必要があります。また、河川の氾濫がどれくらい頻繁に起きるかを知る必要があります。
それゆえ「オープンデータ」はオープンの定義で定義されているように、単に一片のデータにアクセスする自由に関するものではなく、そのデータセットを他のものに結び付けたり混ぜ合わせたりする自由に関するものなのです。
残念ながら、互換性は当たり前という状況ではありません。オープンの定義のような標準が無いと、あなたの「オープン」と私の「オープン」が同じものかどうか知ることができなくなります。これは、次には、あなたのオープンデータと私のオープンデータをともにつなぎ合わせ(あるいは混合)することが問題ないかどうか(弁護士に意見を求めることなしに!)、私たちが知ることができないということを意味します。そして、あなたのオープンデータ・ライセンスは私のオープンデータ・ライセンスと互換性が無いので、そうできないということが判明するかもしれません。
世界中の電源ソケットについて考えてみてください。すべての電気装置が異なるプラグを持っていて、異なる電源ソケットを必要としている、と想像してください。あなたの家を訪ねる時、私はアダプターを持参する必要があるでしょう!少なくともその国の中では標準化のおかげで、電源ソケットはほとんど常に同じです- したがって、私は、ノートパソコンをあなたの家に持ってきても問題はありません。しかしながら、海外へ旅行する場合には、おそらくアダプターを持っていかなければならないでしょう。これを推進するのは標準化(あるいはその欠如)です:自分の国内では、誰でも同じ種別のソケットで標準化されています。しかし、別の国々では標準を共有していないかもしれません。従って、アダプターを手に入れる必要があるのです(さもないと電源が切れてしまします!)。
オープンデータについては、よりオープンデータが公開され、政府のようなますます増えつつあるオープンデータ提供者が独自の「オープンデータ・ライセンス」を書き起こすにつれ、(これらの異なるライセンス間で相互に互換性が無い可能性によって)非互換性のリスクは高まっています。
オープンの定義は、以下により非互換性を防ぐ手助けをします:
- あらゆるオープンデータ・ライセンスが準拠すべき1セットの明確な原則の提示(単一の、あるいは特定のライセンス条項を強制するということではなく)
- あるライセンスがオープンの定義に準拠しているかどうか、レビュー及び決定を行う専用の手続きの実施
原文(2014/9/30 Open Knowledge Foundation Blog 記事より):
Original post Why the Open Definition Matters for Open Data: Quality, Compatibility and Simplicit / Rufus Pollock, licensed under CC BY 3.0.