オープン性とオープンの定義を探索する

2014年3月23日 in Featured, Special


(訳注:この記事は本家OKFn.org記事の日本語訳です)

私たちは、オープンデータとは何を意味するのか、その基本を述べてきました。ここでは、オープンな情報への一括アクセスの重要性、オープンデータの商用利用、機械可読性、およびデータ提供者はどのような条件を課せられるのかといったことを含む、オープンの定義をより詳細に調べてみます。

商用利用

定義の重要な要素は、オープンデータの商用利用は許可されているということです。オープンデータの利用に際しては商用であれ非営利用途であれ制限があってはなりません。

オープンの定義全文では、これは「ライセンスは、分野によって作品の利用を差別してはいけません。たとえば、企業での使用や遺伝子研究分野での使用についても制限をしてはいけません」として含まれています。

この節の主な意図は、オープンな資料が営利目的での利用をさせないライセンストラップを禁止することです。私たちは、商用ユーザが疎外感を感じるのではなく、コミュニティに参加することを望みます。

商用のオープンデータ・ビジネス・モデルの例

会社がオープンデータから利益を生み出すことができるということは奇妙に見えるかもしれません。この領域のビジネスモデルはまだ発明の途上であり、調査中ですが、商用利用がオープン性の重要な側面である理由の例証を支援するいくつかの選択肢がこちらです。

オープンデータのボタン

オープンなデータセットを使って、他の人がそれを利用してアクセスしたりアプリやウェブサイトを構築できる高性能で信頼性の高いAPIを作成することができます。また、フリーの一括ダウンロードも利用可能である限り、アクセスに課金することもできます。(APIは、異なる数片のソフトウェアや異なるコンピュータが情報を接続したり交換する方法です。ほとんどのアプリケーションは、最新ニュース、地図、製品価格といったデータにインターネットを通じてアクセスするためにAPIを利用します。)

ビジネスでは、例えばオープンデータをいくつか取り上げてつないだり拡張したりして(例えばデータ内の項目のための一貫した命名を作成したり、あるいは2つの異なるデータセットをつないで新しい洞察を生成したりすることで)さらにデータの改善やクリーニングまわりのサービスを提供することができます。

(データの利用ライセンスへの課金がここでの選択肢ではないことに注目してください。データへのアクセスに課金することは、それがオープンデータではないことを意味します!このビジネスモデルは、ビジネスで収集された個人情報やデータセットの文脈内でよく話題になります。これらはデータ用の完全に素晴らしいビジネスモデルですが、オープンデータではありません。)

帰属表示、「完全性」、継承

オープンの定義はオープンデータの利用に際してごくわずかな条件しか付けてはならないとしている一方で、少数の特定の例外を許可しています:

  • 帰属表示:オープンデータ提供者は帰属表示(適切な方法でのクレジット表記)を要求するかもしれません。これは、オープンデータ提供者が自分たちの作品に対するクレジット表記を受け取り、そして下流の利用者が、データの由来をたどれるようにできるということにおいて重要となりえます。
  • 完全性:オープンデータ提供者は、データが変更されているかどうか、データの利用者がそれを明らかにすることを要求するかもしれません。これは例えば政府にとっては非常に適切となりえます。彼らはデータが修正されている場合に、人々がそれを公式なものだと主張しないことを確認したいと考えます。
  • 継承:オープンデータ提供者は、そのデータを利用して作成されたいかなる新しいデータセットもオープンデータとして共有することを要求する、継承ライセンスを課するかもしれません。

機械可読性と一括アクセス

データは多くの方法で提供することができますが、これはその利用しやすさに重要な影響を及ぼす場合があります。オープンの定義は、活用するのが難しくならないようにするために、データが機械可読でかつ一括して利用可能であることを要求します。

コンピュータによって容易にそれを処理することができる場合、データは機械可読であると言えます。これは、単にデジタルであるだけはなく、それが適切な処理がしやすいデジタル構造であるということを意味します。例えば、データの表を含んでいるPDFドキュメントのことを考えてみてください。これらはデジタルです。しかし、コンピュータはPDF(たとえそれがまさに判読可能な人間であっても!)から情報を抽出しようと奮闘するでしょう。スプレッドシートのようなフォーマットでの同じような表は機械可読と言えるでしょう。オープンデータ用語集内の機械可読性に関してもっと読みたい場合はこちら

機械が対応可能ないくつかの機械可読データ

機械が対応可能ないくつかの機械可読データ

全体のデータセットを容易にダウンロードするかアクセスすることができれば、データは一括して利用可能です。あなたが、例えば一度にデータデータセットのごく一部の要素しか得られないように制限されている場合、一括で利用可能ではありません。例えば、世界のすべての町のデータセットに一度に1か国ずつアクセスすることを想像してみてください。

API対一括取得

APIでデータを提供するのは素晴らしいことです。そして、データでやりたいことの多くは、例えばモバイルアプリ内に何らかのお役立ち情報を表示するような場合、一括でのアクセスよりも便利な場合が多いでしょう。

しかしながら、オープンの定義は、APIよりもむしろ一括アクセスを要求します。それには2つの主な理由があります:

  • 一括アクセスは、あなたがAPIを構築する(そうしたいなら!)ことを可能にします。全てのデータが必要な場合、その取得にAPIを使用するのは困難もしくは非効率になる場合があります。例えば、ツイッターについて考えてください:ツイートをすべてダウンロードするためにそのAPIを使用するのは非常に困難で遅いでしょう。したがって、一括アクセスは誰にでもデータへのフル・アクセスを保証する、唯一の方法です。いったん一括アクセスが利用可能ならば、別の誰でも他の人がデータを利用するのを支援するAPIを構築することができます。さらに、検索インデックスや複雑なビジュアライゼーションのような面白い新しいものを作成するために一括データを使用することができます。
  • 一括アクセスはAPIを提供するよりはるかに安価にできます。今日、月に1ドル未満で何ギガバイトものデータを格納することができます。しかし、基礎的なAPIですらその実行にはもっとコストが掛かるかもしれません。また、高度な要求をサポートする適切なAPIの実行は非常に高価になる場合があります。したがって、APIを持っていることはデータがオープンであるための要求事項ではありません。もちろん利用可能な場合、それはそれで素晴らしいのですが。

さらに、誰かがAPI経由でのオープンデータへのアクセスに課金しても、同時にそのデータを一括してフリーで提供している限り、まったく問題ありません。(厳密に言えば、要求は、一括データが無料で利用可能ということではなく、課金する場合には再生産原価を超えない程度であるべきということです。オンライン・ダウンロードについては、それは限りなく無料に近いはずです!)これには意味があります:オープンデータは無料でなければなりませんが、オープンデータサービス(APIのような)には課金することができます。

(新しい情報が現在の交通情報のように、絶えず生成されているリアルタイムデータにとって、これがどういう意味を持つかということは考慮する価値があります。ここでの答えは状況に多少依存しますが、オープン・リアルタイムデータについて、一括ダウンロードアクセスの組み合わせや迅速あるいは定期的な更新を取得する何らかの方法を想像するでしょう。例えば、いつでも利用可能な最新の更新情報の流れや、毎晩1日分全体の一括ダウンロードを提供してかまいません。)

ライセンス設定とパブリック・ドメイン

データセットが法律上オープンかどうか私たちが知りたい場合、一般に、それがオープンライセンスの下(あるいは、「献呈」によるパブリックドメイン内)で利用可能かどうかをチェックします。

しかしながら、何らかの独占的な、例えば著作権やスイ・ジェネリス(データベース)権といった、データにおける知的財産権のようなものがあるかどうかは必ずしも明らかだとは限らないことに注意することは重要です(例えば、これはあなたの法域に依存するかもしれません)。この複雑な問題については、データにおける権利のオープンの定義の法的な概要内でもっと読むことができます。データに独占権がなければ、自動的にパブリック・ドメインに置かれるでしょう。そして、それをオンラインで公開することはそれをオープンにするのに十分でしょう。

しかしながら、これは事態があまり明らかでない領域ですので、適切なオープンライセンスを適用することが一般に推奨されます。- あなたがライセンスした独占権がある場合、そして何らの害を及ぼす権利も無い場合(データは既にパブリック・ドメインにあります!)。

近日中に公開予定のオープン性に関する記事について

近日中に私たちはオープン性の説明というテーマの記事をさらに投稿予定です。オープンの定義とオープン性のための原則の特定のセットとの関係を含む、サンライト財団の10の法則やティム・バーナーズ=リーの5つ星システムのように、オープンデータの共有され同意された定義を持っていることがなぜそれほど重要か、また、人はどうやったら「オープンデータの実践」に取り掛かることができるか、といった内容です。

原文(2013/10/16 Open Knowledge Foundation Blog 記事より):
Original post Exploring openness and the Open Definition / Laura James, licensed under CC BY 3.0.

Leave a reply

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

次のHTML タグと属性が使えます: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>

okfj

Written by