オープン・リサーチ・データに関するEC協議

2014年4月14日 in News


(訳注:この記事は本家OKFn.org記事の日本語訳です)

欧州委員会は、研究者、産業、資金提供者、ITおよびデータセンターの専門家、出版者および図書館からの意見陳述を招請し、リサーチ(研究)データへのオープン・アクセスに関して7月2日にブリュッセルで公の協議を開催しました。これらの利害関係者からのインプットは委員会の政策を改訂する際に一定の役割を果たし、次の大きなEU研究プログラムHorizon 2020(約250-300億ユーロが学問研究に利用可能)について進行中の交渉にとって特に重要です。
5つの質問が、議論の基礎を形成しました:

  • どのように研究データを定義し、どのような種類の研究データをオープンにすべきですか?
  • オープン性が制限されるべき時期や方法がありますか?
  • データ再利用の問題はどのように扱うべきですか?
  • 研究データはどこに保存してアクセス可能にすべきですか?
  • どうすれば「データの意識」と「共有の文化」を拡張することができますか?

オープン・ナレッジ財団は質問に次のように答えました:

どのように研究データを定義し、どのような種類の研究データをオープンにすべきですか?

研究データは極端にばらつきがあり、数値データ、テキストのレコード、イメージ、オーディオおよびビジュアルデータ、カスタマイズされたソフトウェア及びそれと同様に研究の基礎になっているその他のコード、さらに事前分析計画、といったものを(これだけというわけではありませんが)含むでしょう。研究データはまた、メタデータ(研究データそのものに関するデータ)も含むでしょう。不確実性と方法論、版管理されたソフトウェア、標準と他のツール、といったものも含みます。メタデータの標準は専門分野に固有なものですが、「オープン」とみなされるには、少なくとも、同じ専門分野の研究者仲間が、データを、それ自身がオープンに利用可能であり同時に、解釈・再利用するのに十分な情報を提供することが期待されます。ここで、他の人が作成したものを研究者が利用するかもしれないデータとは対照的に、私たちは研究者が作成し、それゆえ制御できるデータにはっきりと関心を持っています。

オープン・リサーチ・データを語る場合、私たちの多くは、デジタル・データ、あるいは非デジタル・データのデジタル化表現されたものに関心があります。化石のような主要な研究文化遺物は明白で本質的な価値を持っていますが、それらが「オープンにできる」範囲は明らかではありません。しかしながら、3D撮影技術の利用は自然遺物への広いアクセスを可能にして、多くの物理的な特徴や画像の取得を可能にするために利用することができ、また利用すべきです。これは、典型的にはそのようなアイテムにアクセスできない、関心のある市民と、対象物を訪れるために旅行することができない研究者の両方に役立つでしょう。

公開可能な、全てのメタデータを含む、あらゆる種類の研究データが、機械可読な形式において利用可能になるべきであり、オープンの定義に従ってオープンであるべきだという期待が、デフォルトで存在することは間違いありません。これは、公共事業に由来するデータは、せいぜいオリジナル著者へのクレジット表記や派生作品への継承要求程度で、誰でも自由に利用、再利用、再配布することができるということを意味します。それは公に利用可能であるべきであり、このオープンなライセンスで利用を許諾されるべきです。

オープン性が制限されるべき時期や方法がありますか?

デフォルトのポジションは、上で定義されているように、研究データがオープンの定義に従ってオープン化されるようになるということであるべきです。しかしながら、研究データへのアクセスが根本的に民主化されている一方で、全部のデータは公表できない状況があるでしょう。例えばプライバシーの理由で。

これらの場合では、研究者は、法的な要求事項と一致し、そして研究助成金の条件で指示されるような研究者倫理によって守られる、最も制限が少ない条件の下で分析を共有するべきです。これには機微な内容ではないデータ、要約データ、メタデータおよびコードをオープンにすることも含むべきです。また、適切な手段があらゆる危険を緩和するために適所にあることを保証することができる人々に、利用可能なオリジナル・データへのアクセスを提供することも。

研究データへのアクセスは発表時間制限期間の導入によって制限されるべきでありません。また、発表時間制限期間を支持する議論は、学界の何人かのメンバー内に固有の保守主義の現れと考えられるに違いありません。代わりに期待されるのは、データ作成に資金提供するプロジェクトが完了する前に、データが公表されること、そしてそれから生じるあらゆる研究のアウトプットの公開に、確実に遅れないことになっていることでしょう。

データ再利用の問題はどのように扱うべきですか?

他の人が再利用できるような形式及びオープンなライセンスの下で利用可能な場合にのみデータは有意義なオープン化がされているといえます。しかし、データを単に利用可能にするだけでは多くの場合それを再利用するのに十分ではありません。メタデータは、他の研究者が実験結果を再現することを可能にするのに十分な文書を提示するように提供されなければなりません。

データを他の人が利用可能に、そして発見可能にしようと努力するために、データ公開者とリポジトリ管理者の役割がここにあります。これは一層の文書化の提供や、標準コード・リストなどの利用により行うことができます。これらはすべてデータをより相互運用可能で、より再利用可能にすることを支援するので。標準の登録簿へのデータの登録と共通のメタデータの使用により、さらに発見をしやすくすることができます。機械可読な形式でのデータの相互運用性と有効性は、データのマイニングとテキストマイニングを実行できる、ということを保障するのに重要です。再利用の形式は制限されてはなりません。

私たちがどのデータセットを持っておかなければならないか動的に決められるように、データ再利用のレベルを監視するべきであるという議論が、時々行われます。私たちはこの案に反対します。否定的な結果を表わしたり、出版物に明確にリンクされていないデータを含め、納税者の資金によって作成されたデータを保存する道徳的な責任があります。可能な将来の用途を予測することはできません。また、直ちには明らかにならないかもしれない再利用の機会が、現在存在するかもしれません。さらに、研究の興味は時間とともに変わるということに注目することは重要です。

研究データはどこに保存してアクセス可能にすべきですか?

規律にはそれぞれ、データを格納し、かつそのコミュニティと世界に対してそれをオープンにするのに利用できる様々な選択肢が必要です。全てに適合する解決法はありません。研究データのインフラストラクチャーはオープンソース・ソフトウェアに基づき、オープンスタンダードに基づいて相互運用可能であるべきです。これらの条件で、私たちは、自分たちのニーズと期待にいちばんフィットするデータ・リポジトリ(例えば組織ごとや主題ごとのリポジトリ)を利用するように研究者を奨励するでしょう。収蔵されたデータに関する適切なメタデータが、このデータがより簡単に発見したり再利用できることを保証するために、同様に保存されることは重要です。

データとメタデータの両方はオープンに利用許諾されるべきです。それらは、機械可読でオープンな形式(米国の政府が政府情報に関する大統領令内でどのようにこれを許可するかに似ています)で収蔵されるべきです。これは、様々なポータルを横切ってリポジトリとデータをリンクする可能性を保証し、よりデータを見つけやすくします。例えば、オープンソースのデータポータルCKANはオープン・ナレッジ財団によって開発されています。それは、データとメタデータを置くことを可能にし、データを見つけて再利用することを簡単にします。ブリストルとリンカーンの大学のような様々な大学は、既にCKANをこれらの目的に使用しています。

どうすれば「データの意識」と「共有の文化」を拡張することができますか?

データ共有の文化を発展させるにあたり、学者、研究所、資金提供者および学会はすべて大きな責任を持っています。公的資金を支出する年金基金積立機関と組織は担うべき中心的な役割を持っており、公的に支援された大学を含む研究機関がより長期的なデータ管理のための適切な資金にアクセスできることを保証しなければなりません。更に、彼らはこれらの原則をサポートする方針と許可を確立するべきです。

研究データの出版(より一般的には共有)は、アカデミックな文化に深く浸透しているべきであって、学究的なコミュニケーションの根本部分と見なされるべきです。しかしながら、一部は大学と資金提供者がセットアップした現在の奨励システムの結果として、一部は問題の多くの誤解の結果として、経歴に有害であるとしばしば見なされます。

教育および宣伝活動は、研究者内の研究データへのオープンアクセスの意識を促進し、多くの神話を解放するのを手伝い、オープンアクセスの支援を自己同一視するように彼らを励ますためにセット・アップされるべきです。これらの活動は、様々な異なる規律が共有の文化の開発における様々な段階にあるという事実を認識した上でセット・アップされるべきです。同時に、大学と資金提供者は、研究データをオープンに公表するように研究者を奨励するインセンティブを与えることに対する選択肢を調査すべきです。伝統的に出版に限定される、研究資金調達の承認は研究データに拡張することができるでしょう。また、データ・キュレーターによる貢献が認識されるべきです。

参照

原文(2013/7/16 Open Knowledge Foundation Blog 記事より):
Original post EC Consultation on open research data / Sander van der Waal, licensed under CC BY 3.0.

Leave a reply

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

次のHTML タグと属性が使えます: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>

okfj

Written by