You are browsing the archive for CKAN.

okfj

by okfj

CKANツアーをどうぞ

2014年5月4日 in News

赤ちゃんの名前のデータセットや南オーストラリアの政府によるアプリから新しいCity of Surrey, B.C., (カナダ)のサイトまで、CKAN の実例は世界中に数多くあります。CKAN はデータを公表し、共有し、検索し、利用して効率化するツールを提供することで、データをアクセス可能にするデータ管理システムです。自らのデータの透明性を高め、利用しやすくするために、様々なレベルの政府、市民社会および組織が利用しています。

この1時間のビデオハングアウトでサービス・ディレクターのIrina Bolychevsky は、data.gov.ukpublicdata.eu およびdata.glasgow.gov.uk をはじめとしていくつかのCKANサイトの実際のデモを交えながらCKAN の概要を説明しています。彼女はコミュニティからの質問にも答えています。

ckan-logo

参加しよう

CKAN にはソフトウェアのリミックスや拡張作業を行う、貢献者による幅広いコミュニティがあります。人々が貢献したコードの2つの例としてCkanext-spatialckanext-realtime (github へのリンク)が挙げられます。

CKAN のコア・コミッターは定期的にオンラインの開発者会議を主催しています。これらは毎週火曜および木曜13:00 – 14:00 (東部夏時間)に開催され、プル・リクエストをレビューし、アーキテクチャーについて議論します。私たちはCKAN 開発者メーリングリスト上で会合を開いたり、freenode 上の#ckan チャネルにいたり(ミーティング時にはgoogle hangout につなぎます!)、github のチケット上でコメントしていたりします。だれでも歓迎です。

コミュニティの質問は、だいたいStackOverflow 上でCKANタグを使って尋ねられています。あなたもgithub 上で課題や貢献のコードを提供できます。

問合せ先

CKAN の開発について話したい場合は、ckan-dev メーリング・リストやirc.freenode.org 上の#ckan IRCチャンネルに来てハイと言ってください。サービスに関するお問い合わせは、メールでチームに連絡してください:services at ckan dot org

原文(2014/5/1 Open Knowledge Foundation Blog 記事より):
Original post Take a CKAN Tour / Heather Leson, licensed under CC BY 3.0.

okfj

by okfj

オープン・リサーチ・データに関するEC協議

2014年4月14日 in News

(訳注:この記事は本家OKFn.org記事の日本語訳です)

欧州委員会は、研究者、産業、資金提供者、ITおよびデータセンターの専門家、出版者および図書館からの意見陳述を招請し、リサーチ(研究)データへのオープン・アクセスに関して7月2日にブリュッセルで公の協議を開催しました。これらの利害関係者からのインプットは委員会の政策を改訂する際に一定の役割を果たし、次の大きなEU研究プログラムHorizon 2020(約250-300億ユーロが学問研究に利用可能)について進行中の交渉にとって特に重要です。
5つの質問が、議論の基礎を形成しました:

  • どのように研究データを定義し、どのような種類の研究データをオープンにすべきですか?
  • オープン性が制限されるべき時期や方法がありますか?
  • データ再利用の問題はどのように扱うべきですか?
  • 研究データはどこに保存してアクセス可能にすべきですか?
  • どうすれば「データの意識」と「共有の文化」を拡張することができますか?

オープン・ナレッジ財団は質問に次のように答えました:

どのように研究データを定義し、どのような種類の研究データをオープンにすべきですか?

研究データは極端にばらつきがあり、数値データ、テキストのレコード、イメージ、オーディオおよびビジュアルデータ、カスタマイズされたソフトウェア及びそれと同様に研究の基礎になっているその他のコード、さらに事前分析計画、といったものを(これだけというわけではありませんが)含むでしょう。研究データはまた、メタデータ(研究データそのものに関するデータ)も含むでしょう。不確実性と方法論、版管理されたソフトウェア、標準と他のツール、といったものも含みます。メタデータの標準は専門分野に固有なものですが、「オープン」とみなされるには、少なくとも、同じ専門分野の研究者仲間が、データを、それ自身がオープンに利用可能であり同時に、解釈・再利用するのに十分な情報を提供することが期待されます。ここで、他の人が作成したものを研究者が利用するかもしれないデータとは対照的に、私たちは研究者が作成し、それゆえ制御できるデータにはっきりと関心を持っています。

オープン・リサーチ・データを語る場合、私たちの多くは、デジタル・データ、あるいは非デジタル・データのデジタル化表現されたものに関心があります。化石のような主要な研究文化遺物は明白で本質的な価値を持っていますが、それらが「オープンにできる」範囲は明らかではありません。しかしながら、3D撮影技術の利用は自然遺物への広いアクセスを可能にして、多くの物理的な特徴や画像の取得を可能にするために利用することができ、また利用すべきです。これは、典型的にはそのようなアイテムにアクセスできない、関心のある市民と、対象物を訪れるために旅行することができない研究者の両方に役立つでしょう。

公開可能な、全てのメタデータを含む、あらゆる種類の研究データが、機械可読な形式において利用可能になるべきであり、オープンの定義に従ってオープンであるべきだという期待が、デフォルトで存在することは間違いありません。これは、公共事業に由来するデータは、せいぜいオリジナル著者へのクレジット表記や派生作品への継承要求程度で、誰でも自由に利用、再利用、再配布することができるということを意味します。それは公に利用可能であるべきであり、このオープンなライセンスで利用を許諾されるべきです。

オープン性が制限されるべき時期や方法がありますか?

デフォルトのポジションは、上で定義されているように、研究データがオープンの定義に従ってオープン化されるようになるということであるべきです。しかしながら、研究データへのアクセスが根本的に民主化されている一方で、全部のデータは公表できない状況があるでしょう。例えばプライバシーの理由で。

これらの場合では、研究者は、法的な要求事項と一致し、そして研究助成金の条件で指示されるような研究者倫理によって守られる、最も制限が少ない条件の下で分析を共有するべきです。これには機微な内容ではないデータ、要約データ、メタデータおよびコードをオープンにすることも含むべきです。また、適切な手段があらゆる危険を緩和するために適所にあることを保証することができる人々に、利用可能なオリジナル・データへのアクセスを提供することも。

研究データへのアクセスは発表時間制限期間の導入によって制限されるべきでありません。また、発表時間制限期間を支持する議論は、学界の何人かのメンバー内に固有の保守主義の現れと考えられるに違いありません。代わりに期待されるのは、データ作成に資金提供するプロジェクトが完了する前に、データが公表されること、そしてそれから生じるあらゆる研究のアウトプットの公開に、確実に遅れないことになっていることでしょう。

データ再利用の問題はどのように扱うべきですか?

他の人が再利用できるような形式及びオープンなライセンスの下で利用可能な場合にのみデータは有意義なオープン化がされているといえます。しかし、データを単に利用可能にするだけでは多くの場合それを再利用するのに十分ではありません。メタデータは、他の研究者が実験結果を再現することを可能にするのに十分な文書を提示するように提供されなければなりません。

データを他の人が利用可能に、そして発見可能にしようと努力するために、データ公開者とリポジトリ管理者の役割がここにあります。これは一層の文書化の提供や、標準コード・リストなどの利用により行うことができます。これらはすべてデータをより相互運用可能で、より再利用可能にすることを支援するので。標準の登録簿へのデータの登録と共通のメタデータの使用により、さらに発見をしやすくすることができます。機械可読な形式でのデータの相互運用性と有効性は、データのマイニングとテキストマイニングを実行できる、ということを保障するのに重要です。再利用の形式は制限されてはなりません。

私たちがどのデータセットを持っておかなければならないか動的に決められるように、データ再利用のレベルを監視するべきであるという議論が、時々行われます。私たちはこの案に反対します。否定的な結果を表わしたり、出版物に明確にリンクされていないデータを含め、納税者の資金によって作成されたデータを保存する道徳的な責任があります。可能な将来の用途を予測することはできません。また、直ちには明らかにならないかもしれない再利用の機会が、現在存在するかもしれません。さらに、研究の興味は時間とともに変わるということに注目することは重要です。

研究データはどこに保存してアクセス可能にすべきですか?

規律にはそれぞれ、データを格納し、かつそのコミュニティと世界に対してそれをオープンにするのに利用できる様々な選択肢が必要です。全てに適合する解決法はありません。研究データのインフラストラクチャーはオープンソース・ソフトウェアに基づき、オープンスタンダードに基づいて相互運用可能であるべきです。これらの条件で、私たちは、自分たちのニーズと期待にいちばんフィットするデータ・リポジトリ(例えば組織ごとや主題ごとのリポジトリ)を利用するように研究者を奨励するでしょう。収蔵されたデータに関する適切なメタデータが、このデータがより簡単に発見したり再利用できることを保証するために、同様に保存されることは重要です。

データとメタデータの両方はオープンに利用許諾されるべきです。それらは、機械可読でオープンな形式(米国の政府が政府情報に関する大統領令内でどのようにこれを許可するかに似ています)で収蔵されるべきです。これは、様々なポータルを横切ってリポジトリとデータをリンクする可能性を保証し、よりデータを見つけやすくします。例えば、オープンソースのデータポータルCKANはオープン・ナレッジ財団によって開発されています。それは、データとメタデータを置くことを可能にし、データを見つけて再利用することを簡単にします。ブリストルとリンカーンの大学のような様々な大学は、既にCKANをこれらの目的に使用しています。

どうすれば「データの意識」と「共有の文化」を拡張することができますか?

データ共有の文化を発展させるにあたり、学者、研究所、資金提供者および学会はすべて大きな責任を持っています。公的資金を支出する年金基金積立機関と組織は担うべき中心的な役割を持っており、公的に支援された大学を含む研究機関がより長期的なデータ管理のための適切な資金にアクセスできることを保証しなければなりません。更に、彼らはこれらの原則をサポートする方針と許可を確立するべきです。

研究データの出版(より一般的には共有)は、アカデミックな文化に深く浸透しているべきであって、学究的なコミュニケーションの根本部分と見なされるべきです。しかしながら、一部は大学と資金提供者がセットアップした現在の奨励システムの結果として、一部は問題の多くの誤解の結果として、経歴に有害であるとしばしば見なされます。

教育および宣伝活動は、研究者内の研究データへのオープンアクセスの意識を促進し、多くの神話を解放するのを手伝い、オープンアクセスの支援を自己同一視するように彼らを励ますためにセット・アップされるべきです。これらの活動は、様々な異なる規律が共有の文化の開発における様々な段階にあるという事実を認識した上でセット・アップされるべきです。同時に、大学と資金提供者は、研究データをオープンに公表するように研究者を奨励するインセンティブを与えることに対する選択肢を調査すべきです。伝統的に出版に限定される、研究資金調達の承認は研究データに拡張することができるでしょう。また、データ・キュレーターによる貢献が認識されるべきです。

参照

原文(2013/7/16 Open Knowledge Foundation Blog 記事より):
Original post EC Consultation on open research data / Sander van der Waal, licensed under CC BY 3.0.

米国政府のデータポータルがCKANで再ローンチ

2013年5月28日 in News, Special

原文(2013/5/23 Open Knowledge Foundation Blog)

U.S. GOVERNMENT’S DATA PORTAL RELAUNCHED ON CKAN / IRINA BOLYCHEVSKY / CC BY 3.0

 

本日(訳注:2013/5/23)、我々は米国連邦政府との共同作業がcatalog.data.gov として本稼働したことを心躍らせながら発表します!data.gov のブログでも新しいカタログの説明が書かれた発表を読むことができます。

Screen-Shot-2013-05-23-at-10.44.221

CKAN をデプロイしているオープン・ナレッジ・ファウンデーションのサービスチームは、data.gov の以前からある多数のカタログを新しい統一されたカタログに置き換える困難な作業に取り組んできました。多くの地理空間及びローデータは単一のポータル内で連合し、そこでは様々なポータル、ソース及びカタログが美しい標準化されたユーザーインタフェースで表示されており、ユーザーは何千ものデータセットを通して検索、フィルター及び区分することができます。

これは新しくアナウンスされたオープンデータ・ポリシーを満たす米国の重要な部分であり、data.gov がオープン・ソースに踏み出す最初の大きな一歩を記すものです。全てのコードはGithub 上で利用可能であり、data.gov はそのCKAN / Drupal のセットアップを他の人々がOGPL の一部として再利用できるように計画しています。

ピカピカの新しいCKAN 2.0でローンチする最初の主要製品サイトのひとつとして、data.gov は多くの改善された情報アーキテクチャー、テンプレート及び分散スケーラブル認証モデルといった長所を取り入れています。CKAN はウェブインタフェースを通じてdata.gov に200以上の公開組織に対して、プロジェクト オープンデータにおいてアウトラインを示された要件をサポートする、メンバー管理、ソースとデータセットのハーベスト(取り込み)、といったことができるようにしています。これは、政府関係機関がそのデータソースを個々にメンテナンスしたり、メタデータの定期的な更新を中央リポジトリに対して行うスケジュールを立てたり、承認ワークフローを管理する、といったことが可能になったということを意味しています。

CKAN の地理空間機能には多くの追加がありましたが、なかでも注目すべきは高速でエレガントな地理空間検索です:

Screen-Shot-2013-05-23-at-11.41.121

我々は他のCKAN カタログと同様に、WAFs のFGDC 及びISO 19139 文書、CSW エンドポイント、ArcGIS ポータル、Z39:50 ソース、ESRI 地理ポータルサーバ、のハーベスト(取り込み)用の強固なサポートを追加しました。これは我々のハーベスト及び空間拡張の一部として再利用のために使うことができます。

最も重要なことは、これは再利用者のこれまで以上のアクセシビリティや参画に向けた動きであるということです。(XML ファイルの代わりに)ブラウズ可能なウェブインタフェースを通じて表示されるメタデータであるばかりでなく、いまやユーザー及び公開者の権限設定を尊重する検索クエリーとダウンロードを含むあらゆるウェブ機能にアクセスできる包括的なCKAN API があります。ユーザーはウェブマップサービスの閲覧と同様にグラフィカルにデータのプレビューが可能です。一方、データセットのページはコンテキスト、ブラウズ可能なタグ、データセット拡張、メンテナーといったものを提供します。

Screen-Shot-2013-05-23-at-09.24.031

data.gov は参加者やフィードバックの提供を募集していますので、我々もCKAN の未来に胸を躍らせていると言わせて頂きたいです。我々はとても活発なメーリングリスト、CKAN インストールのための新しい文書、そしてCKAN コミュニティに参加したい人なら誰でもコードに貢献できる方法を持っています。

近いうちにCKAN ポータルをローンチする予定であったり、我々が知らないものを持っている場合はぜひお知らせください。必ず我々の事例集に追加します!

米政府、次期data.gov 2.0でCKANを採用すると発表

2013年2月5日 in News

Open Knowledge Foundationのブログによると、米政府が次期data.gov 2.0でOpen Knowledge FoundationのCKANを採用すると発表しました

米政府は次期バージョンで、従来のdata.govと地理空間データを提供しているgeo.data.govを統合する計画で、CKANのデータカタログ機能を採用する予定です。CKANのデータカタログ機能を組み込んだdata.gov 2.0は、Open Government Platform(OGPL)としてオープンソース化されます。

データポータルについては、CKANか、OGPLか、という覇権争いが繰り広げられると見る向きもありますがし、オープンな世界ではそのようなパワーゲームに意味のないことを示す良い例となりました。CKANもOGPLもお互いに良いところを採用しながら、独自な部分はそれぞれ発展させ、お互いに良い点を自由に利用しあうというオープンな世界、これこそがイノベーションを促進する原動力になります。

出典:

US government to release open data using OKF’s CKAN platform

CKAN: the Horizon for Data.gov 2.0