You are browsing the archive for OKF.

オープンデータの便益(第2部) – 経済研究へのインパクト

2012年10月27日 in Special

数週間前、Open Data in Economics上で3部作のうち第1部を書いた。情報とデータの提供が、いかに公共サービス部門の質を高める支援ができるかという点に絞った研究の上位から例を引用し、その記事ではオープンデータに関する経済研究をいくつか調べた。この第2部では経済研究に関するオープンさのインパクトについて調べてみたい。

データ駆動の時代に生きる私たち

かつてデータの数がさほど多くなく、データが高価な時代があった。例えば比較可能なGDPデータは20世紀中頃から集められ始めたばかりだ。計算能力は高額で不経済であった。データとコマンドはパンチカードにストアされ、研究者たちには自分で利用できるコンピュータで統計解析を実行するのにごく限られた時間しか割り当てられなかった。

しかしながら今日では、統計と計量経済学的解析はどこのオフィスでも行われている。世界銀行のオープン・データ・イニシアティブと政府は各国の横断的なGDPと関連するデータをわずかなマウスクリックだけでダウンロードできるようにした。たとえばのようなオープンソースの統計パッケージが利用できることにより、誰もが自分のノートPCやデスクトップPCで定量解析を仮想的に実行できるようなった。その結果、経験主義的な論文の数が実質的に増加した。左図(Espinosa et al. 2012より)は論文ごとの各年の計量経済学的(統計的)なアウトプットの数をプロットしている。定量的な研究は実際、1960年代より始まった。当時の研究者たちは数ダース程度の観察によるデータセットを使っていたが、近年の応用計量経済学者たちになると今やしばしば何百万もの詳細なミクロレベルの観察を誇るデータセットを利用している。

オープンデータとオープンアクセスが必要な理由

オープンデータに関わる主要な経済上の論点は取引による収益である。これらの収益は複数の次元からもたらされる。まず最初に、オープンデータは冗長性の排除を促す。研究者として、あなたは、しばしば何百もの異なる研究者によって行われた何千回もの基礎的な手続き(例えばデータセットのクリーニングやマージ)は、しばしば同じものであるということをご存知だろう。また、既に他の誰かが取りまとめているにも関わらず、それを共有しようとしなかったがために、無駄な時間を掛けてデータの構成を行うといった経験もお持ちだろう。これらのケースでは、他の人の成果を利用することができるオープンデータは多くの時間を節約できる。このエコシステムにあなたの成果を還元することで、さらにあなたは自分のデータを使って他の人が研究できるということを確信できるだろう。何度も車輪の再発明に投資する必要が無いことに似て、データの共有によって、研究者たちは既存のデータ上で研究したり、貴重な時間を純粋に新しい研究に捧げることができる。

2番めに、オープンデータは少ないリソース – この場合はデータセット – の最も効率的な配置を確保する。繰り返しになるが、あなたは研究者として、学者はしばしばそのデータセットを個人所有の金鉱のように扱うことをご存知だろう。実際、全ての研究経歴はしばしば独自に保有するデータセット上に構築されている。こういった秘匿が、しばしば忘れ去られたハードディスク上の価値あるデータが十分に最後まで使われることなく放置されてしまう結果を引き起こすのだ。さらに悪いことに、研究者はたとえ独自のデータセットを所有していても、そのデータセットを最も有効に活用できる最高のスキルをもっているとは限らず、他方で誰か別の人は必要なスキルを持っていてもデータを保有していないかもしれないのだ。ごく最近、私は過去数十年で名声を得た研究者グループと話す機会があったが、彼らは信じられないほどリッチなデータセットを構築していた。会話の間に、彼らが自分たちで使ったのはそのデータの10%だけで、新しい博士や才能ある研究者を至急探し出し、そのデータの持つ潜在能力の鍵を開いて欲しいのだと語った。しかし、データがオープンになれば、探す必要は無く、データは最もスキルのある研究者の手元に置くことができるのだ。

最後の、そして最も重要なことは、オープンデータは、透明性を増すことにより、同時に科学的な厳格さを育成することになる点だ。データセットと統計的な手続きが誰でも利用できるようになれば、好奇心旺盛な大学生が複製して上級研究者による研究結果を論破することだってできる。実際、学会誌では次第に研究者に、論文と一緒にそのデータセットの公開を呼びかけることが増えてきている。しかし、これが大きな前進である一方で、多くの学会誌は依然実際の発行はクローズドで、驚くような購読料を要求している。例えば、私の最初の記事の読者は気づいているかもしれないが、リンクされた研究記事の多くは購読手続きや大学との提携無しにはダウンロードできないようになっている。原初より、複製と改竄は科学の大きな特徴である。オープンデータとオープンアクセスの役割はともに知識の生成に不可欠となっているのだ。

しかし、当然ながら挑戦が待ち構えている。例えばデータへのより広いアクセスと統計ツールが良い事である一方で、マウスの数クリックで容易に回帰実行できるデータは多くの思慮のないデータマイニングや無意味な計量経済学的アウトプットを増やす結果を招く。それ故、品質保証が従来に劣らず重要なのだ。データ共有にとって何らかの障壁となる場合も出てくるであろう。いくつかのケースでは、研究者は自分の生活のうち相応の時間をそのデータセットの構築に投資しており、この場合、単に誰とでも自分の「赤ちゃん」を気持よく共有できる訳ではないという点は理解できることだ。これに加えて、匿名化してあっても、ミクロレベルのデータのリリースに際しては、しばしばプライバシー保護についての関心を喚起することになる。これらの問題と既にある解決法については、次の記事で論じる予定だ。

原文(2012/10/23 Open Knowledge Foundation Blog 記事より):
Original post The Benefits of Open Data (part II) – Impact on Economic Research / Guo, licensed under CC BY 3.0.

作品をパブリック・ドメインにすると何か悪いことが起きるか?

2012年10月14日 in Special

最近の研究によれば著作権延長に向けた伝統的な議論は予想通り粗が見え始めてきた。

著作権は通常、創作物に向かう意欲を奨励する観点により守られている。すなわち、後々何十もの所有権を得られるのでなければ、誰かが何をやるにもどんなモチベーションを持てるだろう?しかし、あなたは先の世紀の間を通じて発生し、さらに過去に作られた作品に遡及的に適用される継続的な著作権期限の増加をどう正当化するのであろうか。彼らの著作権保護を延長したとしてもその創作意欲は刺激できない – 創作はもはや過去のものなのだ!

3つの主な議論が進んでいる:
1.パブリックドメインに置かれる作品は十分に利用されないであろう、なぜなら新しい作品を製作するインセンティブが無いから。
2.それらは利用されすぎるであろう、あまりに多くの人が使いすぎてその価値を減じてしまうのだ。
3.それらは錆び付いてしまうであろう、質の低いやり方で再生産されたり、望みもしないものと組み合わされたりすることで。

この3つの論点は全てナンセンスに思える。新しい研究資料によれば、「作品をパブリック・ドメインにすると何か悪いことが起きるか?:著作権期限延長の実験主義的なテスト」はパブリック・ドメインのものと著作権保護された作品のオーディオブック再生産の例を挙げ、パブリック・ドメインの状態に移行する際に起こると予想される3種類のダメージの可能性を調査した。

我々のデータは、著作権期限延長に関する3つの基本的な論点 –過小な利用、過度の利用および陳腐化– は支持されないということを示唆している。作品はいったんパブリック・ドメインに置かれると、その価値は使われる量や方法により実質的に減少する。我々はパブリック・ドメインに置くコストがゼロだと主張するつもりは無いが、バランスシートの一方ではパブリック・ドメインの作品に対してオープンにアクセスするユーザに対する便益はかなり大きい。我々はこれらの便益がコストを劇的に上回るのではないかと考えている。

我々のデータによれば、著作権期限延長の支持者による、作品がいったんパブリック・ドメインに置かれるとその文化的経済的価値を損ねかねない低品質のバージョンが作成されるであろう、という議論をほとんど支持しない結果となっている。我々のデータは、例えば著作権保護されたテキストとパブリック・ドメインのものについて、専門のオーディオブック・リーダーによる品質に関する聴取者の判断に、統計的に有意な差異を示していない。

TechDirt でのコメント:

ミッキーマウスが次第にパブリック・ドメインに近づく時が再び近づいて来た — その意味は、著作権期限延長に関する論争である。ご存知のようにミッキーがパブリック・ドメインに近づくたびに、議会がディズニーの要請にとび乗り、著作権を延長するのだ。

結果は明らかだ。パブリック・ドメインに置かれた時のいわゆる「害悪」は存在しないように見える。作品はさらに提供され(実際、それらはよりパブリックに利用することができ、それは著作権の目指すところだと聞かされてきた)、より質の高い作品が提供され、作品は過度に使用されることは無い。著作権延長の議論を続ける理由が何かあるだろうか?

原文(2012/10/8 Open Knowledge Foundation Blog 記事より):
Original post Do bad things happen when works enter the Public Domain? (c) Theodora Middleton, licensed under CC BY 3.0.

オープン・データの便益-経済研究による証拠

2012年10月14日 in Special

9月に開催されたOpen Knowledge Festival 2012 in September を振り返ってみると至るところで「オープンさ」が話題にのぼった印象だ。オープン・サイエンスオープン言語学オープンさにおける性差と多様性に関するトピック、さらにはオープン・プロムナードオープン・サウナといったイベント等々。オープン・ナレッジとオープン・データはありとあらゆるところに登場していた感がある。

しかしながらオープン・ナレッジ・コミュニティの向こう側を見据えると状況は一変する。例えば経済においては、多くの人は「オープン・データ」「オープンさ」「オープンな経済」といったものが正確に何を意味するかを理解していない。実際のところ気にかけてすらいない。よくある反応はこのようなものだ: 「ああ、面白くて大事そうだね、それで?どうしてこの俺が気にしなくちゃいけないのかい?」

この記事では、筆者は経済において情報公開が持つに至った積極的な役割の確実な証拠を提示し、エコノミスト -プロアマ問わず- を巻き込んでオープンさの考え方をメインストリームに持ち込むアイディアを描き出してみたいと考えている。

オープンな情報の現実世界におけるインパクト

情報をパブリックにアクセスできるようにすることで、公共サービスの配送を改善することが可能である。汚職がはびこる国々では、サービスと資金は最前線の提供者に届かないことが多い。さらに、仮にサービスが人々に届いたとしても、提供されるサービスの質はしばしば衝撃的なほど貧しいものである: バングラデシュ、エクアドル、インド、ペルー、そしてウガンダからの調査結果によれば、学校の先生や保健員の欠勤率は20%から30%にのぼる。多くの場合、スタッフへの訓練は不十分である。

サービス配布にデータをリリースすることで、汚職を減らし、公共サービスの改善を支援することが可能だ。ウガンダでは、研究者がランダムに選んだ一部の学校に対して地方紙を通じて資金のデータを親たちに情報提供した。その結果、汚職は著しく減少し、一方で学校教育への支出は実質的に改善した。健康の配布再分配ポリシーにおける類似の証拠は、情報の提供は国民が公共サービス提供者を訓練したり、サービスの質を高める支援ができるということを示唆している。

情報はまた悪徳政治家を白日のもとに晒すことができる。例えばブラジルの連邦政府は、自治体をランダムに選んで会計検査を行い、監査レポートをメディアへリリースし始めた。研究者は会計検査の支出は政治家が再選される可能性に大きなインパクトを与えたことを発見した: これらは汚職は投票によって罰せられるということを明らかにし、そのインパクトは情報の発信を地方のラジオ局が好んだエリアでいちばんよく宣伝された。

南インドの漁夫のは、情報が市場をいかに改善できるかという別の例だ。ケララでの携帯電話の採用事例から、研究者は携帯電話をを通じた情報へのアクセスは漁夫が市場でその水揚げをいちばん高い(そしていちばん魚の需要がある)ところで売るのを支援した、という確信的な証拠を発見した。

最後に、透明性の利点は汚職の削減や情報コストの低減にとどまるものではない。ある比較研究によれば、透明性 -パブリックにリリースされたマクロ経済情報の確度と頻度で計られる- はソブリン国債市場における借入コストの低減につながるものだという。オープン・データは多くの方法、多くの異なる文脈で費用を肩代わりできるものである。

これらは、最先端の経済研究が多様な範囲の状況の中でオープンさによる便益をいかに識別したかの、ごく一部の例である。筆者が説明した事例は相互関係性に基づくものではなく、注意深く確立したカジュアルな関係性によるものであり、 – 少なくとも研究対象の文脈において – 情報に関わる事柄についてはいささか疑問の余地がある。
おそらく最も重要なことは、これらの事例はオープン・データが幅広い意味において理解されなければならないということも明らかにしてくれたという点である。これらの介入はリンクト・データを活用したものではなく、FacebookやTwitterを通じてシェアされたCSVも使っていない – しばしば、これらの介入は究極的には人々の日常生活の改善を支援するシンプルな解決法である。

原文(2012/10/5 Open Knowledge Foundation Blog 記事より):
Original post The Benefits of Open Data – Evidence from Economic Research / Guo, licensed under CC BY 3.0.