You are browsing the archive for Special.

オープン・ナレッジ・インターナショナルの一員として

2016年9月28日 in News, Special


OK_LG_LOGO_JAPAN_RGB
■公式の「Chapter(支部)」になりました

先週、Open Knowledge International(OKI)のブログ私たちのブログでお知らせしましたように、私たち一般社団法人オープン・ナレッジ・ファウンデーション・ジャパンは、Open Knowledge Internationalの公式な支部となりました。これは大変光栄なことであり、この喜びを日本の活発なオープンデータ・コミュニティの皆さんと共有したいと思います。

■Open Knowledge InternationalのChapterとなること
Open Knowledge Internationalは、世界的にオープンデータの活用支援をしている団体です。「オープンデータとは何か」を示す「Open Definition(オープンの定義)」を作成したり、各国政府や自治体等で使われオープンデータ公開のためのプラットフォームとしてデファクトスタンダードとなっているCKANを開発したり、オープンデータの進捗状況を国際比較するOpen Data Indexを作成し国際ランキングを発表したり、市民組織やジャーナリスト等のデータリテラシーを高めるSchool of Dataを提供したりしています。(その他にもたくさんのワーキンググループが様々なプロジェクトを進めています

Open Knowledge International (OKI) は、以前はOpen Knowledge “Foundation”(OKF)と称していましたが、2015年から現在の名称に変更しています。さまざまなオープンデータ・オープンナレッジに関する活動に参加する人々は世界中で増加しており、この投稿を執筆している段階では37カ国でOpen Knowledgeの「ローカルグループ」が活動しています。私たち日本グループも2012年の設立以来、そのうちのひとつとして活動してきました。そしてこのたび、主要なグループのひとつとしてChapter(支部)となったわけです。今回Chapter化した日本とスウェーデンは、世界で10番目と11番目のChapterです。

OKIのブログで私たちのChapter化は、「アジアで初」と紹介されました。世界においてアジア諸国の人口が占める割合は非常に大きく、経済社会が大きく発展する可能性を持っています。私は、日本におけるオープンデータ・オープンナレッジのムーブメントをさらに広げていくだけでなく、他のアジア諸国の仲間たちとの協力をさらに広げていきたいと考えています。

■オープン・ナレッジ・ジャパンOpen Knowledge Japan(OKJP)の活動
ところで、私たちの法人は一般社団法人オープン・ナレッジ・ファウンデーション・ジャパンが正式な名称です。しかし、上記のようにOpen Knowledge FoundationがOpen Knowledge Internationalへと名称を変更しましたので、私たちも名称から「ファウンデーション」を外していこうと考えています。法人名は今後変更する予定ですが、通称として「オープンナレッジ(ジャパン)」と呼んでいただければ幸いです。また、「OKFJ」も「OKJP」へと変えていきます。「ファウンデーション」の「F」を外すとともに、「J」だけだとジャマイカやヨルダンとも重複してしまうため2文字の「JP」を使う、ということです。「OKFJ」と呼んでくださっていた方にはご迷惑をおかけいたしますが、正式名としては一般社団法人オープン・ナレッジ・ファウンデーション・ジャパン、通称は「オープンナレッジ(ジャパン)」「OKJP」という名前で呼んでください。

今後の私たちの活動は、やはり年度末のインターナショナルオープンデータデイがひとつの柱となります。日本各地・各分野のオープンデータ活用を前進させていく機会として、世界で最も盛んなオープンデータデイを盛り上げてきたいと思います。また、東京で不定期に開催している「オープンデータトークシリーズ」や、その他パブリックコメントや政策提言なども積極的に行っていきます。2016年度から参画した「オープンガバメント推進協議会」を通じた地方自治体の支援も発展させていきます。

これらに加えて、文化芸術関連のオープンデータ活用に取組むOpenGLAMや図書館・美術館関係の皆さんや、オープンデータを地域経済の分析に使うデータサイエンティストの皆さんなど、関連領域で活動されている方々や団体との連携も広げ、オープンデータ・オープンナレッジのムーブメントを広げていきます。

■賛助会員としての参画のお願い
最後にとても大切なお願いがあります。私たちオープンナレッジの活動は、賛助会員として応援してくださっている方々の会費で支えられています。 あまりお金のかからない運営をしているつもりですが、一般社団法人としての事務は行っていますし、サーバ代などもかかっています。また、交通費が賄えるようになればOKJPのメンバーが国内の自治体等の支援などにうかがいやすくなります。ボランタリーで来てもらっているオープンデータトークの講師に何らかの御礼をすることも出来るようにるかもしれません。また、海外との交流もできれば活発化していきたいと考えています。

大切なことなので繰り返します。OKJPでは、賛助会員を募集しています。こちらのページをご覧いただき、趣旨にご賛同いただける方はぜひ、ご参加ください。どうぞ、よろしくお願いいたします。

庄司昌彦

オープンガバメント、オープンデータ、そしてオープンソースについての短編フィルム 「オープン」

2015年12月2日 in Special

この記事は、オープンデータをテーマにした、「オープンデータ Advent Calendar 2015」企画の2日目の原稿です。他の記事は一覧から見られるようになっており、日ごとに記事が増えていく予定です。ぜひ、ご覧ください。
——————————————————–
(訳注:この記事は Open Knowledge ブログ記事の日本語訳です)

これは「オープン」の作家兼ディレクターであるリチャード・ピエトロによるゲスト投稿です。

これを読んでいるあなたはたぶん、オープンガバメント、オープンデータ、そしてオープンソースといった用語に精通していることでしょう。そしてこういった運動を通じて、いかに市民参画が根本から変わりつつあるかということをおそらく理解しているでしょう。

しかし次のような課題があります:どうやったら他のみんなにリーチできるのでしょうか?このような用語を聞いたことがなく、市民参画にあまり興味を持っていない人たちに。

私は次のように考えています:市民参画はブランドとしてはあまり良いものではありません。より多くの人々の耳目を集めるためには、そのブランドをより良いものに変える必要があります。

市民参画を考える際にたいていの人は、おそらくどこかで怒鳴り合っているコミュニティの人々を想像しています。もしくは、地方自治体の開発計画懇談会での居眠り大会といったものを思い描くでしょう。日々の暮らしの中に、全く違うことを埋め込む時間のある人はいるのでしょうか?たいていの人は、自分の空き時間を息苦しいミーティングで座っていることよりも何かしら情熱を持てることへの投資に使いたいだろうと私は思います!(息苦しいミーティングがあなたの情熱ならそれもクールだね!)

市民参画は無味乾燥で退屈だとか、あるいは情報通で意識の高い政策大好き人間のことだと思われています。これらの2つのシナリオの間で、自分の声は決して届かないと感じます。なぜそんなことに関わる必要があるのでしょう?市民参画はうまくPRできていません。たいていの人にとって楽しいものとは思われていません。加えて、特にそれが権利、義務、特権、あるいは処罰(裁判官はコミュニティサービスを処罰として提供します)として話される時には、エリート臭も漂います。

そこで、私は違う視点を取り入れました:アートとしての市民参画。これは、アートが単に美術としてだけとらえてはならないということを提案するセス・ゴダンの本「かなめ」を通じて動機づけられました。むしろ、彼はアートが情熱の産物であると主張しています;アートとは何かを創り出すことで、それが市民参画の全てです – 情熱から来る何かをあなたのコミュニティで創り出すのです。

私は「オープン」がオープンガバメント、オープンデータそしてオープンソースを新しい人々にシンプルに紹介することを願っています。なぜなら新しい方法で行われているからです。私の意図は、それを楽しむことで市民参画というブランドを変えはじめることなのです。

例えば、私は自分をオープンガバメント大好き少年と呼んでいます。そのため「オープン」ではできるだけ多くのポップ・カルチャーや「大好き少年タイプ」の引用を割り込ませて使っています。実際のところ、私はこの短編フィルムをマトリックスの「パロディ作品」と呼んでいます。私達がしたことはモーフィアスがネオに「現実の世界」と「マトリックス」の違いを説明している場面を撮り、それを「オープンな世界」対「クローズドな世界」に改変したものです。私達はオフィス・スペース、ザ・シンプソンズ、モンティ・パイソン、そしてスタートレックへのあいさつも含めました。

ボーナスとして、私はこれらのおなじみのテーマと引用が「初心者」にとってオープンガバメント、オープンデータ、そしてオープンソースをより理解しやすくすることを望んでいます。

そういう訳で、これ以上Apu無しで(ザ・シンプソンズのファンなら分かるでしょう)オープンガバメント、オープンデータ、そしてオープンソースに関する世界初の短編フィルム「オープン」をお贈りします。

「オープン」を視聴

THE TEAM BEHIND OPEN

Writer and Director: Richard Pietro
Screenplay: Richard Pietro & Rick Weiss
Executive Producers: Keith Loo and Bruce Chau
Cinematographers: Gord Poon & Mike Donis
Technical Lead: Brian Wong
Composer and Sound Engineer: GARU
Actors: Mish Tam & Julian Friday

原文(2015/9/29 Open Knowledge Foundation Blog 記事より):
Original post Open: A Short Film about Open Government, Open Data and Open Source / Richard Pietro, licensed under CC BY 4.0.

okfj

by okfj

EUの調達データをオープンにする

2014年5月24日 in News, Special

次の投稿の元記事はこちらで、Friedrich Lindenberg (Twitterではこちら)によるものです。

調査担当のジャーナリストが注目すべき次のヨーロッパのデータセットは何でしょうか?2012年、BrigitteDataHarvest 会議にさかのぼると、FarmSubsidy の調査担当スーパースターと会議の共同主催者は明確な答えを持っていました:TED(Tenders Electronic Daily)をオープンにしましょう。TEDはEUの共同調達の仕組みで、EUの契約プロセスの中心にあるものです。これをオープンにするということは、誰が公的資金を受け取るか、また、何のためにそれを受け取るかというキーになる疑問に光を当てるでしょう。

彼女の提案は、先週の時点で、最終的にはジャーナリストと研究者のための有用なリソースへと成長した、OpenTED という2年がかりのプロジェクトを引き起こしました。ギャップは残っていますが、私たちは大規模なトレンドから地方自治体の開発まで、あらゆることについての情報を得るために今、ジャーナリスト、NGO、アナリストおよび市民がこれを利用し始めるよう願っています。

ヨーロッパの入札書類および落札データへの容易なアクセスを提供する現在のOpenTEDウェブサイト。

OpenTED

すべてのEU諸国の会社がこれらの契約に入札することができるように、TEDは、大規模公共事業のための入札公告を集めています。ジャーナリストにとって、このようなデータベースが次のようなことに答えられるかどうか、多くの刺激的な疑問があります:どのような大型プロジェクトが発表されているか?誰がこれらのプロジェクトの契約を落札しているか?また、決定が賢明に公平になされているか?特定の国や産業で最も大きなサプライヤーは誰か?

Anders PedersenJoost Cassee が始めたOpenTED プロジェクトは、最初に公式TEDウェブサイトをスクレイプ(訳注:htmlで表現された表などをパースしてデータとして取り出す操作)する試みとして生まれました。しかしながら、OpenTED のこの最初のバージョンはすぐに多くの現実問題に直面しました:ジャーナリストがインターフェースなしでこのデータを使用するのは不可能でした。また、材料が非常にお粗末だったので、サンライト財団の金融データの天才Kaitlin Devine でさえ私たちがエラーを分離するのを手伝えませんでした。さらに悪いことに、2013年6月に、EU出版社は、大量のスクレイピングを不可能にするためにTEDウェブサイトを更新しました – データを更新する方法が私たちには無くなってしまったのです。

私たちには選択肢が欠けていました。私たちの質問に答えるには、EU出版社が提供するウェブサイトでだけでなく、データベースを直接見る必要がありました。

言葉によるスクレイピング

私たちは、データオタクたちのために過激な一歩を踏み出すことに決めました:EUに話しかけることにしたのです。出版社のユニット・リードと話をしたところ、彼らが既にそのライセンシングの枠組みを変更する手続き中であったことを知って、私たちは驚きました:機械可読なデータへのアクセスは過去の再利用者に売られましたが、データを2014年1月に自由に利用可能にするという計画でした。ありがとう、Neelie!

そこで私は1月前半にツイッター上で@EUTenders に連絡して、出版計画に何が起こったか尋ねました。何らかの拒絶を予期していたのですが、彼らの生データ・ファイル・サーバーのための保証付きのダイレクト・メッセージを直ちに受け取って、私は驚きました。サイトはTED の2011年以来のデータのXMLダンプと共に、ダウンロード用のDVDイメージを提示してくれました – これはまさに私たちが捜していたものでした。

コミュニティの構築

DataHarvest 2014が近づくにつれ、私たちは、アクセス可能なフォーマット(CSV)で切り出されたものや国や年ごとに分けられた新しくオープンにされたデータを提示する、OpenTED の更新版を作ることに決めました。これにより、データベース・スキルのないジャーナリストでもデータを入手し、スプレッドシート・アプリケーションで調べることができるでしょう。

DataHarvest 2014のハック・デイに、ヨーロッパ中のコーダー、およびジャーナリストがEU調達データを探索しています。

その結果生まれた議論では、データの質と完全性に注目しました。多くの契約額やサプライヤー名をはじめ、多くの不可欠な情報が見当たりません。さらに、既存のデータは、特に契約に関与する公共団体および経済担当者を明白に識別するには、非常にお粗末なものです。

そして今は?

次のステップはDataHarvest にいろいろなやり方で参加したジャーナリストのおかげです。私たちは彼らが調査に使用できる豊かなリソースを創出し、そしてデータの分析をサポートする準備ができている科学技術者のネットワークを立ち上げた、と私は考えています。しかしながら、私たちが今や契約メタデータ(EU契約の受取人、金額、見出し等)にアクセスできるようになった一方で、ワークショップの中でジャーナリストが尋ねたがるような詳細な質問に答えるためには、実際の契約書へのアクセス、政府が私たちの代わりに作る条項の詳述および正確な協定の範囲、といったものが必要であることが明らかになりました。これについては、私たちはより大きな契約の透明性を主張し、秘密契約をストップするように政府に伝える必要があります。

おお、そして私は、Galwayに建設中の700兆ユーロのビルについてぜひとも詳しく知りたいのです…

資源

データとツール:

いくつかのコード:

原文(2014/5/16 Open Knowledge Foundation Blog 記事より):
Original post Opening Up EU Procurement Data / Friedrich Lindenberg, licensed under CC BY 3.0.

okfj

by okfj

秘密契約の悲劇的な結末

2014年5月9日 in News, Special

次の投稿はナイジェリアの Public and Private Development Centre のCEOであるSeember Nyagerによるものです。Public and Private Development Centreストップ秘密契約キャンペーンにおける私たちのキャンペーン・パートナーのひとつです。

procurement montior

公共機関の中で日々行われている秘密契約によって、公共の利益が阻害されているという確かな証拠があります。
数日前に、Abuja の若いナイジェリア人は、19人の応募者が死亡した、ナイジェリア入国管理局(NIS)による採用試験の無謀な行為に抗議した罪で逮捕されました。(訳注:採用試験に大量の失業者が押し寄せ、将棋倒しなどにより死傷者が出たもの。報道記事ビデオ

抗議者はその後解放されましたが、誰も無謀な採用試験を行った結果起きた死亡事故のために留置されていない一方で、この重大な失態に抗議する若い声は、治安部隊によって沈黙させられている様子は、未だに風刺されています。もっとも心を痛めるのは、採用試験で死者を出すという結果は試験を実施するコンサルタントの選択の中で、相応の手続きとまっとうな仕事をしっかり行っていれば、より周到な計画で回避できたかもしれない、という現実です。

Premium times が公表した報告書は、もっぱらNIS で採用試験を行なったコンサルタントを自ら選んだ内大臣によって採用試験が行なわれたことを示しています。コンサルタントが選ばれたプロセスについて、BudgIT やPPDC を含む市民組織からの詳細情報の提供要求に対する大臣からの反応の無さは、適法な手続きが軽視されているという報告書が信頼できることを示しています。

コンサルタントが選ばれた競争の無いプロセスは公的調達法に明らかに違反します。また、その結果は、公共事業の契約の報酬における金銭のために価値の概念を台無しにしてしまいました。採用募集ウェブサイトは雇われたコンサルタントによって構築され配置されましたが、ウェブサイトで集めた情報は、その後に死亡したナイジェリア人を残した全国一斉の採用試験を執り行うための計画に通知されたようには見えません。710,000人以上の応募者から生み出された収入の適法性が質問されている一方で、採用試験をもっとうまくオーガナイズできるようにこれらのリソースが使われなかったことは、驚くべきことです。

ナイジェリアの公共機関がナイジェリア人の損害に対して、公共サービスに期待される運営において無謀な振る舞いを見せたのはこれが初めてではありません。航空省が、ひどく豪華な乗り物をローンで買うという分別の無さによって、SUREP資金が使われた正確な金額の追跡において、BudgITおよびPPDCは困難に直面しました。国家の構築と開発が公共機関によって蝕まれている事例としては、NNPCによる200億ドルに上る使途不明金はごく一例です。

3週間前に行なわれたNIS の採用の実例では、いくつかの結果が短時間で死者を出すものとなりました。しかし、責任の受け容れやナイジェリア人に加えられた不正行為の訂正は遅々として進んでいません。同じ問題に関して、市民のリソースが静かなる抗議者に迅速に配置されました。

procurement monitor2

今こそ適切な手続きと勤勉さを要求する私たちの法律が完全に執行される時です。ナイジェリア人があらゆる形式の組織上の無分別に憤慨するのは正しいことであり、平和な抗議はもはや弾圧されるべきではありません。ナイジェリアの入国管理局採用試験は、秘密契約の結果が人命を奪う場合もあり、そのような振る舞いを続けることは許されないということを痛ましくも例証しています。私たちは組織による無分別を止めなければなりません。そして私たちは秘密契約を止めなければなりません。

Ms. Seember Nyager はナイジェリアで調達の監視をコーディネイトしています。Nigerian Procurement Monitors は@Nig_procmonitor でフォローしてください。

原文(2014/4/14 Open Knowledge Foundation Blog 記事より):
Original post The Tragic Consequences of Secret Contracts / Theodora Middleton, licensed under CC BY 3.0.

okfj

by okfj

なぜ秘密契約は援助の透明性において問題か

2014年5月8日 in News, Special

次のゲスト投稿は私たちのストップ秘密契約キャンペーンのパートナーであるPublish What You Fund のNicole Valentinuzzi によるものです。

オープンナレッジ財団、サンライト財団および他の多くの国際的なNGOに支援された、秘密契約をストップする新しいキャンペーンは、汚職が始まる前にやめさせるために、あらゆる公的な契約を利用可能にすることを目的としています。

私たち自身透明性の運動家として、Publish What You Fund はこの新しいキャンペーンの支持者となることを嬉しく思います。私たちは、全ての政府活動の土台となるアプローチとして透明性の要請に声を貸すことが重要であると感じました。

開発のフローをオープンにすることによって、援助の有効性と説明責任を増加させることができると信じているので、私たちは、より多くのそしてより良い援助に関する情報のためにキャンペーンを行っています。さらに、市民に対する最終的な責任があるので、政府は透明性のある行動をする義務を負うと私たちは信じています。

これは教科書から衛生システムまで政府が入札のために発行する公的な契約をすべて公表することを含んでいます。これらの公的に入札が行われた契約は毎年ほぼ9兆5000億USドルを全体的に上回ると推測されます。しかし、その多数は非公開ということで意見が一致しています。

これらの秘密契約は、しばしば汚職、不正行為および不可解なアウトソーシングにつながります。金額、相手先、納期など、契約に関する基礎的な事実が市民に利用可能にならない場合は、汚職と悪用が起きていないことを確かめられません。

しかし、Publish What You Fund で私たちがキャンペーンの目的とする援助の透明性について、秘密契約をどうしなければならないのでしょうか?では、アフリカは毎年そのGDP の4分の1弱を汚職で失っているという、キャンペーンによる最近の発見をよく考えてください。そして、その代わりに学校、病院、道路などにどれだけのお金が使えたのか、考えてみてください。

これは多くの場合、開発に使うことを想定しているお金です。例えばInternational Aid Transparency Initiative (IATI)を通じて、市民がお金の流れをたどることができ、その使途について政府が説明責任を果たせるように、これは公表されるべきです。

しかし、汚職は単にアフリカだけの問題ではありません。ストップ秘密契約キャンペーンでは、ヨーロッパは毎年汚職で1200億ユーロを失っていると見積もっています。

Publish What You Fund で、私たちは開発協力の世界最大の供給者に、IATIへ援助情報を公表しなければならないと伝えています。なぜならそれが唯一国際的に合意されたオープンデータの標準だからです。IATIに公表された情報は、人々が調達、契約、入札あるいは予算のどれを知りたいか、そのニーズに応じて広範囲の利害関係者が利用することができます。それ以上に、これはパートナー諸国が求めてきた情報なのです。

政府は開発を含むすべてのセクターの民間会社との契約に与えるために、納税者のお金を使います。私たちは、公的資金を受け取る会社はすべて、それに基づいて提供される財貨・サービスについて政府と同じ透明性の規定に従わなければならないと信じています。

公共事業を提供するために政府あるいは企業が支出している資金のより大きな透明性と明確な理解は、市民に対する信頼の構築と説明責任の支援があって初めて役に立ちます。オープンな援助であれオープンな契約であれ、私たちは政府の手から、そして市民の手に情報を入れる必要があります。

最終的に、透明性がどのように援助を改善するのか、私たちにとって疑問は残ります。また、オープンな契約は援助の有効性についてのパズルの別のピースです。市民に、公的な契約に対して全てのオープンなアクセスを与えることは、グローバルな透明性を増加させることにおいて重大な第一歩です。世界の指導者たちにこれを実現するように要求するために今すぐ請願書に署名してください。

原文(2014/4/11 Open Knowledge Foundation Blog 記事より):
Original post Why secret contracts matter in aid transparency / Nicole Valentinuzzi, licensed under CC BY 3.0.

okfj

by okfj

資源の呪いへの取り組み:コートジボワールにおける情報アクセスの改善とオープンな契約のための市民社会の闘い

2014年5月7日 in News, Special

これは、私たちのキャンペーンのパートナー、Integrity Action からのゲスト・ブログで、こちらのウェブサイトのオリジナル記事を編集したものです。これは、私たちの#SecretContracts キャンペーンのパートナー組織からの一連のブログ・ポストの1番目です。契約の秘密に関する問題で共有したい話題がある場合は、contact@stopsecretcontracts.org に連絡してください。

資源の呪いへの取り組み:コートジボワールにおける情報アクセスの改善とオープンな契約のための市民社会の闘い

今日、多くの天然資源産出国がはびこる汚職、弾圧および貧困に悩まされています。私たちは、赤道ギニア(確実に世界の資源の呪いの最良の事例のひとつ)のような石油の豊富な小国に関する記事を読むことに慣れてしまっているように思えます。この国では膨大な石油埋蔵量が、エリートの豊かなライフスタイルに資金を提供していますが、その一方で、人口の大多数は、自らの基本的人権および経済的権利が満たされていない、望まざる地位にいるということに気付いています。

しかし、すべての絵が「希望が持てない」訳ではありません。コートジボワールのような国々へ焦点を移すことで、異なる絵が出現する可能性が生まれます。ここでは、Social Justice(社会正義)のような市民社会組織(CSO)が、採取産業セクターの収入が全ての社会構成員のためになることを保証するために熱心に働いています。

そうすると、コートジボワールのローカルのCSOはこのような手順の変化をどうやって増加させてきたのでしょうか?Jacquevilleとd’Angoviaでは、契約へのアクセスの改善を保証することを目指して、地方の自治体や企業にロビー活動を行えるように、影響力のある人々と仕事をすることから始めました。契約上の情報を受け取る際に、彼らはコミュニティとの情報ミーティングをオーガナイズし、市民が受給権の獲得に向けてうまく交渉するための戦略開発を援助し、これにより、ヘルスケア・センター、産院、学校および給水塔が建造されることを保証しました。

コミュニティが契約に関する情報へのアクセスを保証することは、かなり達成困難なものでした。コートジボワールのSocial Justice (社会正義)や他のCSOは、オープンな契約の実施がセクター内の大勢になっていない理由として法律と規制の欠如を引用しましたが、しばしば公務員や企業からの抵抗に遭遇しました。オープンな契約が制度化され適切に規制されるべきかどうか、Social Justice や他のCSOは、地域コミュニティにとっての明確な利点を粘り強く会話しました。さらに、彼らは、情報へのアクセス及び情報の自由の課題に取り組むタスクを持つ資源センターの体制づくりを奨励しました。

最近コートジボワールでは情報法へのアクセスを採用し、オープンな契約への重要な一歩を踏み出しました。Social Justice および他のCSOは、オープンな契約のための継続的な需要に関して、2013年5月に採用されたExtractive Industries Transparency Initiative Standard(採取産業透明性イニシアチブ標準)と同様に新しい法律にも現在大きく依存しています。

何にでも懐疑的であり続けることはたやすい、というのは明らかです。しかしながら、Social Justice のコートジボワールでの仕事は、契約関連情報にアクセスできるようになったことで、セクター内の主要なステイクホルダーが採取セクターの活動によって影響されて、社会的及び経済的な責任に応えることを保証することをコミュニティができるようになる、ということを示しています。

ストップ秘密契約キャンペーンは、オープンな契約の問題を国際的な政策課題へと押し進めるために設計されています。請願書に署名しStopSecretContracts.org で言葉を広げることで、キャンペーンに参加してください。

Social Justice についての詳細はこちら:https://www.facebook.com/socialjusticecotedivoire2

写真:Adjue, Jaqueville のLogement de Maitre(教師のための住宅)のSocial Justice 派遣監視員。ガス会社Foxtrot の資金提供による。

原文(2014/3/31 Open Knowledge Foundation Blog 記事より):
Original post Tackling the Resource Curse: Civil Society’s Fight for Better Access to Information and Open Contracting in Cote d’Ivoire / Katelyn Rogers, licensed under CC BY 3.0.

okfj

by okfj

英国の健康からナイジェリアの教育まで – ストップ秘密契約

2014年5月6日 in News, Special

本日(訳注:2014/3/24)、英国国民健康保険における不正行為および過誤が毎年約70億ポンドの損失につながっていることが発表されました。これは約250,000人の新しい看護師の賃金に相当し、緊縮経済の圧力の下でこれまで以上にサービスが苦境にあるこの時期に起きています。

金銭が失われる主な理由のひとつは、契約者による過剰請求および納入不足です。不可解な契約者への健康対策のアウトソーシングは英国においてますますポピュラーになっており、それは不正行為と汚職の温床となっています。また、事態がうまく行かくなったときに、市民は、是正するための有効な手段を持っていません。

ナイジェリアでは、市民社会グループは、教育改革を行うために作成されている重要な契約へのアクセスを拒否されています。ナイジェリアは、世界で最も未就学児童が多い国であることが分かりました。教育改革は疑いもなく必要です。

しかし、関係する契約についての情報は「商業機密」で覆われています。透明性が不足すると純粋な改革の可能性が減り、参画を妨げます。プロセスが秘密に覆われる時、すべてのナイジェリア人のニーズを満たす包括的な教育システムは実現できないでしょう。

世界の中で、契約行為は悪用にいちばん向いている政府の一面です。政府は、公的な調査に契約をさらすのを避けるために、商業機密あるいは国家安全保障といった主張の背後に隠れています。

stopsecretcontracts logo

今月、私たちは調達プロセスをオープンにするように世界の指導者たちに要求する、ストップ秘密契約キャンペーンを始めました。最も基礎的なレベルでは、契約のデータは市民に利用可能とならなければなりません。これは次のものを含んでいます:

  1. 契約の全文;
  2. 事前研究、入札書類、実績評価、保証および監査報告のような重要な文書;
  3. 計画策定プロセス、調達方法および評価基準のような契約の構成に関する情報;
  4. 納品予定、実装、支払いおよびリスク評価の状態といった、実績と完成に関する情報。

しかし、さらに、オープンガバメント・ガイドの中に配置されているように、私たちは参加と説明責任へのより強いコミットメントを確認したいのです。公共サービスを隅々にまで提供するのに契約者の役割は高まりつつあるので、私たちは社会の重大な局面に関する民主的な運営を確実に保持しなければなりません。

私たちは、この言葉を広げるのを手伝ってくれる「あなた」が必要です。私たちは、この問題がG20とOGPによって真剣に受けとめられるように、請願書に署名してくれる「あなた」が必要です。この重大な問題に取り組んでいる組織は、多くの声がその背後につながっていることを示せる必要があります。

一旦署名すると、さらに手伝ってもらえることがあります。私たちのバングラデシュスウェーデンのローカル・グループが行ったように、ブログ記事を書くことができるでしょう。@StopSecretContracts をフォローしたり、#SecretContracts を使って、興味深く適切なものをリツイートすることができるでしょう。政策協議にもっと参加するためにOpen Contracting Partnership の実践コミュニティに加わることができるでしょう。C20協議(今年のオーストラリアでのG20周辺の市民社会参画プロセス)への貢献を、特にガバナンスグループの中で、始めることができるでしょう。支援組織のリストをチェックできるでしょう:そのどれかがあなたの地域にある場合、あなたがその推進を支援できるかどうか連絡して確かめてみてはいかがですか?

あなたがオープン・コントラクティングのことや、なぜそれが重要かということをもっと学習したければ、利用可能なリソースはたくさんあります。Open Contracting Partnership は、これらのオープンな契約のためのグローバルな原則を作成し、サンライト財団は調達におけるオープンデータのためのこれらの補足ガイドラインを持っています。この報告書、Publish What You Buy はオープンさに対する意見を表明しており、オープンガバメント・ガイド内のこのエントリーはその課題や、私たちが確かめる必要のある政治的コミットメントのようなものの理解に適した出発点です

次週月曜日から、私たちは、ストップ秘密契約キャンペーンを支援している、様々な組織からの一連のブログ投稿を公表する予定です。契約の秘密についての問題に関して共有したい話がある場合は、contact@stopsecretcontracts.org に連絡してください。

原文(2014/3/24 Open Knowledge Foundation Blog 記事より):
Original post From Health in the UK to Education in Nigeria – Stop Secret Contracts / Theodora Middleton, licensed under CC BY 3.0.

okfj

by okfj

データのためのGit(およびGithub)

2014年3月31日 in Featured, Special

(訳注:この記事は本家OKFn.org記事の日本語訳です)

データのために「バージョン管理」を行う能力は重要な関心事です。様々な選択肢がありますが、最も魅力的なもののひとつは、GitMercurial のように、コード用の既存ツールを再利用することです。この投稿では、私たちが暫くの間使用してとても効果的だということが分かったツールを利用する、データの格納とバージョン管理のための単純な「データ・パターン」について記述しています。

序章

行われた変更を格納し、それを他の人と共有する、データのバージョンとリビジョンを管理する能力、とりわけ分散的な手法は(オープン)データ・コミュニティにとって大きな便益となるでしょう。私はその理由を以前こちらの初期の記事を参照)議論しましたが要約すると:

  • 効率的な分散型の共同作業が可能です。私のデータセットを取り出し、変更し、それを再び私と(同時に他の人とも!)共有することができます。
  • 出所をより良く(つまり、どの変更がどこから来たのか)追跡することが可能です。
  • シンプルで効率的なやり方で、更新内容を共有し、データセットを同期させることができます。例えば、ファイル全体を再取得しなくても過去数か月のGDPや雇用データを取得する自動的なやり方で。

「データのためのリビジョン管理」問題に取り組む方法はいくつかあります。ここでのアプローチは、私たちがGitMercurial のようにコードのために設計された既存の強力な分散型バージョン管理システムを利用し、データにそれらを適用することができるということを意味する形式でデータを取得することです。そのため、データのための最良のGithubは、実際のところGithub それ自身かもしれません。もちろん、Git(hub)の上にデータ特有のインターフェースを重ね表示したいかもしれません。 これは私たちがhttp://data.okfn.org/で行っていることにほかなりません。

このアプローチには制約があり、私は、これらといくつかの代替モデルについて以下に論述します。これは特に、「小さな(あるいはミクロな)データ」、例えば10MB あるいは100K行以下の場合に最適です。(ひとつの代替モデルはマックス・オグデンが最近始めた非常に面白いDatプロジェクトで見つけることができます- 彼とは、この話題について何度も話し合いました。)

しかしながら、ツール類に成熟と力があってますます発展しそうであり、そして多くのデータは小さいという事実から、私たちはこのアプローチは非常に魅力的であると考えています。

パターン

パターンの本質は次のとおりです:

  1. 行指向のテキスト、および特にCSV(*1)(コンマ区切り変数)ファイルとしてデータを格納すること。「行指向のテキスト」は、テーブルの列(あるいは個別のセル)のようなデータの個々の単位が1行(*2)に相当することを単に示します。
  2. データを格納し管理するのにGit やMercurial のように最適な種類(すなわちコード)のバージョン管理を使用してください。

GitMercurial のような強力な分散型バージョン管理ツールがそれによって有効に(なぜなら、それらのツールはたいてい行(ライン)指向のテキストであるコードのために構築されるからです)動作することができるので、行指向のテキストは重要です。しかしながら、それは単なるバージョン管理ではありません:これらの種別のファイル(grepからエクセルまで!)を管理し操作するためのツールには多数の、こなれたセットがあります。

基礎的なパターンに加えて、追加できる、いくつかの特別オプションがあります:

  • GitHub(やGitorious、あるいはBitbucket等々)にデータを格納する。下記の全ての例はこのアプローチをとっています。
  • datapackage.jsonファイルを加えて、集めたデータをSimple Data Format のデータ・パッケージに変えます。これはライセンス、出所およびスキーマ(このカラムは数字、これは文字列)といった不可欠な情報の小さなセットを提供します。
  • データの処理と管理に使ったスクリプトを加えてください。このようにして、あらゆるものがひとつのリポジトリにうまくまとまります。

このアプローチの何が良いのでしょうか?

行指向のファイルの管理および操作のために存在する、ツールのセットは巨大で成熟しています。特に、GitMercurial のような強力な分散バージョン管理システムは、既にコード周りの分散型でピア・ツー・ピアの共同作業を行うための非常に堅牢な方法であり、このパターンはそのモデルをとり、それをデータに適用可能にします。ここに、なぜそれが良いのか、いくつかの具体的な例があります。

出所のトラッキング

Git とMercurial はコミットメッセージとdiff(差分)によって、個々の貢献の完全な履歴を提供します。

コミットメッセージの例

ピア・ツー・ピアの共同作業

データをフォーク(分岐)したり、プル(取り込み)することは、個々の貢献者がそれに関して同時に作業することを可能にします。

プル・リクエストのタイムライン

データのレビュー

Git やMercurial の使用によって、コードレビュー用ツールは、データ調査のために転用することができます。

プル・スクリーン

シンプルなパッケージング

リポジトリ・モデルは、単一の場所にデータ、コードおよびメタデータを格納する、シンプルな方法を提供します。

データ用のリポジトリ

アクセシビリティ

このようなデータ格納および、バージョン管理手法は非常にローテクなものです。フォーマットとツールは両方とも非常に成熟していてユビキタスです。例えば、すべてのスプレッドシートおよびすべてのリレーショナル・データベースはCSVを扱うことができます。すべてのunixプラットフォームにはこれらの種類のファイルに使えるgrep、sed、cut のようなツール一式があります。

私たちは、このアプローチと共に長い間使用しています:2005年、私たちは最初にSubversion そして次にMercurial にCSVを格納しました。次に、3年前にGit(そしてGithub)に切り替えた時、私たちはそこに格納し始めました。2011年に、私たちは上記のパターンによって管理されたデータセットの全体のリストを含んでいるGithub 上でデータセットの組織化を始めました。ここに、いくつか具体例があります:

メモ:ほとんどのこれらの例はGithub 内で管理されているCSVを示すだけでなく、同時にシンプル・データ形式データ・パッケージです。-その中にあるdatapackage.json を参照してください。

付録

制限と選択肢

行指向のテキストおよびそのツールはもちろんデータ保存およびバージョン管理に対する完全な解決策からはほど遠いものです。それらはすべての形およびサイズのデータセット用には動作しません。また、いくつかの点で、それらは、表形式のデータへの変更を追跡しマージするには厄介なツールです。例えば:

  • 行指向のテキストとして保存されたデータ上の単純な操作が非常に大きな変更セットにつながる場合があります。例えば、2つの項目(=カラム)の順序の入れ替えはすべての行の変更につながります。diff(差分)、マージ等が行指向だとすれば、これは不幸なことです(*3)。
  • それは、小さめのデータ(例えば<100k の列、<50mb のファイル、最適なのは<5mb のファイル)に対していちばんうまく動作します。Git とMercurial は、大きなファイルの扱いはさほどうまくなく、diffのような機能はより大きなファイル(*4)ではさらに厄介になります。
  • それは、多くの同じ記録(理想的には表形式のデータ)から構成されたデータにとっていちばんうまく動作します。行指向のストレージと適切なツールのためには、行指向のCSV構造に適したデータのレコード構造を必要とします。あなたのCSVがあまり行指向で無い(例えば、項目内に多数の改行がある)場合、diffやマージで問題を引き起こすので、パターンはそれほどよくありません。
  • CSVは多くの情報、例えば項目(全て文字列です)の種別についての情報を欠いています。
    その単純性を危険にさらしたり、純粋なデータとしての利用がもはやできなくなることを犠牲にせずに、メタデータをCSVに加える方法はありません。しかしながら、個別のファイル内にこの種の情報を追加することができます。それこそデータ・パッケージ標準がそのdatapackage.jsonファイルで提供するものです。

最も基本的な制限は、とりわけ行指向のdiff とマージの、その原子単位が行でない(それはセル、あるいは何らかの2カラムを入れ替えるような変換)構造データへの適用で発生します。

下記で議論されている最初の問題は、テーブルへのシンプルな変更がファイルの全行への変更として扱われる、明確な事例です。完璧な世界であれば、便利な構造とそれをサポートする強健なツールの全体セットの両方があるでしょう。例えばCSVの2カラムの入れ替えをシングルの単純な変更と認識する、あるいは個々のセルのレベルで機能するツールです。

基本的に、リビジョンシステムはdiff フォーマットおよびマージプロトコルの周辺に構築されます。これらを正しくすれば、残りの多くは後からついてきます。基本的な3つの選択肢は次のとおりです:

  1. 行指向のテキストにシリアライズしてGit のような偉大なツールを利用(上述の通り)。
  2. 原子構造(例えば文書)を識別し、そのレベル(CouchDB やRDBMS のための標準的な列レベルでの copy-on-write(書き込みの都度コピーする)を考えてください)でdiff を適用する。
  3. 変換を記録する(例えば、リファイン)。

オープン・ナレッジ財団では、私たちは、2.のラインに沿ったシステムを構築しました、また2.と3.の両方の調査および研究に関係しています – dataprotocols.org 上のデータのための変更および同期を参照してください。これらの選択肢は絶対に詳しく調査する価値があります – また、例えば、マックス・オグデン(彼と私はこの話題に関して多くの大きな議論をしています)は、Dat と呼ばれる刺激的なプロジェクト(「スリープ」プロトコルを使用する共同的なデータ・ツール)に現在取り組んでいます。

しかしながら、ここまでの私たちの経験は、行指向のアプローチがそれらの他の行(少なくともより小さなサイズのファイル用の!)に沿ったどんな現在利用可能なオプションにも打ち勝つということです。

data.okfn.org

数年間このようにGithubにデータを格納してきて、私たちは最近 http://data.okn.org/ をローンチしました。それは明示的にこのアプローチに基づいています:

  • データは https://github.com/datasets のGitHub上のGit リポジトリに格納されたCSVです。
  • データセットはすべてdatapackage.json のメタデータを持つデータ・パッケージです。
  • フロント・エンド・サイトは、非常に単純です – 単にカタログとAPIを提供し、Githubからデータを直接プルします。

なぜ、行指向なのか

行指向のテキストはコードの自然な形式で、したがって巨大な数の優れたツールがサポートしています。しかし、行指向のテキストは、一般的なレコード指向のデータを格納するための最もシンプルで簡潔な形式であり、たいていのデータはレコードになることができます。

最も基礎的な構造化データには、項目用の区切り文字およびレコード用の区切り文字が必要です。コンマまたはタブ区切り値(CSV、TSV)ファイルはこの符号化の非常に単純で自然な実装です。それらは、スペース、改行に加えて最も自然な区切り文字でレコードを区切ります。項目区切り文字として、スペースはあまりに一般的すぎるので、自然とコンマまたはタブに頼ることになります。

バージョン管理システムには、動作の原子単位が必要です。データ用のバージョン管理システムは、とても有効に原子単位としてレコードを扱うことができます。行指向のテキストをレコード指向のデータの符号化に使用することで、私たちはレコード指向のコードのバージョン管理のために構築された既存ツールの形式でバージョン管理システムを自動的に得られます。


  • (*1)ファイル中の区切り文字は必ずしもコンマである必要はないので、CSVという場合に、実際は「DSV」を意味するということに注意してください。しかしながら、列終端は改行(あるいはキャリッジリターンと改行)であるべきです。
  • (*2)CSVにはひとつの行にひとつの列があるとは限りません。引用符のある項目に改行があることがあります。しかしながら、ほとんどのCSVはひとつの列にひとつの行です。CSVは入手可能な中では、可能な限り単純な構造化データ形式です。
  • (*3)具体的な例として、マージ機能は、レコードの様々なセット、すなわち行に影響する2つの変更セットの調和においておそらくとてもうまく動作するでしょう。しかしながら、各々カラムを移動させる2セットの変更はうまくマージしないでしょう。
  • (*4)より大きなデータについては、私たちは、Git(そして例えばGitHub)をs3のような単純なファイル記憶装置と交換することを提案します。s3が基礎的なcopy-on-writeのバージョン管理をサポートできることに注意してください。しかしながら、copy-on-writeであるため、それは相対的にかなり非効率です。

原文(2013/7/2 Open Knowledge Foundation Blog 記事より):
Original post Git (and Github) for Data / Rufus Pollock, licensed under CC BY 3.0.

okfj

by okfj

オープンデータをスケールさせる9つのモデル – 過去、現在そして未来

2014年3月29日 in Featured, Special

(訳注:この記事は本家OKFn.org記事の日本語訳です)

Golden spiral, by Kakapo31 CC-BY-NC-SA

オープンデータの可能性はこの10年間私たちを魅惑しています。

私はTheyWorkForYou のようなサイトを構築することで、政府を実際に利用可能なものにしたいと思いながら過ごしてきました。

しかし、そのような興奮は最終的には重要なことではありません。

重要なのはスケール(規模の拡大)です。どのような組織構造がこの運動を爆発的に加速させるでしょうか?

自律成長しているボランティア・コミュニティを作ることによってでしょうか、あるいは資金フローを作り出すことによってでしょうか?

この投稿は、機能しているものも(まだ)機能していないものも含め、手短にそして挑発的に俯瞰します。

現在機能しているもの

1) 新しいデータを登録するためにコミュニティを形成する。OpenStreetMapMusicBrainz は2つの大きな事例です。これが機能するのはコミュニティがデータの発生源であるからです。しかしながら、これまでのところどちらも私が思ったほどにはその産業の支配力を持っていません。

2) オープンデータの上流側の生成者にツールを売る。これは、中央政府のためにCKAN が行っている(そして新しいScraperWiki のCKAN ツールが支援している)ことです。これはmySociety が行っていることであり、FixMyStreet のインストール一式を地方自治体に売る場合は、その結果としてRSSフィードで道路の陥没を公表します。

3) オープンデータを(ひっそりと)利用。あらゆる組織がこれを行っていますが、決してそのことを話しません。これはブルームバーグのような全く古いデータ再販業者の鍵です。これはScraperWiki のプロフェッショナル・サービスの顧客のうちのほとんどが私たちに依頼するものです。社会に対する価値は巨大で目に見えません。大きな欠点は、それがオープンデータの供給をスケールさせるのを支援しないということです。

4) 下流側の利用者にツールを売る。これは必ずしもオープンデータに固有の話ではありません。スプレッドシートやビジネス・インテリジェンスのような既存のソフトウェアはオープンなあるいはクローズドなデータと共に使用することができます。多くのオープンデータがウェブ上にあります。したがって、ウェブ・データをうまく使える新しいScraperWiki のようなツールは特にこれに適しています。

まだ機能していないもの

5) 協働的なキュレーションScraperWiki が、スクレイピング用のコードの編集に基づいてオープンデータ・キュレーション・コミュニティを作る大胆な試みとして始められました。その最初の形式(今後はScraperWiki クラッシックと呼びます)では、これはスケールしませんでした。なぜそれはスケールしなかったのか、ここに、オープンデータモデルの点から、いくつかの理由があります。

a. それは上流側ではありませんでした。あなたがいかなる出所を与えても、人々は自分が直接出所から取得するデータを最も信頼します。例えば、スクレイピングされたデータを電話を使って、手動で集められた新しいデータで補うことなどによって、これは部分的に上流側になることもできます。

b. それは内密なものではありません。理論的には、商品のデータも一緒になって公開で議論することで得るべきものは多数ありますが、それはほとんどの組織の本能に反します。

c. 既存の文化はそう多くはありません。フリー・ソフトウェア運動は、約15年後にオープン・ソース運動によって、そして25年後にGithubのようなツールによって開発準備が整った協働の豊かな文化を構築しました。少数の例外(特にOpenCorporates)を除いて、まだオープンデータのキュレーションプロジェクトはありません。

6) 多目的のデータ市場(特に主としてオープンデータを再利用しているもの)はまだ立ち上がっていません。いつかはできるかもしれませんが、それにはまずデータの整形や同期のためのうまく採用された、より高レベルの標準(おそらくCSVファイルを基にしたdat のようなもの)がまず必要だと思います。

これからが期待されるもの

今後、多数の輩出が期待される、すばらしく刺激的なモデルです。

7) 上流側に労働/金銭を与えて、よりよいデータの作成を支援する。これは全く新しいものです。その唯一かつ最も優雅な例は英国の国立公文書館の制定法データベースのキュレーティングです。彼らは、商用の法令関連出版社と政府の他の部分から支持されたスタッフの助けを借りて仕事をします。

これは人々が最も信頼し、データの品質を改善する最大の能力を持っている上流側に金銭を生み出すので、賢明なやり方です。

8) バイラルなオープンデータのライセンス設定。MySQLは、組込システム・メーカーにGPLdソフトウェアのプロプライエタリなデュアル・ライセンスを提示することで、この種のやり方として多大な利益を出しました。データでは、これにOKFNのOpen Database License を使用することができるでしょう。オープンデータを自分のクローズドデータと混ぜたい場合に、組織はお金を払うでしょう。私はこれを積極的に利用している人は知りませんが、OpenCorporates のクリス・タガートは数年前に私にこのモデルを教えてくれました。

9) 株式会社が、戦略的優位性のためにデータをリリースする。会社は戦略的な利得のために自らのデータの公開を始めています。これは非常に新しいもので、これからがより期待できます。

何か見逃していますか?あなたはオープンデータをスケールさせ、何10億もの利益をもたらすのはどんなモデルだと思いますか?

原文(2013/7/18 Open Knowledge Foundation Blog 記事より):
Original post 9 models to scale open data – past, present and future / Francis Irving, licensed under CC BY 3.0.

okfj

by okfj

オープン・タックス・データか、あるいは単なるVATの「オープン・ウォッシュ」か

2014年3月28日 in Featured, Special

(訳注:この記事は本家OKFn.org記事の日本語訳です)

この投稿は、世界の会社の中で最大のオープン・データベースであるオープンコーポレーツの共同創設者兼CEO、およびオープン・ガバメント・ワーキンググループのメンバーであるクリス・タガートによるものです。

[告知:私は英国税透明性委員会に所属し、まだこれらの提案については議論していませんが、9月前半の次の会合ではその予定です]

1週間ちょっと前に、英国歳入関税委員会(HMRC)は、そのデータをより広く公表することについてのコンサルテーションを公表し、その中でオープンデータ運動に参加する意図を述べました。

英国は、G8のオープンデータ憲章の制定を支援しました。もしそれを留保する十分な理由がなければ政府が持つデータが公衆に利用可能となるだろうと考えられます。HMRCがあらゆる部分で役割を果たすことは重要です。HMRCのビジネスと個人との関係はユニークで、これはHMRCが納税者を代表して収集、作成、保護する情報の範囲と深さに反映されています。

素晴らしい。しかしノーです。

問題は、上述の内容にもかかわらず、このコンサルテーションとその中の提案は、オープンデータやアクセスの拡張に関わる部分はほとんど無く、代りに主としてデータを選別された少数に渡すことに関する内容で、その多くは普通の人々や関連する個人のデータです。さらに、それは、政府内の警報ベルを鳴らしているはずのHMRCの内でいくつかの懸案となっているデータ関連の問題を白日の下にさらします。

それでは、正確には何が提案されているでしょうか?2つの部分があります:

  1. HMRCのデータ(特に収集され、匿名化されたデータ)の共有に関する提案。現時点では、たとえそれが広く公益に資するものであっても、HMRCの機能に関係がある場合のみ、HMRCは一般にそのようなデータを共有することができます。
  2. VAT登録関連の提案。VAT登録(訳注:VAT(付加価値税)の課税に関わる登録情報。登録番号の有無で課税方法が変わる。詳細はこちらを参照)は現在プライベートの扱いです。たとえ、情報の大半がレシート上、請求書上、ウェブサイト上、そして様々な個人のデータセットの中など、「そこに出ている」としても。実際のところこれは、多くの国々で既に公開されています。

どちらもそれぞれの問題を抱えていますが、いったん私たちは2番目に専念します。

郵便番号住所ファイル、会社登記簿、あるいは英国陸地測量部データなどとは異なり、オープンデータの活動家からのVAT登録に対する大きな要求の声はありませんでした。そうすると、なぜそれはオープンになっているのでしょうか?さて、なぜ駄目なのか、コンサルテーションは次のように述べています:

本章中の提案の開発における根本原理はShakespeare Review の中で明らかにされています。データは市民のものであり、害悪を引き起こさない限り、政府の判断はオープン化の方向へと向かうでしょう。この好機の性質を述べるのは政府のためではありません。その結論は下の引用が示しているように、政府が潜在的利益の範囲や規模に必ずしも気づくとは限らないであろうということです。このコンサルテーションは、これらの確立を支援するでしょう。

したがって、提案はVAT登録をオープンデータとして公表するというものです。その結果、より広いコミュニティーが、その番号を使ってすばらしいものを作ることができるでしょうか?いいえ。そのコンサルテーションは、何かしら薄汚れたところのある部分を高尚な目標から巧妙に省略します。

利益を生み出す資源としてのVAT登録データの公表において、例えば信用格付け機関(CRA)からの公益が暫くの間ありました。

3つの大きな信用格付け機関(Experian 、Equifax およびCallcredit)は、会社について多くのことを知っているのではありませんか?きっと、彼らはその多くのVAT番号を知っており、どの場合でもたいていの会社、特に活発な貿易商社(VAT用に登録される種類)についてもっと多くのことを知っているのではありませんか?

しかしながら、彼らに無いものは(付随する情報の公表に対する責任を負いながら自らの自己勘定上で、そして有限責任の保護なしで取り引きする)個人事業主や小さなパートナーシップや個人に関する多くの情報です。そのため、VAT登録は彼らにとって非常に重要で、それはこのコンサルテーションが彼らに与えるこをを提案しているものです。

もちろん、彼らはその情報をただ単に人々に求めることができました。しかし、特に彼らがお金を借りる必要がない場合、人々は拒絶するかもしれません。そして、マネタイズ可能なそのデータセットの構築に関する限り、それは問題となる可能性があります。単に政府がそのデータへのアクセスを彼らに与えるようにできた場合、つまり情報の提供を強いる法律の力で、自分自身のデータ収集用の腕として政府を働かせる場合、それは素晴らしいことでしょう。彼らにとって。個人およびより広い世界にとって、それは全く良いことではありません。

第一に、私たちがここで話しているものが個人(彼らはプライバシーとデータの保護の権利を持っている)であり会社では無いので、まず第一にそれを公開する強制的な理由が必要です。大きな3つの信用格付け機関すなわちCRA(Experian、Equifax、CallCredit)が、そこからお金が稼げると考えるだけでは十分には良い訳ではありません。

第二に、もしオープンデータがひとつのことについてのものだとすれば、データへのアクセスを民主化することに関するものであり、チャンセラーやジョージ・オズボーンの言葉を借りると「世界の情報へのアクセスやそれと対話する能力は少数のエリートによってコントロールされていた」従来の位置を逆にすることに関わるものなのです。また、ひとつ確かなものがあるとすれば、CRA は多くの力を持っている、ということです。

でもちょっと待ってください。コンサルテーションも、さらにVAT登録のうちのいくつか、とりわけ「単に3つのデータ項目をカバーする非常に選択的な抜粋として、VAT登録番号(VRN)、取引名および標準の業種コード(SIC)分類番号」がオープンデータとして公表されることを提案しているのではありませんか?

一見して、これは良いこと、あるいは無いよりはましと見なされているかもしれません。実際のところ、これはHMRCがデータを取得しないことを示しているか、あるいは、それは単に「openwash(訳注:みせかけのオープン)」です。CRAへの個人のそしてプライベートなデータの卸し売りを人目につかなくさせるオープンデータのイチジクの葉(訳注:恥ずかしいものを隠すもの)であり、より大きな不正行為に潜在的に結びつくかもしれないものです。これがその理由です:

  • 3つの項目(VAT番号、取引名、SICコード)は、ともに孤立したデータセット、つまり他のデータとつながっておらず、したがって、もしあなたが自分を「AAA 配管工事」と呼んで請求書を不正に書き、それにVATを課し、20%をポケットに入れて、自分が決して逮捕されれないのか、それとも本当のAAA 配管工事が最初にHMRCが見に来る場所なのかを知る、といったことをしたくなければ基本的に無意味であるものを構成しています。不正行為は、基本的に情報の流れの不均衡に関係しています。(詐欺師は、あなたが彼らについて知っている以上に、あなたのことを知っています)例えば、実際のAAA 配管工事が例えばスコットランドのカーコーディーに本拠地を持つ会社であることを知っていたり、あるいはBBBサービスが解散しているのか、それが航空機ビジネスで働くことを示すウェブサイトがあるということを知っていれば、不正行為を回避するはるかに大きなチャンスがあります。
  • 取引する名前は非常に問題で、たいていどこにも登録されておらず、そのため支援もほとんどありません。さらに、個人、会社のどちらでも、法的な名前との関係がある必要がありません。したがって、ZZZ金融専門家の背後の会社を見つけたければ、実際にひとつでもある場合、あなたには幸運が不足していると言わざるを得ません。HMRCが法的形式(会社の場合には、会社番号)無しでVAT登録の公表を考慮することすらはっきりしません。
  • さらに、登録を公表するための公開された理由のうちのひとつは、「VAT登録データは個人部門のビジネス登録のための基礎を提供することもできるだろう」ということです。本当でしょうか?オープンデータの世界および中核となる参照データの重要性において、HMRCは、プライベートな、プロプライエタリな識別子のセットが、それに伴うあらゆる問題と共に作成されることを望むでしょうか?実際、HMRCはビジネス、革新&スキル部門と協力してこのような公共データセットを構築すると思われました。これを行うほどには十分によくデータを理解していないということは決定したのでしょうか?あるいは、政府だけでなく、民間セクター全体としてむしろそのようなデータセットに縛り付けることになるでしょうか。
  • 最後に、VAT登録が会社の設立日およびSICコードのような項目を含むように見えることを発見することもやや驚くべきことです。ギークの世界では、私たちは、別のテーブルあるいはデータセットに正当に属するものを複製したデータであるという意味で、これを非正規化されたデータセットと呼びます。これを行うのに十分な理由がある場合もあります。しかし、同期(VAT登録やCompanies House record上にあるものと、どちらが正しいSICコードなのか)から外れるデータとなる危険性があります。

それでは、HMRCは何をするべきでしょうか?第一に、信用格付け機関のデータ収集者として働くあらゆる計画を放棄し、VAT登録、あるいはVAT登録の一部を単一のオープンなデータセットとして、同じ条件下のあらゆるものと等しく公表すべきです。これは革新への純粋な刺激になり、競争と透明性の促進という結果さえも生み出すかもしれません。

第二に、個人(人権を持ち、生活し、呼吸している人)と会社の間には基本的な違いがあることを理解するべきです。人権と同様に、個人はそのデータの保護権やプライバシー権を持っており、公的な登録上には存在しません。いっぽう会社は、社会の利益のための状態によって別個の法人格を与えられた人工的な実体で、代わりに公的に(公の会社登記上で)存在します。VAT登録の場合には、実用的なアプローチは会社に関係のある部分だけオープンデータとして登録を公表することでしょう。

第三に、基本的にデータビジネスの中であることを理解する必要があります。また好むと好まざるとに関わらず、良いことや悪いことのためのデータの力を含め、現代のデータの世界にすばやく取り組む必要があります。英国は、オープンコーポレイツオープン・ナレッジ財団およびオープン・データ・インスティテュートを含め、おそらくこの領域において世界で指導的な組織を持っています。

原文(2013/7/30 Open Knowledge Foundation Blog 記事より):
Original post Open tax data, or just VAT ‘open wash’ / Chris Taggart, licensed under CC BY 3.0.