You are browsing the archive for プライバシー.

okfj

by okfj

オープン・タックス・データか、あるいは単なるVATの「オープン・ウォッシュ」か

2014年3月28日 in Featured, Special

(訳注:この記事は本家OKFn.org記事の日本語訳です)

この投稿は、世界の会社の中で最大のオープン・データベースであるオープンコーポレーツの共同創設者兼CEO、およびオープン・ガバメント・ワーキンググループのメンバーであるクリス・タガートによるものです。

[告知:私は英国税透明性委員会に所属し、まだこれらの提案については議論していませんが、9月前半の次の会合ではその予定です]

1週間ちょっと前に、英国歳入関税委員会(HMRC)は、そのデータをより広く公表することについてのコンサルテーションを公表し、その中でオープンデータ運動に参加する意図を述べました。

英国は、G8のオープンデータ憲章の制定を支援しました。もしそれを留保する十分な理由がなければ政府が持つデータが公衆に利用可能となるだろうと考えられます。HMRCがあらゆる部分で役割を果たすことは重要です。HMRCのビジネスと個人との関係はユニークで、これはHMRCが納税者を代表して収集、作成、保護する情報の範囲と深さに反映されています。

素晴らしい。しかしノーです。

問題は、上述の内容にもかかわらず、このコンサルテーションとその中の提案は、オープンデータやアクセスの拡張に関わる部分はほとんど無く、代りに主としてデータを選別された少数に渡すことに関する内容で、その多くは普通の人々や関連する個人のデータです。さらに、それは、政府内の警報ベルを鳴らしているはずのHMRCの内でいくつかの懸案となっているデータ関連の問題を白日の下にさらします。

それでは、正確には何が提案されているでしょうか?2つの部分があります:

  1. HMRCのデータ(特に収集され、匿名化されたデータ)の共有に関する提案。現時点では、たとえそれが広く公益に資するものであっても、HMRCの機能に関係がある場合のみ、HMRCは一般にそのようなデータを共有することができます。
  2. VAT登録関連の提案。VAT登録(訳注:VAT(付加価値税)の課税に関わる登録情報。登録番号の有無で課税方法が変わる。詳細はこちらを参照)は現在プライベートの扱いです。たとえ、情報の大半がレシート上、請求書上、ウェブサイト上、そして様々な個人のデータセットの中など、「そこに出ている」としても。実際のところこれは、多くの国々で既に公開されています。

どちらもそれぞれの問題を抱えていますが、いったん私たちは2番目に専念します。

郵便番号住所ファイル、会社登記簿、あるいは英国陸地測量部データなどとは異なり、オープンデータの活動家からのVAT登録に対する大きな要求の声はありませんでした。そうすると、なぜそれはオープンになっているのでしょうか?さて、なぜ駄目なのか、コンサルテーションは次のように述べています:

本章中の提案の開発における根本原理はShakespeare Review の中で明らかにされています。データは市民のものであり、害悪を引き起こさない限り、政府の判断はオープン化の方向へと向かうでしょう。この好機の性質を述べるのは政府のためではありません。その結論は下の引用が示しているように、政府が潜在的利益の範囲や規模に必ずしも気づくとは限らないであろうということです。このコンサルテーションは、これらの確立を支援するでしょう。

したがって、提案はVAT登録をオープンデータとして公表するというものです。その結果、より広いコミュニティーが、その番号を使ってすばらしいものを作ることができるでしょうか?いいえ。そのコンサルテーションは、何かしら薄汚れたところのある部分を高尚な目標から巧妙に省略します。

利益を生み出す資源としてのVAT登録データの公表において、例えば信用格付け機関(CRA)からの公益が暫くの間ありました。

3つの大きな信用格付け機関(Experian 、Equifax およびCallcredit)は、会社について多くのことを知っているのではありませんか?きっと、彼らはその多くのVAT番号を知っており、どの場合でもたいていの会社、特に活発な貿易商社(VAT用に登録される種類)についてもっと多くのことを知っているのではありませんか?

しかしながら、彼らに無いものは(付随する情報の公表に対する責任を負いながら自らの自己勘定上で、そして有限責任の保護なしで取り引きする)個人事業主や小さなパートナーシップや個人に関する多くの情報です。そのため、VAT登録は彼らにとって非常に重要で、それはこのコンサルテーションが彼らに与えるこをを提案しているものです。

もちろん、彼らはその情報をただ単に人々に求めることができました。しかし、特に彼らがお金を借りる必要がない場合、人々は拒絶するかもしれません。そして、マネタイズ可能なそのデータセットの構築に関する限り、それは問題となる可能性があります。単に政府がそのデータへのアクセスを彼らに与えるようにできた場合、つまり情報の提供を強いる法律の力で、自分自身のデータ収集用の腕として政府を働かせる場合、それは素晴らしいことでしょう。彼らにとって。個人およびより広い世界にとって、それは全く良いことではありません。

第一に、私たちがここで話しているものが個人(彼らはプライバシーとデータの保護の権利を持っている)であり会社では無いので、まず第一にそれを公開する強制的な理由が必要です。大きな3つの信用格付け機関すなわちCRA(Experian、Equifax、CallCredit)が、そこからお金が稼げると考えるだけでは十分には良い訳ではありません。

第二に、もしオープンデータがひとつのことについてのものだとすれば、データへのアクセスを民主化することに関するものであり、チャンセラーやジョージ・オズボーンの言葉を借りると「世界の情報へのアクセスやそれと対話する能力は少数のエリートによってコントロールされていた」従来の位置を逆にすることに関わるものなのです。また、ひとつ確かなものがあるとすれば、CRA は多くの力を持っている、ということです。

でもちょっと待ってください。コンサルテーションも、さらにVAT登録のうちのいくつか、とりわけ「単に3つのデータ項目をカバーする非常に選択的な抜粋として、VAT登録番号(VRN)、取引名および標準の業種コード(SIC)分類番号」がオープンデータとして公表されることを提案しているのではありませんか?

一見して、これは良いこと、あるいは無いよりはましと見なされているかもしれません。実際のところ、これはHMRCがデータを取得しないことを示しているか、あるいは、それは単に「openwash(訳注:みせかけのオープン)」です。CRAへの個人のそしてプライベートなデータの卸し売りを人目につかなくさせるオープンデータのイチジクの葉(訳注:恥ずかしいものを隠すもの)であり、より大きな不正行為に潜在的に結びつくかもしれないものです。これがその理由です:

  • 3つの項目(VAT番号、取引名、SICコード)は、ともに孤立したデータセット、つまり他のデータとつながっておらず、したがって、もしあなたが自分を「AAA 配管工事」と呼んで請求書を不正に書き、それにVATを課し、20%をポケットに入れて、自分が決して逮捕されれないのか、それとも本当のAAA 配管工事が最初にHMRCが見に来る場所なのかを知る、といったことをしたくなければ基本的に無意味であるものを構成しています。不正行為は、基本的に情報の流れの不均衡に関係しています。(詐欺師は、あなたが彼らについて知っている以上に、あなたのことを知っています)例えば、実際のAAA 配管工事が例えばスコットランドのカーコーディーに本拠地を持つ会社であることを知っていたり、あるいはBBBサービスが解散しているのか、それが航空機ビジネスで働くことを示すウェブサイトがあるということを知っていれば、不正行為を回避するはるかに大きなチャンスがあります。
  • 取引する名前は非常に問題で、たいていどこにも登録されておらず、そのため支援もほとんどありません。さらに、個人、会社のどちらでも、法的な名前との関係がある必要がありません。したがって、ZZZ金融専門家の背後の会社を見つけたければ、実際にひとつでもある場合、あなたには幸運が不足していると言わざるを得ません。HMRCが法的形式(会社の場合には、会社番号)無しでVAT登録の公表を考慮することすらはっきりしません。
  • さらに、登録を公表するための公開された理由のうちのひとつは、「VAT登録データは個人部門のビジネス登録のための基礎を提供することもできるだろう」ということです。本当でしょうか?オープンデータの世界および中核となる参照データの重要性において、HMRCは、プライベートな、プロプライエタリな識別子のセットが、それに伴うあらゆる問題と共に作成されることを望むでしょうか?実際、HMRCはビジネス、革新&スキル部門と協力してこのような公共データセットを構築すると思われました。これを行うほどには十分によくデータを理解していないということは決定したのでしょうか?あるいは、政府だけでなく、民間セクター全体としてむしろそのようなデータセットに縛り付けることになるでしょうか。
  • 最後に、VAT登録が会社の設立日およびSICコードのような項目を含むように見えることを発見することもやや驚くべきことです。ギークの世界では、私たちは、別のテーブルあるいはデータセットに正当に属するものを複製したデータであるという意味で、これを非正規化されたデータセットと呼びます。これを行うのに十分な理由がある場合もあります。しかし、同期(VAT登録やCompanies House record上にあるものと、どちらが正しいSICコードなのか)から外れるデータとなる危険性があります。

それでは、HMRCは何をするべきでしょうか?第一に、信用格付け機関のデータ収集者として働くあらゆる計画を放棄し、VAT登録、あるいはVAT登録の一部を単一のオープンなデータセットとして、同じ条件下のあらゆるものと等しく公表すべきです。これは革新への純粋な刺激になり、競争と透明性の促進という結果さえも生み出すかもしれません。

第二に、個人(人権を持ち、生活し、呼吸している人)と会社の間には基本的な違いがあることを理解するべきです。人権と同様に、個人はそのデータの保護権やプライバシー権を持っており、公的な登録上には存在しません。いっぽう会社は、社会の利益のための状態によって別個の法人格を与えられた人工的な実体で、代わりに公的に(公の会社登記上で)存在します。VAT登録の場合には、実用的なアプローチは会社に関係のある部分だけオープンデータとして登録を公表することでしょう。

第三に、基本的にデータビジネスの中であることを理解する必要があります。また好むと好まざるとに関わらず、良いことや悪いことのためのデータの力を含め、現代のデータの世界にすばやく取り組む必要があります。英国は、オープンコーポレイツオープン・ナレッジ財団およびオープン・データ・インスティテュートを含め、おそらくこの領域において世界で指導的な組織を持っています。

原文(2013/7/30 Open Knowledge Foundation Blog 記事より):
Original post Open tax data, or just VAT ‘open wash’ / Chris Taggart, licensed under CC BY 3.0.

okfj

by okfj

オープンデータのプライバシー

2014年3月27日 in Featured, Special

(訳注:この記事は本家OKFn.org記事の日本語訳です)

「はい、政府は他の人々のデータをオープンにすべきです」

伝統的に、オープン・ナレッジ財団は個人に関わらないデータをオープンにする活動をしてきました。公的機関からの受託研究論文、財政支出データといったものです。個人のデータが国勢調査のような何らかの共有されたデータセットの一部である場合、個人のプライバシーが保護され、公表された集計データは共有され、公共の資産であることを保証するために、大量の検討や努力がなされました。

しかし時代は変わります。政府や企業が集めるデータは次第に増えつつあります。(本人がそれに気付いているかどうかに関わらず)個人に関わる大量のデータです。データの収集と共有によるプライバシーへのリスクは恐らく以前よりも大きくなっています。データが「ビッグ」か「スモール」かに関わらず、データ解析はこれまでに無い洞察を導き出す可能性を持っています。しかしながら、個別のデータセットが連結されたり、対応付けられたりするので、その洞察の中には個人のプライバシーを犠牲にするものがあるかもしれません。

Medical data loss dress

オープンデータおよびビッグデータの両方とも今ちょうどホットな話題です。そしてこのような時に、組織はあらゆる問題についての必要な検討を行うこと無しに、そのような話題に関係したいという誘惑に駆られがちです。ビッグデータの現在の潜在成長力とオープンデータの経済的便益を組み合わせる誘惑によってプライバシーへの関心が無視されるかもしれないので、ビッグデータとオープンデータの交差は多少気懸かりな点です。プライバシー・インターナショナル開発のためのデータに関する最近の記事でこの点に注意を促していることは正しいのですが、もちろん他の領域も影響を受けます。

本日(訳注:2013/8/27)、私たちはオープンデータとプライバシーに関して進みつつある議論を支援するために、いくつかの用語を提案したいと思います。

私たちのデータとは、個人の要素を持たず、共有物の意識が明確なデータです。例えば次のようなものです。バスは私の都市でどこを走っているのか、政府は私の税金を何に使うと決めたのか、国勢調査やその集計結果はどのように組み立てられているのか。オープン・ナレッジ財団において、私たちのデフォルトの立場は、私たちのデータがオープンデータであるべきということです。それは私たちがみな利益を得ることができ、またそうすべき共有資産です。

私のデータとは個人的な私に関する情報で、誰が集めたかに関わらず、何らかの方法で私のことを識別することができます。それは、私の直接の許可なしに他の人によってオープンにされたり公表されるべきではありません。しかし、それは、私(私は自分が望めば、利用可能な形式で私に関するデータにアクセスできるべきであり、それを私自身が共有する権利を持っているべきです)には「オープン」であるべきです。

変換されたデータとは個人に関する情報で、個人が識別可能な要素を除去するためにデータを匿名化、収集する努力が行われたものです。

Medical data loss dress

私たちは、変換されたデータが私たちのデータとしてオープンに公表できるかどうかを確認するために引き続き行う必要のある、いくつかの明確なステップが存在すべきだ、ということを提案します。どのような考察が行われるべきかを述べる、オープンデータ用のプライバシー原則のセットはよい出発点になるでしょう。そこには、データが関係しているすべてのグループの代表およびデータの変換方法にまつわるデータプライバシー専門家を含む重要なステークホルダーに意見を求めることなどが含まれるでしょう。いくつかのデータセットについては、市民のために合理的なレベルのプライバシーを維持することができるようにこれを十分に変換することが可能だとは、証明するのが難しいかもしれません。これらのデータセットはシンプルに非公開とすべきです。他のものについては、データがオープンに公表されるのに適している状態になる前に、受入れ可能なプライバシー標準を達成するために、変換に関してさらなる研究が必要だということかもしれません。データの公表が必須となる前に、リスクに対する保証は考慮され管理されます。変換が関係のある個人に十分なプライバシーを提供し、原則が厳守された場合、データはオープンデータとして公表することができます。

私たちは「私たちのデータ」のうちのいくつかは個人の要素を持つだろうと述べておきます。例えば、議会のメンバーは公共圏に入る肯定的な選択を行ない、議員に関する情報のいくつかを市民は漏れなく利用可能です。このタイプのデータは、比較する標準は公益とは異なるかもしれませんが、私たちが公開前に提案するオープンデータのプライバシー原則に照らして依然として考慮されるべきです。

これは、オープンデータおよびプライバシーの領域を調査するシリーズ投稿の一部です。私たちは、これは非常に重要な問題であると感じています。これらの問題に興味を持っているか、オープンデータ用のプライバシー原則の開発を支援したい場合は、ワーキンググループ・メーリング・リストに参加してください。私たちはメーリング・リスト、下記コメント欄等での提案や考察、もしくは私たちや一緒に作業しているオープン・ライツ・グループとの2013年秋のOKConや他のイベントでの意見交換を歓迎します。

原文(2013/8/27 Open Knowledge Foundation Blog 記事より):
Original post Open Data Privacy / Laura James, licensed under CC BY 3.0.