Captricityでやっかいな『紙問題』を解決

2013年1月10日 in Special


オープンデータにとって「紙問題」は頭痛の種です。倉庫にある昔作った書類もさることながら、毎日のようにやり取りされる膨大な量の紙を前に、途方に暮れてしまうこともあるのではないでしょうか。

Captricityはこうした「紙問題」を解決してくれます。Captricityによって手書きのアンケートや調査票などの個票をスプレッドシートに簡単に変換することができます。まず未記入のアンケートや調査票をイメージデータに変換し、Captricityにアップロードします。その後、デジタル化したい部分をマウスをドラッグして囲みます。複数の選択肢から選ぶチェックボックスなどにも対応しています。あとは記入済み個票のイメージデータをまとめてアップロードするだけです。一度に5万枚まで変換できますし、一回登録した個票を使って何度でもデジタル化できます。

出典:http://captricity.com/product-features/

文字認識には機械学習技術が使われています。文字はマシンで変換され、その結果を人が目視でチェックし、最後にもう一度マシンにかけて突合せるというトリプルチェックも行っています。目視チェックする人はMechanical Turkなどで雇われているようです。

出典:http://captricity.com/product-features/privacy/

Mechanical Turkなんてとんでもないと思うかもしれませんが、それが可能なのはShreddrというプライバシー保護技術を用いているためです。Shreddr技術によって個票のデータはバラバラにされ、データをチェックする人は個票の特定の部分しか見ることができません

例えば右図の例では、Worker 1はLastnameだけ、Worker 2はID numberだけをひたすらチェックします。社会保障番号は”AAA-GG-SSSS”という9桁の数字で表されますが、これについてもXさんはひたすら”AAA”を、Yさんは”GG”を、Zさんは”SSSS”をというように、元が何であったのかわからない状態でバラバラにされた上で目視チェックします。さらに、個票の中に誰にも見られたくないデータが含まれている場合には、その部分を囲んで黒く塗りつぶすこともできます

Captricityはクラウドサービスなのですぐに利用でき、気になるコストは1枚20セントほどです。モバイルアプリもあり、RESTful APIも提供されているので既存のシステムに組み込むこともできます。

Leave a reply

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

次のHTML タグと属性が使えます: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>

Tomihiko Azuma

Written by

Chief Fellow, Institute for International Socio-Economic Studies (株式会社国際社会経済研究所 主幹研究員)