アーロン・シュワルツの死とオープンデータについて

ちょっと前になりますが、RSSやReddit等にかかわった米国の開発者、ネット活動家であるアーロン・シュワルツ氏が26歳という若さで自殺をしたという衝撃的ニュースがありました(参考記事)。

自殺の理由は、JSTORという学術論文データベースから大量の電子文書を無断ダウンロードした疑いで逮捕・告訴され、重大な罰を受ける可能性が生じたことで心理的に疲弊してということであるとされています。ダウンロードの動機は「本来的にオープンであるべき学術論文情報の提供に対して対価を取り、しかもその収益が著者ではなく出版社に回っているのはおかしい」ということだったそうです。

権利者側(JSTOR)が和解し、告訴を取り下げているにもかかわらず、検察当局が公訴したことについては非難の声が聞かれています。公訴の当事者であるオーティズ検事を罷免せよとの陳情も寄せられているようです(ソース)。米国の著作権侵害が非親告罪であることの問題が露呈したとも言えます。

個人的な憶測ですが「公的情報は自由に公開すべき」というシュワルツ氏の思想はWikileaksのジュリアン・アサンジにも通じるものがあり、当局としては「危険思想」であり「お灸をすえる必要がある」と考えていたのはないかとも思えます。

ところで、JSTORの前にもアーロンシュワルツは同様な事件を起こしています。それは、以前にこのブログでも触れた(「裁判情報入手の日米ギャップについて」)米国の裁判所ドキュメント検索システムPACER(Public Access to Court Electronic Records)に関するものです。

PACERは米国の裁判記録をWebで網羅的に提供するシステムですが、1ページあたり10セント程度の料金がかかります。シュワルツ氏はこれはおかしいということで、PACERの無料試用期間中にスクリプトで大量の文書をダウンロードしてクラウドにアップロードしました。FBIの捜査対象になりましたが不起訴になっています。今でもPACERは課金をしていますが、RECAPというP2PベースのFirefox拡張機能により一度ダウンロードしたドキュメントは無料で見るための非公式の仕組みがあります(RECAP運営側は裁判記録は著作権の対象にならないことから合法であるとしています)。シュワルツ氏の思想が引き継がれていると言えます。

これも前に書きましたが、では日本はというと、裁判情報は確定判決の一部が裁判所のサイトで無償で公開されるものの、それ以外のほとんどの情報は実際に裁判所に行って閲覧するしかありません。コピーを取ることもできますが、その場合には係員に取ってもらう必要があり、1枚50円くらいの料金をとられるようです(シュワルツ氏だったら何と言ったでしょうか)。

結果的に裁判所サイトで入手できる以外の裁判情報を一般人が入手するためには、判例タイムズや判例時報などの「紙の本」に頼るしかありません(それもすべての判例ではありません)。日本では裁判記録を網羅的に入手して全文検索システムや分析システムを作ることは、今のところは事実上不可能です。

裁判記録は、国民の税金によって作られており、かつ、国民が知る権利があり(憲法82条1項)、著作権の対象でもありません(著作権法13条3項および40条1項)。したがって、(個人のプライバシー等特段の事由があるもの以外は)できる限り自由に公開すべきものです。

現在の日本のオープンデータの議論はすでに公開されている行政機関のデータを一カ所で提供するという点が中心になっているように思えます(もちろん、これもスタート地点としては重要です)が、最終的には裁判情報のオープン化というところまで突っ込んだ議論が行なわれることを期待します。

カテゴリー: オープンデータ, 著作権 | コメントする

【週末雑談】サムスンのスーパーボウルのCMについて

米国のスーパーボウル中継と言えばトップ企業が多大な予算をかけて印象に残るCMを作るので有名です。各企業のクリエイティビティの見せ所です。

歴史的な成功例としては、アップルによるジョージオーウェルの「1984」をベースにして企業コンピューティングの世界からユーザーを自由にするイメージを訴えたマッキントッシュの広告があります。失敗例としては、一昨年のGrouponのCMなどがあります(参考記事)。

私はスーパーボウル自体には全然興味がないですが、IT系の企業がどういうCMを出すのかには結構興味があります。

今年のサムスンの広告の予告編(本番で流すのとは別バージョン)がYouTubeにアップされています(参考記事)。権利関係にうるさい弁護士とCMプランナーの会議で、プランナーが商標ぽい言葉を口にするたびに弁護士が「訴えられますよ」と遮るという作りです。そして、San Francisco Forty-Niner’s をSan Francisco Fifty-minus-Oners等と言い換える羽目になるというギャグです。当然ですが、アップルに対する皮肉ととらえるべきでしょう。

キャプションがないのでちょっとヒアリングが厳しいですが、米国人の間では概ね好評のようです。

 

ネタにマジレスするのも何ですが、商標権とは商品に使う名前を独占できる権利なので、普通にその言葉を使うことが禁止されるわけではありません。アップルが商標的使用でないケースにまで商標権を行使してきたようなケースがあれば、アップルに対する当てこすりになるのですが、(少なくとも私の知る限り)そういうケースもそれに近いケースもないので、これで皮肉になるのかなあという気がします。

アップルに対する皮肉にするのならば、一般化した用語に対して商標権を主張するケース(Amazonに対するApp Storeの話(参考))や誰でも思いつきそうなデザインに対して意匠権を主張するケースなどを誇張しておもしろおかしく描いた方がよいと思うのですが、まあそこまでやるとやり過ぎ(裁判に影響も出かねない)ということなのかもしれません。

ひょとすると本番のCMではもっと強力なネタが用意されているのかもしれません(追記:本編はAppleも知財も関係ないネタだったようです(参考記事))。まあ、いずれにせよネタにマジレスの雑談です。

カテゴリー: 雑談, 知財 | 1件のコメント

【週末雑談】twitterのセキュリティ攻撃と自分のパスワード管理について

ご存じの方も多いと思いますが、セキュリティ攻撃により約25万人のtwitterユーザーのパスワードが漏洩してしまったようです(公式ブログ)。漏洩の可能性があるユーザーには既にパスワードのリセットのお願いが来ているようです。(さすがに某社のように平文パスワードを保管しているなんてことはなかったようで)漏洩したパスワードは暗号化済なので大丈夫とは思いますが用心に越したことはありません。

使うネットサービスの数が増えてくる中で、ユーザーとしてパスワードをどう管理するかはなかなか悩ましい課題です。理想的にはサービスごとに別のパスワードを使えばよいのですが、現実問題としてなかなかやってられません。

確実に言えるのは、メールアドレスをユーザーIDとして使うサービスにおいて、そのパスワードがIDのメールアドレス自体のパスワードと同じというのは絶対避けるべきということです。セキュリティ攻撃をするまでもなく、ダミーのサービスを立ち上げて、メアドとそのパスワードを収集する輩がいる可能性が十分あり得るからです。メールアドレスとパスワードのペアを盗まれて詐欺の踏み台にされると結構厳しいですね。ちょっと前に、Gmailのなりすまし事件が何件か発生したと思いますが、この方式でパスワードが盗まれたのではないかと推測しています。

また、自分の場合は、PayPal等の金銭を扱うサービスは別のパスワードを使ようにしています。メールサービスごとのパスワード、通常のネットサービスのパスワード数種類、金関係のパスワードの使い分けで(完璧とは言えないですが)一応リスクは抑えられるんじゃないかと思っています。

それから、パスワードの決め方ですが、ディクショナリーアタックを防ぎつつ自分で覚えやすくするように、気に入った英語のフレーズを決めてその単語の頭文字を並べるやり方にしています。たとえば、”money does not grow on trees”で覚えられる”mdngot”というパスワードを使うなどです(これだとちょっと文字数足りないですが)。これは、わりと有名な手法だと思いますがご紹介しておきます。

カテゴリー: IT, 雑談 | コメントする

オープンデータは「生きたデータ」でないと意味がない

経済産業省がオープンデータの実証サイトOpen Data METIを立ち上げています。経産省管轄の統計データや白書が公開されています。今までも公開されていたデータだとは思いますが、1カ所でまとめて提供することには意義があると思います。

とは言え、諸外国と比べて周回遅れ感があるのは否めません。米国政府はオープンデータのポータルData.govを2009年に立ち上げています。現在は約40万種のデータセットが公開されています。その目的は「政府が収集したあらゆるデータのリポジトリ」とすることです(もちろん、国防関係や個人情報は除きます)。

米国以外でも、英国(data.gov.uk)(Tim-Berners Lee卿が推進者のひとりです)、フランス(www.data.gouv.fr)等のEU諸国、韓国(www.data.go.kr (ハングル))等が同様のオープン・ガバメント・データのサイトを2011年前後から立ち上げています。

なぜ、ここまで日本の状況が遅れてしまったかについてはまた後日問題提起したいと思います。

Data METIに関するもうひとつの不満は、ほとんどのデータがWord、Excel、PDFなどの形式で公開されている点です(中には表形式なのにイメージ(gif)で公開されているものもあります)。人が頭から読むための文書データをPDFで公開するのはまだしょうがいないとしても、数値データをExcel形式で公開されるとちょっと困ってしまいますね。

Excel形式はベンダー独自であるということに加えて、再利用が困難という問題があります。もちろん、1回Excelで開いてCSVなりXMLに変換すればよいのですが、最初からXMLで公開すればよい話です。

データは加工して、他のデータと組み合わせて、他者とシェアーして最初は思いもつかなかった使用法を考案してもらうようにできてこそ価値を生みます。いわば「生きたデータ」として公開しなければ意味がありません。たとえば、イメージ形式で公開してしまうと人間が目で読むというひとつの目的にしか対応できなくなります。これは「死んだデータ」です。

プレゼンテーション1

XML形式のデータをリアルタイムのAPIで提供する、これがオープンデータの基本です(サイズがきわめて大きいデータはファイル転送せざるを得ないこともあるでしょうが)。というか、これは一般にWebサービスの設計をする人にとっては常識であり、わざわざ書くような話ではありません。問題はデータのオーナーにこの常識を知らない人が多いかもしれないという点でしょう。

そういえば、東日本大震災の時も放射線量の測定データをPDFのレポート形式で公開していた自治体があり、情報の統合を困難にしていた事例があったと記憶しています。また、最近はさすがにないと思いますが、政府や自治体のWebサイトが肝心な部分をイメージにしており、視覚障碍者向けの読み上げを不可能にしていたケースもありました。

文句ばかり言っていてもしょうがないので、日本政府による今後のキャッチアップを期待します。私もブログで書くだけではなく、提言をまとめて経産省等にインプットしていきたいと思います。

カテゴリー: オープンデータ | コメントする

日本の知財制度はオープンデータに対応できるのか

オープンデータがちょっと話題になっています。オープンデータとは自由に利用・再配布されることを目的として公開されるデータです。オープン・ソース・ソフトウェアのデータ版と考えればよいかと思います。

日本ですと、何となく、オープンデータは政府や地方自治体が行政関連の情報を公開するものというイメージが定着しつつあるような気がしますが、それはオープン・ガバメント・データというオープンデータのサブセットであって、たとえば、大学やボランティア活動家、さらには私企業が広くデータを公開することも含めてオープンデータと呼ぶべきです。

オープンデータの可能性と課題については、今後、このブログでもどんどん触れていきたいと思います(一般消費者にもわかりやすそうな米国での活用事例については既に書きました)。

オープンデータの今後の発展を考えていく上で重要な課題のひとつが知的財産権です。考慮点としては大きく分けて2つあるかと思います。

コントロールしたいのにできない

オープンデータのそもそもの定義としてデータを自由に利用・流通させることがあります。しかし、現実には完全に自由なパブリックドメインにしてしまうのではなく、データの利用に対して制限を加えることが望ましい場合があり得ます。たとえば、非営利の利用に限定する(追記:オープンデータの定義にしたがえうば非営利限定はあまり望ましくないようです、まあ現実的にはこのような制限を加えたい時もあり得るということで考えてください)、出典を明記するなどです。

クリエイティブ・コモンズ(CC)やオープン・ソース・ソフトウェア(OSS)では、著作物を対象としているがゆえに、著作権を利用してこのような権利の一部制限(いわゆるコピーレフト)を実現しています。たとえば、改変部分のソースを公開しないなどGNUライセンスに従わない利用を法的な強制力をもって禁止したりできます。

しかし、日本の著作権法ではデータそのものは保護されません。「感情や思想を創作的に表現したもの」という著作物の定義に合致しないからです。「データベースの著作物」の規定がありますが、これは、情報の選択や体系に対する保護であって、中身であるデータそのものに権利が及ぶわけではありません。

仮にオープンデータが公開側の意図に反して使われた場合には、契約違反、あるいは、一般不法行為を問うしかないですが、いずれも著作権法よりも抑止力は弱いです。

このデータそのものを知財としてどう保護すべきかという問題は、オープンデータの話とは別に、一般的な問題としてかなり前から議論されています。過去においては、市場調査データなどのように財産的価値があるデータを知財として保護する制度が不十分であったからです。

この分野で先進的なのは、ヨーロッパです。1996年に「データベースの法的保護に関する指令」を採択し、特定ケースにおいてデータベースのデータそのものに対する権利を認めています(これについてはまた後日)。

とは言え、著作権と同様、保護と利用のバランスを考えなければいけないですし、特に、事実を表現するだけのデータに強力な独占権を与えるのはまずいので、制度設計上は十分な検討が必要です(これについてもまた後日)

公開したいのに制限される

オープンデータとは言っても単純なデータではなく文書等のコンテンツが対象になることもあります。そうなってくると著作権を気にしなければならなくなってきます。行政機関等が業務上作ったコンテンツを公開する分には権利者自身が公開するので、著作権的な問題は少ないですが、他人が作ったコンテンツを公開する場合には問題が発生し得ます。

典型的なケースが特許公報です。以前も書いた通り、特許制度の意義は発明を公開する代償として独占権を付与することにあるので、本来的には特許公報はオープンデータとしてどんどん公開すべきものです(もちろん、既に特許電子図書館(IPDL)などにより国民が無料でアクセス可能になっていますがGoogle Patentのようにもっと使いやすい手段で公開すべきです)。しかし、その一方で、特許公報の明細書部分は書いた人(通常は弁理士)を著作者とする著作物でもあります(企業内弁理士が作成した場合には職務著作として出願企業が著作権者になると見ることもできます)。

日本の著作権法では、法律の条文、裁判所の判決等々については著作権の対象としないという規定があるのですが、特許公報についてはこのような規定はありません。また、(真の意味の)フェアユース規定がありませんので、公益上有意義であり権利者にも損害が発生していないケースでも、建前上は逐一著作権者の許諾が必要です。

と言いつつ、もうなし崩し的に特許明細書には著作権はないかのように扱われているのが現実です。民間の特許情報サービスに掲載するのに明細書の作成者の許諾を取ったりはしないですし、弁理士・特許系弁護士で公報を印刷したことがない人はいないはずです。弁理士が明細書の著作権を侵害されたとして訴えるようなことはないとは思いますが、個人発明家(特に「特殊特許領域」)で自分で明細書書いた人が国や業者を訴えるなんて可能性はないとは言えないんじゃないかと思います。

この状況に対応するには、わが国の著作権制度ですと法改正をするしかないので、また数年におよぶ長いプロセスが必要になってしまいます。

==

一般に著作権制度がテクノロジーの進化に追いついていないというのは今までもずっと、そして、どこの国でもある問題なわけですが、オープンデータとわが国の知財制度の不整合に由来する問題が今後いろいろと噴出してくるかもしれません。データは公開されるもの、利活用するもの、流通するものという前提で知財制度を再考する必要があると思います。

カテゴリー: オープンデータ, 知財 | コメントする