ETLよりもELTが大事になってくることを納得できる例

#今回は知財ではなく純粋にITの話です。なお、SoftbankのCMとも関係ありません。

データウェアハウスを構築する上で重要な処理にETL(Extract Transformation Load)があります。文字通り、データソースのシステムからデータを「抽出」し、「変換」し、データウェアハウスに「ロード」する処理のことです。

「変換」処理では、複数ソースのデータを統合して、データの形式をそろえたり、不正データを排除したりします。いわゆるデータ・クレンジング(洗浄)と呼ばれる処理です。これによってデータウェアハウスにロードされるデータの品質を向上できます。

しかし、ビッグデータの世界ではこのデータ洗浄をしてからロードするという考え方が必ずしも適切ではなくなってきます。データ品質とは一義的に決まるものではなく、分析の文脈によって変わってくるからです。データ管理者ではなくデータサイエンティストがデータ品質、そして、データ洗浄の主導権を握るということもできます。

この考え方の変化をわかりやすく説明できる例を思いついたのでここでご紹介します(この例は先日のTeradata Universeの講演でも使いました)。

大昔にZDNetにも書きましたが、Google等のサーチエンジンでは「もしかして機能」が一般的になっています。たとえば、「初音ミク」と入力したいところ、間違えて「蓮根ミク」と入力してしまうと、Google様は「もしかして「初音ミク」ですよね?」とちゃんとわかってくれます。これは、内部的に入力ミスを修正する辞書を持っているからです。ではどうやってそのような辞書を作っているかというと、過去の検索キーワードの膨大なログを解析して、「蓮根ミク」と入力した短時間後に同じIPから「初音ミク」と入れ直す人がある程度の数いると、「蓮根ミク」は「初音ミク」の入力ミスの1パターンであろうと判断して辞書に加えるという仕組みになっていると思われます。データ収集時には想定されなかった新たな使い方が考案された例だと思います(Googleの中の人は最初から想定していたのかもしれませんが)。

もちろん、検索キーワードのログの使い方としては、たとえば、Google Trendsのようにキーワードの入力件数の変化を時系列でレポートするという、もっとストレートなものもあります。

重要なポイントは「誤入力辞書を作る」という用途と「キーワード件数のレポートを作る」という用途ではデータ品質に対する考え方が正反対ということです。

前者は入力ミスこそが重要です、後者は入力ミスはノイズとして排除すべきです。従来型のデータ品質の考え方で入力ミスのデータを「洗浄」してしまうともう前者の目的には使えません。

つまり、データは洗浄しないで「汚い」ままで保存しておき、使う時になってダイナミックにどう洗浄するかを決めるべきということです。「変換」処理をぎりぎりになってから行なう、ETLからELTへのパラダイムシフトが必要ということです。

幸いなことに、RDBMSとHadoop/MapReduceの統合ソリューションの登場により、動的にデータをフィルタリング(洗浄)するのも比較的容易になってきました。もちろん、ETLが不要になるわけではないですが、今後はELT的な発想の重要性がどんどん増してくると思います。

なお、さらに一歩進んで、TeradataのCTO Stpehan Brobstは「ビッグデータの世界ではデータと構造はlate binding(遅延束縛)すべきである」と講演で言っていました。要は、データの構造すらも事前的に決まっているものではなく、使用時に用途に応じて決定されるべきものであるということです。

カテゴリー: ビッグデータ | コメントする

プライスラインの逆オークション特許が日本でも成立していた件

プライスライン(Priceline.com)という会社を覚えているでしょうか?2000年頃「ビジネスモデル特許」がホットだった時期に米国で「逆オークション特許」を取得して話題になった会社です。会社としては、今でも普通に営業を続けています(ヨーロッパのホテル予約サイトのBooking.comはプライスラインの傘下で、ここは私も使ったことがあります。)

逆オークションとは、買い手が航空機やホテルの値段を指定すると、複数の売り手が売り物を提示し、買い手が一番良い条件のもの(たとえば、一番立地が良いホテル)を選択できるというシステムです。これを特許化すべきかはどうかは別として、仕組みとしては「インテンション・エコノミー」的でもあり、今後、再び重要性を増すかもしれません。

先日、別の調べ物をしていた時に、この逆オークション特許(の派生特許)が、およそ10年の時を経て、日本でも2011年10月に成立していたことを知りました(参考ブログ記事)。今更なんですけど知らない人もいるかもしれないので書いちゃいます。日本ではプライスラインも「あの人は今」的な状況なのでメディアで取り上げられなかったのか、自分が別件で忙しくてチェックしている暇がなかったのかもう覚えてないですが、自分は何で気がつかなかったのだろうと思います。特許公報はこちらにアップされています。

以前にこのブログでAmazonのワンクリック特許が忘れた頃になって日本でも成立した話を書きましたがそれに似たパターンです。いずれも、かなり限定要素を加えた上で成立していますので権利範囲は狭いのですが、一応気をつけておかないと侵害してしまう可能性があるという点も同様です。

カテゴリー: 特許 | コメントする

任天堂が裸眼3D特許侵害で訴えられた件について:企業に自分のアイデアを売り込む際の心得

SONYの元社員の人が裸眼立体視に関する特許権侵害で米国任天堂を訴えたというニュースがありました(参照記事)。

この人が2003年に自身が発明した技術を任天堂に対してデモしたところ、その後ライセンス契約もなしに3DSが開発・製造・販売されてしまったということです。任天堂側は3D技術はこの人以外からも見せてもらっているし、そもそも特許技術と3DSの技術は違うものであると主張しているそうです(まあ、普通はそう反論するでしょう)。

この件、どちらに分があるのかは報道情報だけではわかりませんが、この手の話は一般的に問題になりがちです。拙訳『オープンイノベーション』では、Go Computing社の役員がMicrosoftにPenPoint OSの技術を説明しに行ってライセンス交渉をしたところ、交渉は不成立、しかし、翌年にはMicrosoftがPenPoint OSとそっくりのWindows for Penpoint OSを発売(そのプロダクトマネージャーはPenPoint OSを説明しに行った時に話を聞いてくれた人)なんて逸話が紹介されてました。

ついでに思い出しましたが、スエーデンの電子楽器メーカーCLAVIAのサイトにはFAQとして、A「すばらしいシンセサイザーのアイデアを思いついたのですが説明に伺っていいですか?」、Q「我々も同じアイデアを既に考えついていた場合にはやっかいなことになりますので、そのような申し出はお断りしています」なんてことが書いてあります。

要するに、企業に対して個人やベンチャー企業がアイデアを持って行くパターンは、パクった、いや元々考えてたの水掛け論トラブルになりがちということです。

ここから先は、任天堂の話を離れて一般論として話します(任天堂の内部事情やその技術と元SONY社員の特許の関係は現時点ではわかりませんので。)なお、話の単純化のために他人のアイデアを盗用して特許出願するようなケースは考えません(これは重要問題ですが別の話です)

1) 企業に説明に行く個人(ベンチャー)にとっての注意点

最善の戦略は説明に行く前に特許出願しておくということです(登録まで行っていれば理想ですが、出願が完了していくことが重要です。)こうすれば、その出願日に自分がそのアイデアを思いついていたことの証明になります。仮にその企業が「いや実は同じアイデアを先に思いついていたんだよ」と言ったところで、企業が先に出願、あるいは、公表していない限り、あなたのアイデアの特許化を防ぐことはできません(なお、当然ですが、別の理由で特許化されないことはあります)。また、その会社が先にアイデアを思いついていた(だけど特許出願はしてなかった)という場合には、先使用権(後述)を主張されることになりますが、それでもあなたの特許権は有効ですし、他の企業に対しては権利行使可能です。

特許出願なしで技術的アイデアを企業に説明しに行くのは丸腰で敵陣に乗り込むようなものです。契約を結んだところで、実は社内で同じアイデアを前から考えてましたのでパクリではありませんと言われてしまうとそれに反証するのはきわめて困難です。

2)説明を受ける企業側にとっての注意点

これも個人の場合と同様、アイデアを思いついたら特許出願しておけば、そのアイデアを出願時点で思いついていたことの証明になります。ただし、特許出願すると1.5年後にその内容は公開されてしまうので、特に、ノウハウ的に社内秘にしておきたいアイデアの場合(たとえば、クラウド内で実行されて外には見えないアルゴリズムの発明、工場内での生産方法の発明等)は出願したくないケースもあります。また、当然ながら出願にはそれなりのコストがかかります。

このような場合、つまり、1)アイデアは公表したくない、2)特許取得までは考えていないが他人の特許権を行使されるのは避けたいという場合には、日本の特許法で規定された先使用権が利用できます。

第七十九条 特許出願に係る発明の内容を知らないで自らその発明をし、又は特許出願に係る発明の内容を知らないでその発明をした者から知得して、特許出願の際現に日本国内においてその発明の実施である事業をしている者又はその事業の準備をしている者は、その実施又は準備をしている発明及び事業の目的の範囲内において、その特許出願に係る特許権について通常実施権を有する。

つまり、他人の出願より前にその発明を(盗用ではなしに独自に思いついて)実施(ないしその準備)をしている者は特許権を行使されない(自動的ライセンスを得られる)ということです。問題は他人の出願より前にその発明を実施(準備)していたことをどう証明するかです。ラボノート(研究進捗状況を日々記載し、管理者のサインをもらったノート(ルーズリーフは不可))を付けておいたり、公証人に頼んだりする方法もありますが、もっとお手軽なのは、電子署名を使ったタイムスタンプです。

そのようなタイムスタンプをSaaS方式で提供するサービスにジーニアスノートがあります(なお、情報開示すると私はこの会社とちょっとビジネス的なお付き合いがあります)。

このサービスのポイントはファイルの認証サービスと保管サービスが独立している点にあります。認証だけしてファイルの保管は自分でやる、あるいは、他のクラウドサービスに置く、あるいは、万一のために複数のサービスに置くなんてことが自由にできます(特許取得済)。

たとえば、ソフトウェアのソースコードをタイムスタンプ付きで保管しておけば、その日以降に出願されて成立した特許に対して先使用権を主張できます。

また、個人にとってもタイムスタンプを使える局面はあります。たとえば、デザイナーの人が作品を企業に持ち込みする前にファイルにタイムスタンプを付与して保管しておけば、パクリ疑惑があった時に有利に話を進められます。要は日付を証明したい、だけど、公証人に頼むほどではないというケースで便利に使えます。

ただ、ジーニアスノートは月額料金制のSaaSサービスなのでそれほど頻繁にタイムスタンプを打たない個人・小規模企業の人には使いにくいかもしれません。そんな方のために弊社が仲介者になってワンタイム制の料金でタイムスタンプを打つサービスなども考えてます(書いてしまうと1回5,000円くらいの料金体系を考えてます)ので、ご興味ある方はお問い合わせください(最後はCMになっちゃってすみません)。

カテゴリー: 特許 | コメントする

【雑談】MAKERS革命とスキミング詐欺について

自分は、ゴルフ場やスーパー銭湯のロッカー等で暗証番号を設定できるタイプのものを使う時はキーパッドの上部にカメラ的なものがついてないかをチェックする癖がついています。また、無人のATM等でカードを使う時にはリーダー部に変な機械が付いてないかどうかを確認してます。要はスキミング対策でありまして、同じようなことをされている人も多いと思います。

ところが、最近のスキミングってこんなレベルじゃなかったんですね。セブン銀行でのスキミング被害の原因となったとされるスキミング装置の精巧さが話題になっています(参考記事)。

 

上記のようにちょっと見ただけでは後付けしたようには見えません。スキミング部でカード情報が盗まれた後でさらに正規のリーダーでカードが読まれるので普通にお金も出てくるわけであり、使った人は全然気がつかないと思われます。

NAVERまとめには海外のもっと強烈な事例も載っています。万一カード情報は盗られても暗証番号入力時に手元を隠せばカメラで撮られることはないんじゃないかと思ってましたが、テンキーの上部にデータ抜き取り用の別のテンキーをかぶせているケースもあるようでどうしようもないですね。

明らかに相当のハードウェア製造能力を使ったグループが背後にいます。

これと対照的に、大昔に夜間金庫の隣に偽の金庫をおいて、そこにお金を入れさせるという詐欺がありました。その偽金庫はベニヤ板で作ったものですぐにばれて大事には至らなかったと記憶しています(Wikipediaに出てました)。昔はまだおおらかでしたね。

普通の人には精巧なハードウェアは作れないという前提の元に成り立っているセキュリティ(コンピュータのセキュリティだけでなく社会の安全一般として)が過去のものになるリスクは結構あります。MAKER革命()によって、素人でも精巧なハードウェアが作れる可能性が増していくにしたがってこのリスクも拡大していくでしょう。

同様の例としては、3Dプリンタで銃を製造できてしまうリスクがあります(Gigazineの参考記事)。登録なしで作れますし、サブマシンガン等規制されているタイプの銃も作れますし、線条痕で銃が特定できなかったり、金属探知機で発見できなかったりの可能性もありますしで、かなり深刻なリスクがあると思います。

カテゴリー: 雑談 | コメントする

【知財雑談】羽なし扇風機と言えばダイソンと思っていたが…

羽なし扇風機と言えばダイソンを思い出すでしょう。スタイル的にも機能的にも魅力的な商品です。価格は高めでありながら売れているのもうなずけます。当然、同社は特許を取得してり、模倣品の製造販売は困難になっています(参考記事)。

しかし、今回パナソニックが発売した羽なし扇風機「スリムファン」は、ダイソンとは異なる構成になっています。棒みたいな形です。しかも、可動部がないのに、風を左右に振ることが可能です(ダイソンは従来の扇風機と同様に風を左右に振るには機械的に首振りするしかありません)(参照記事)、

おそらく、パナソニックの商品はダイソンの特許権を回避しつつ、新たな機能を加えているのでしょう(そして、おそらくそれを特許出願しているのでしょう)。実はダイソンからライセンス受けてますみたいな可能性もありますが、それは外部から見る限りはわかりません。

既にある製品は特許化されていてそのままでは真似できない→特許権を回避しつつもっと良い製品を作り出す→その製品を特許化する→(以下繰り返し)→消費者がより良い製品を得られるようになる

ということで、特許制度がイノベーションを推進している例のひとつとして挙げられると思います。

カテゴリー: 雑談, 特許 | コメントする