eBayの分析プラットフォーム開発責任者にインタビューしました

日本テラデータ主催のイベントTeradata Universe Tokyo 2012のために来日していた、eBayの分析プラットフォーム担当ディレクターLiang Hu氏にインタビューしました(なお、同氏の講演は私自身の講演が同じ時間帯で入っていたため聞けていません)。

eBayは日本ですとほとんど存在感がないですが、世界最大のネットオークション会社であり、登録ユーザー数4億5,000万人、1日の新規出品数1,000万件以上という目もくらむような規模のネット企業です。同社のデータウェアハウスは、商用ではおそらく世界最大、Hadoopも活用しており、まさに「ビッグデータ」の典型と言えるシステムを活用しています。

eBay1ebay2

栗原「まずは、Huさんの職務とバックグラウンドについて教えてください。」
Hu「中国にあるeBayオフショア開発センターで分析プラットフォームの担当ディレクターをしています。大学卒業後、IBMなどのいろいろなITベンダーやスタートアップ企業を経験してeBayに入社して8年になります。」

栗「eBayの開発チームは中国に集中しているのですか?」
Hu「中国に150名ほどのスタッフがいます。それはグローバルのほぼ半数で、残りは主にカリフォルニアにいます。分析系の開発者の大部分は中国にいます。」

栗「いわゆるデータサイエンティストと呼ばれるタイプの人々も中国にいらっしゃるのですか?」
Hu「中国では少数です、多くは米国と欧州に分散しています」

栗「マシン自体は米国にあるのですよね?」
Hu「中国にも開発マシンはありますが、メインのマシンはカリフォルニアとアリゾナにあります。」

栗「eBayは世界最大のデータウェアハウスを運用しているということですが。」
Hu「いわゆるエンタープライズ・データウェアハウスのサイズが6PBくらいです。これとは別にSingularityというプロジェクト名で呼んでいるクリックストリームの分析データベースがあります。これは40PBくらいです。どちらもTeradataベースです。」

栗「その40PBというのは生データ量でしょうか?」
Hu「ディスク容量です。圧縮がかかっていますから実際のデータ量はもっと多いです。」

栗「これに加えてHadoopも活用していると言うことですね。」
Hu「Hadoopは主にイメージやテキストの分析に使っています。Hadoopの分析結果をデータウェアハウス側にフィードしています。また、Cassiniと呼ばれている社内開発のサーチエンジンにも使っています。」

栗「Hadoopを社内で活用してみてどうでしょうか?」
Hu「非常にバグが多いと言わざるを得ませんね(苦笑)。eBayではかなりリライトやワークロード管理などの機能追加を行っておりオープンソース・コミュニティへの貢献を行っています。eBayのシステムの最大のポイントはやはり前述のSingularityです。クリックストリームという非構造化とまでは言えない準構造化データをきわめて効率的に分析できています。SQL+というUDFを追加開発してアドホックな分析に対応しています。」

栗「一般的にRDBMSはラージオブジェクトでの検索はあまり得意ではないと思うのですが?」
Hu「詳細は申し上げられないのですがきわめて効率的に稼働できています。」

栗「少し話を変えて中国における開発者の人材市場についてはどうでしょうか?」
Hu「きわめて健全ですね。優秀な人材が数多くいます。eBayでは優秀な学生をインターンとして雇っており、その多くが卒業後に正社員として入社します。新入社員の60%程度がインターン経験者です。」

栗「中国における従業員の離職率についてはどうでしょうか?お話ししにくいのあればあくまで一般論でもよいのですが。」
Hu「決して悪くありません。米国、さらには、インドよりも良好と言えるでしょう。また、仮に私のチームのメンバーが転職してスタートアップ企業に参加したとします。それでもLinkedIn等で常にコンタクトを取り、また戻ってくる意思があれば積極的に再雇用しています。もちろん、こちらで欲しくない人材は呼び戻しませんが、欲しい人材が戻ってくるケースは結構あります。」

栗「それは健全な環境と言えますね。ところで、eBayは中国ではあまり存在感がないようですが、その理由は何だとお思いですか?」

Hu「『あまり』どころかまったくないと言ってよいですね、その理由は私からはちょっと言えません(笑)。ネットを探せば他の人の分析が見つかるんじゃないでしょうか?ただ、一点だけ申し上げておきたい統計値があります。eBayに米国向けに出品されている商品のおよそ50%(12/03/21修正: 15%の間違いでしたどうもすみません)は中国からのものです。つまり、eBayは中国経済に十分根付いていると言ってよいと思います。」

栗「本日はどうもありがとうございました。」

カテゴリー: IT, ビッグデータ | タグ: | コメントする

【お知らせ】『100人のプロが選んだソフトウェア開発の名著』に寄稿、等々

その1: 翔泳社から『100人のプロが選んだソフトウェア開発の名著』という本が出ています。デブサミ(Developers’ Summmit)の講演者を中心に100名のプロフェッショナルの人が(各自が想定した)誰かに向けて1冊の書籍を推薦するという構成になっています。

DSCF5616私も「元デベロッパー」として100名のうちに混ぜてもらえました。何を推薦しているかは「出オチ」に近いところがあるのでここでは書かないでおきます。今回寄稿するにあたりKindleで原書を買って読み直してみましたが、やはり今読んでも示唆に富んだ本だと思いました。

こういう名著紹介系の書籍は自分とはちょっと違う分野での気づきが体験できて視野を広げる上では大変有用だと思いますので是非お買い求めください。

その2: 3月9日(金)に開催される日本テラデータ主催のイベントTeradata Universe Tokyo 2012でビッグデータについて講演します。ビッグデータ環境におけるデータウェアハウスの位置付けみたいな話ですが、急遽、プライバシー関連のスライドも足すことにしてみました(現在鋭意作成中)。私の出番は16:30から、場所は箱崎のロイヤルパークホテルです。

その3: 翔泳社のコントロール・サーキュレーション情報誌ITイニシアティブのVol14(3月に出る号)に「ビッグデータのテクノロジー戦略を現実的に考える」という記事を寄稿しました。ビッグデータもいろいろあるけど、Hadoop中心のエマージングなものと、データウェアハウス(RDBMS)中心のトラディショナルなものがあるので、自社がどちらを目指しているのかある程度はっきりさせてから議論しましょうね、というような内容です。いずれは、EnterpriseZineにも再掲されると思います。

その4: 日経BP特設サイト「クラウド活用で克つ経営」に「グローカリゼーションの要請に応えられる企業ITとは」というタイトルで寄稿しました。タイアップサイトなのでちょっと控えめな(物議をかもさないように気をつけたw)内容です。次回はDRについて書く予定です。

カテゴリー: お知らせ | コメントする

【週末ネタ】エコポイントのEdyチャージにおける注意点:Edy番号にはチェックデジットがない!

エコポイントの商品交換の〆切りが3月末に迫っています。まだの方はそろそろ手続きした方がよいのではないでしょうか。

煩雑なパソコン操作やパスワードやID忘れでめんどくさくなって手続きをやめてしまったり、手続きそのものをし忘れていたり、等々で、3月末を過ぎても交換し忘れのポイントが結構残るのではないかと思います(心なしか交換の〆切りが迫っていますよの広報活動もあまり行なわれていない気がします)。(追記 2012/2/28:期日が迫っているというお知らせと交換方法を書いたダイレクトメールがエコポイント事務局から来ました。)

私の場合、エコポイントはEdyギフトにするという選択をしました。手続きが結構ややこしかったのとちょっと問題があったので、ご参考までにここに書いておきます。お年寄りの方などですと、結構大変なんじゃないかと思います。

1) まずEdyカードそのものを入手します。私はガラケー持っておらずおさいふケータイが使えないので素の(クレカ機能なしの)「楽天ポイントクラブEdyカード」を買いました。楽天で300円+送料100円で買えます。買った状態ではチャージ金額は0円です。

2) エコポイントの商品交換サイトからEdyギフトへの交換処理をします。最大2万円ですが、何回でも交換できますのでエコポイント全残高をEdyギフト化することができます。ただし、1回の交換ごとに100円の手数料が取られます。交換の際にEdyギフト登録のサイトURLを送付するメアドの指定が必要です(フリーメール不可、携帯メアドはOKです)。

3) 数日するとEdyギフト登録URLのメールが指定したメアドに送られてきます。ここで、(Pasoriを持っていない限り)Edyカードに書いてある16桁の番号をWeb画面に入力しなければなりません。ここで驚くべき落とし穴!16桁のEdy番号にはチェックデジットがありません!! もし、番号入力を間違えてもこの段階では何のエラーメッセージもなく通ってしまいます。

4) コンビニ等のFelicaリーダーライター付Kioskがある店でEdyカードへのギフトのチャージをします(私の場合はファミマのファミポートにしました、なお、サンクスだと店によってチャージができるところとできないところがあるみたいです)。EdyカードをFelicaリーダーに置くとそのカード番号にひも付いているギフトが表示されますので、それを選択することでチャージが行なえます。もし3) のステップでEdy番号の入力を間違えていると、この段階でギフトが表示されないことから初めて間違いがわかります。

5) Edy番号入力を1件だけ間違えていた私はEdyの問い合せセンターにメールしました。その後、エコポイントの登録メールの内容とかいろいろ送って本人確認をすることで、数日でギフト登録処理をバックアウトしてもらいました。で、3)と4)の処理を繰り返して無事チャージできました。しかし、間違えて入力した番号が既に誰かが使っている番号にたまたま一致しており、その誰かが既にチャージ処理を行なってしまっているともう登録処理は戻せません。要は、Edy番号をちょっとでも間違えると気づかないうちに見知らぬ誰かにエコポイントを寄付してしまう可能性があるということです。なお、この問題はエコポイントだけではなくEdyギフト全般に言える問題だと思います。

ともかく声を大にして言いたいことは「金を扱うシステムで人手で入力する可能性がある16桁の数字にチェックデジットがないというのはシステム設計者は何考えてんだ」ということであります。

カテゴリー: IT, 雑談 | 2件のコメント

中国におけるiPhone商標問題について

ちょっと前に書いた中国のiPad商標問題に加えて、iPhoneの商標も問題になっているとのニュースがあります(参照記事:「中国でiPhone商標権も主張 iPadに続き」)。

両者は似たような話のように見えるかもしれませんが全然違う話です。

iPadの方は、中国の会社がAppleのiPad発売よりずっと前に(おそらくは偶然に)iPadという商標を登録しており、Appleは買取契約を結んでいたつもりだったが実際には契約は有効ではなかったと裁判所に認定され、Appleの本家iPadが「偽ブランド品」として販売差し止めされてしまったという話です。

一方、iPhoneの方は、Appleは携帯電話等を指定商品としてちゃんと中国でも商標権を獲得しています。しかし、すべての商品やサービスについて権利を取っていたわけではないので、抜けていた分野の商品を指定商品としてAppleと関係ない会社が商標権を取得しそうになっているわけです。

なお、商標権は常に商品(またはサービス)とのペアで発生し、商品(サービス)が非類似の時には別の権利として扱われる点に注意してください(詳しくは本ブログの過去エントリー「【保存版】商標制度に関する基本の基本」等を参照してください。)

ところで、iPhoneの方の記事タイトルの「商標権を主張」はちょっと誤解を招く表現です。商標権を取得した会社が(iPadのケースのように)Appleを訴えたわけではありません。別の海外記事での報道によると、ある会社による照明ランプを指定商品としたiPhone商標登録出願が昨年登録前公告され、Appleが異議申立をして現在争っているという段階のようです(中国では商標登録前に3か月間、第三者からの異議申立を受け付ける期間を設ける制度になっています)。

中国でも著名商標と類似の商標や不正の目的で出願された商標は登録されない旨の規定がありますが、中国商標局の審査官がこれには当てはまらないと判断したということでしょう。

いずれにせよ、Appleは既に携帯電話を指定商品としたiPhoneの商標権を持っていますので、この会社が照明ランプ等の商標権を取得してしまってもiPhone(電話)の販売を差し止められることはありません。とは言え、逆に、この会社がiPhoneブランドの照明ランプを販売してもAppleは差し止められない状況になり得ます(中国にも不正競争防止法はありますので差し止めできる可能性はありますが、商標権に基づいた場合よりも困難になります)。

この会社としては便乗商品を出してAppleのブランドイメージにフリーライドして儲けるか、あるいは、Appleに商標を買い取ってもらおうかという目論見でしょう。この会社以外にもおそらくは同様の目論見でiPhoneという商標を中国で出願している会社や個人が少なからずあります。

中国はひどいというのが一般的感想だと思いますが、Appleの法務もちょっと脇が甘いのではと思います。Apple規模の会社なら商標権獲得の費用などしれています(1区分あたりせいぜい数十万)ので広め広めに権利取得しておいた方がよかったのではと思います(ただし、中国では日本と異なり包括的な商品指定ができないですし、日本と同様に3年間商標を使用していないと取り消しになる制度がありますのでちょっとややこしい点はあるとは思いますが。)

カテゴリー: ガジェット, 商標 | コメントする

iTunes in the Cloudについて

Appleが日本においてもiTunes in the Cloudのサービスを開始した(参考記事)ことで、本ブログの過去記事「iTunes on Cloudは日本で展開可能なのか(著作権法的な意味で)」へのアクセスが増えています。この過去記事は2011年1月24日時点でiTunesのクラウド対応機能の予測記事に基づいて書いたものであり、実際に開始されたサービスとはちょっと事情が違っていますのでここで追加説明をしておきます。

日本で開始されたiTunes in the Cloudのサービスは利用者がiTunesで買った楽曲をiCloud上において複数のデバイスに同期できるというものです。ここで必要なのは権利者(具体的にはJASRACと原盤権者(典型的にはレコード会社))の許諾であって、法律の解釈はあまり関係ありません。権利者がOKと言えば合法ですし、NGと言えば違法です。

過去記事で問題にしていたのはユーザーが手持ちのCDをリップして(PCローカルのiTunesライブラリに置くのと同様に)クラウド上のiTunesライブラリにアップロードして手持ちのデバイスにダウンロード(あるいはストリーム)で視聴する形態でした。この形態は、日本の著作権法30条に定められた私的利用目的複製として一見合法ぽいですが、「MYUTA」、「まねきTV」、「ロクラク」等の判決で積み重なってきたネットサービスにおけるカラオケ法理の考え方に基づけば(別途権利者の許諾がない限り)違法となる可能性が高そうです。そして、今回日本で開始されたiTunes in the Cloudのサービスにはこの機能は入っていません。

問題となりそうなのは既に米国ではサービス開始されているiTunes Matchのサービスの方です(日本での同サービス開始については発表されていません(追記:日本でも今年後半開始予定との報道がありました))。こちらは、ユーザーのPCにiTunesで販売しているのと同じ楽曲があれば、聴く権利があるはずだとしてiCloud上のライブラリに追加してくれるサービスです。もし日本でITunes Matchを展開したら著作権法的にどうなるのかは微妙ですが、私的利用目的複製と解釈するのはちょっと難しいので、別途、権利者の許諾が必要になるような気がします。そもそも、iTunes Matchは有料サービスなので権利者にライセンス料を支払うことで許諾をもらい方式であって、私的利用目的(米国ですとHome Recording)なので権利者の権利が制限されるという扱いにはならないのではと思います。

というわけで、iTunes in the Cloudについては一部の権利者の許諾が得られる得られないでもめることはあっても、著作権法の解釈面でもめるということはなさそうに思えます。

カテゴリー: メディア, 著作権 | コメントする