eBayによるセッションをもうひとつ聴講しました。昨年に引き続き、eBayのデータウェアハウス・オペレーション/アーキテクチャー責任者であるOliver Rotzesberger氏の講演(昨年の講演内容の記事)です。
この講演のポイントは”Analytics on Demand”(別名 Analytics-as-a-Service)、つまり、社内の分析担当者の要求に応えて迅速に環境を用意できる仕組み作りです。
通常、このような仕組みを実現するためには、別途サーバを立ててデータマートを作ることになりますが、このようなアプローチではサーバ/DBMSの導入・設定やデータのコピーに時間がかかりすぎること、そして、データ管理の負担、データ不整合のリスクが高すぎることから、データウェアハウス内にテーブルとして仮想データマートをダイナミックに構築する仕組みを開発しています。
分析担当者の定義済テンプレートを使ったセルフサービス操作により、5分でデータマートの分析環境が利用可能になるそうです。
なお、このプロビジョニングの仕組みは、eBayとTeradataの共同開発によるもので、今回Teradataが発表したクラウド・ソリューションの一部として提供されます。プライベート・クラウド・ソリューションとは言っても「仮想化+イントラネット」とどこが違うんだというケースもある中で、Teradataはクラウドとしての付加価値を一応ちゃんと提供しています。
ところで、eBayのデータウェアハウスのサイズは5ペタバイト(Active-Active構成なので実質2.5ペタバイト)に達しているわけですが、ここまでに至った経緯については、「1999年にTeradataで1テラバイトのデータウェアハウスを構築し、その後、ノードを追加して、年率2倍強のペースで拡大して現在に至った」とのことです。成功したデータウェアハウスは年率2倍程度で拡大していくこともあるというのが経験則として知られていますが、まさにそのパターンに当てはまっています。さらに言えば、ノードの追加だけで1TB→5PB(5000倍)への拡張を可能とするTeradataのスケーラビリティも賞賛に値します(この製品はxxxPBまで拡張可能(理論的には)というような製品は多いですが、現実の企業の本番システムでこれほどのレベルの拡張性を実現したシステムはさほど多くないのではと思います)。
Teradataというと金融系とかのお堅いエンタープライズ系という一般的イメージがあるかもしれませんが、eBayだけではなくAmazon.comもTeradataを採用しているようで、米国の大規模ネットサービス企業のデータウェアハウスとして実は定番的な存在のようです。