オープンデータは「生きたデータ」でないと意味がない

経済産業省がオープンデータの実証サイトOpen Data METIを立ち上げています。経産省管轄の統計データや白書が公開されています。今までも公開されていたデータだとは思いますが、1カ所でまとめて提供することには意義があると思います。

とは言え、諸外国と比べて周回遅れ感があるのは否めません。米国政府はオープンデータのポータルData.govを2009年に立ち上げています。現在は約40万種のデータセットが公開されています。その目的は「政府が収集したあらゆるデータのリポジトリ」とすることです(もちろん、国防関係や個人情報は除きます)。

米国以外でも、英国(data.gov.uk)(Tim-Berners Lee卿が推進者のひとりです)、フランス(www.data.gouv.fr)等のEU諸国、韓国(www.data.go.kr (ハングル))等が同様のオープン・ガバメント・データのサイトを2011年前後から立ち上げています。

なぜ、ここまで日本の状況が遅れてしまったかについてはまた後日問題提起したいと思います。

Data METIに関するもうひとつの不満は、ほとんどのデータがWord、Excel、PDFなどの形式で公開されている点です(中には表形式なのにイメージ(gif)で公開されているものもあります)。人が頭から読むための文書データをPDFで公開するのはまだしょうがいないとしても、数値データをExcel形式で公開されるとちょっと困ってしまいますね。

Excel形式はベンダー独自であるということに加えて、再利用が困難という問題があります。もちろん、1回Excelで開いてCSVなりXMLに変換すればよいのですが、最初からXMLで公開すればよい話です。

データは加工して、他のデータと組み合わせて、他者とシェアーして最初は思いもつかなかった使用法を考案してもらうようにできてこそ価値を生みます。いわば「生きたデータ」として公開しなければ意味がありません。たとえば、イメージ形式で公開してしまうと人間が目で読むというひとつの目的にしか対応できなくなります。これは「死んだデータ」です。

プレゼンテーション1

XML形式のデータをリアルタイムのAPIで提供する、これがオープンデータの基本です(サイズがきわめて大きいデータはファイル転送せざるを得ないこともあるでしょうが)。というか、これは一般にWebサービスの設計をする人にとっては常識であり、わざわざ書くような話ではありません。問題はデータのオーナーにこの常識を知らない人が多いかもしれないという点でしょう。

そういえば、東日本大震災の時も放射線量の測定データをPDFのレポート形式で公開していた自治体があり、情報の統合を困難にしていた事例があったと記憶しています。また、最近はさすがにないと思いますが、政府や自治体のWebサイトが肝心な部分をイメージにしており、視覚障碍者向けの読み上げを不可能にしていたケースもありました。

文句ばかり言っていてもしょうがないので、日本政府による今後のキャッチアップを期待します。私もブログで書くだけではなく、提言をまとめて経産省等にインプットしていきたいと思います。

カテゴリー: オープンデータ パーマリンク

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です