第20回ワークショップ議事録: 9月12日(木) 「Crowd sourced price data collection-途上国支援のための新しい統計のあり方を考える」

【テーマ】「Crowd sourced price data collection-途上国支援のための新しい統計のあり方を考える」
【スピーカー】山中瑞樹さん(世界銀行開発経済総局開発データグループ 統計専門官)
ワシントンDC開発フォーラムでは、7月12日(木)、第20回ワークショップを開催し、世界銀行開発経済総局開発データグループにて統計専門官としてご活躍なさっている山中瑞樹さんに、携帯電話を通じてクラウドソースで統計データ収集を行ったパイロットプロジェクトについてわかりやすく紹介していただき、新しい統計のあり方やその役立て方について参加者とディスカッションが行われました。なお、プレゼンの中で、パイロットプロジェクトで収集したデータを公開している世銀の公式ウェブログとデータダッシュボードをご紹介いただきました。下記リンクをご参照ください。
http://blogs.worldbank.org/opendata/can-our-parents-collect-reliable-and-timely-price-data
photo 5
プレゼンテーション
パイロットプロジェクトのバックグラウンド
– 普段、業務で国際比較プログラムという公的な価格統計を扱うプログラムで働いている
– 食糧危機等を通じ、生活必需品の価格変動を迅速に把握することが、途上国の開発支援を行う上で近年ますます重要な課題
– 既存のデータ収集や公開の方法は必ずしもこの要求に応えきれていない
– タイムリーで更新が早く、そして誰にでも利用できるデータが必要
→現地の生活必需品の値段を知っているのは、現地に暮らす人々
そこで、携帯電話を用いたクラウドソーシングでデータ収集を行うことがどの程度可能なのかをテストすべく、ケニア、ナイジェリア、インド、インドネシア、バングラディッシュ、パキスタン、フィリピン、ブラジルの8カ国で、データ収集のパイロットプロジェクトを展開。
*現地に暮らす人々に小額の報償を払ってデータを集めてもらい、そのデータがさらに現地の生活を向上するのに使われる、という二重の意味で現地の人々のベネフィットになるようデザイン
データ収集
• 世界各地の携帯ネットワークにアクセスのある民間会社(JANA社)と協力
• 携帯からアクセス可能なマイクロウェブサイトを通じて、リクルート、トレーニング、スクリーニングテスト、データ提出、エアタイムリワード(報償)の支払いを行う
• 報償額の設定について
• 収集したデータは、価格データの他、参加者の基本情報(生年月日、言語、学位、携帯機種など)、データ収集したスーパーマーケットの情報、その他価格に付随するメタデータ
データ解析
• 参加者のデータ提出行動の解析(データの提出頻度、提出量、インターバル等)による信用度スコアリングを用いたデータのVerification
• 統計的な指標を用いた異常値の検出などデータのValidation
• 上記二つのステージを通じて、データの信頼性を確保
成果
• 8カ国の300のエリアから延べ5000名以上が調査に協力し、数10万の価格データを収集
• 国際的・国内地域別・時系列に比較可能なデータが得られた
• 国内地域別・時系列データに関して、実際のデータを世銀のウェブログ(下記)で公開したダッシュボードの紹介。公開されたデータを直感的に理解、使用してもらえるよう、データの視覚化にもこだわったとのこと。
http://blogs.worldbank.org/opendata/can-our-parents-collect-reliable-and-timely-price-data
• 国内地域別・時系列に関して、実際のデータを世銀のウェブログ(下記)で公開したダッシュボードでチェック
• 既存の価格調査に比べると圧倒的に低コストで広い地域に渡る調査が可能
課題
• 法律上の制約や言語関係の問題に直面した国があった
• 報償額の調整が必要なケースがあった
• 継続的なプロジェクトにするには、サーベイフレームの設定が不可欠(パイロットでは、調査地を限定せず、むしろどれだけの調査地からデータ収集が可能かをテスト)
• データ量が多いため、それを効率的に処理するシステムの開発
• データの検証も現地の人が行い、データ収集、検証、公開が一体化したシステムで、提出後すぐに順次公開されていくような形ができれば理想
photo 4
質疑応答
o データ収集への参加者を増やすためにどのような試みを行っているか?
→JANA社のネットワークを通じたテキストメッセージなどの告知や、SNSを通じた宣伝、オンライン求人掲示板等の利用に加え、参加者が知り合いを紹介できるシステムをとった。
o 報償額の決め方はどのようなものか?
→各地の物価等に応じて細かく設定する余裕はなかったため、一律の価格ではじめたが、プレゼンで紹介したように、その額ではうまく機能しない国もあり、そういった国では、データの集まり具合を勘案しつつ報償額を増額するなど調整を行った。この点に関しては、より効率的で地域にあった報償のあり方を考える必要を感じている。
o そもそも報償を出すのではなくて、上手に宣伝すれば、小額の報償よりも、社会貢献に参加してもらうという形で無償で行ってもらうほうがむしろうまくまわるのではないか?
→発展途上国の場合、小額でもインセンティブがあることで関心を引く面があると感じているが、無償で行うというパイロットを試してみる価値はあるかもしれない。先進国で行う予定は今のところないが、先進国ではそういった形の方がうまく行く可能性があると思う。(そもそも、先進国ではこの形で行うと、報償のコストが大きくてまわらない可能性が高いと感じてる。)
o 個人的に生産者価格に興味があるのだが、この調査方式は生産者価格の調査に生かせないか?
→今回の調査では消費者にとっての食料価格の変動を目的にしたので、生産者はカバーしていない。また、この調査方法は不特定多数の参加を得られるメリットがあるが、その点は、消費者サイドの価格調査に適しており、生産者価格の調査に生かすにはもう少し違った仕組みが必要と思う。
o 各国の統計局と、調査員の奪い合いなどの軋轢を生まないか?
→報償は小額であり、また携帯のネットワークを通じて不特定多数が行うもので、調査員の奪い合いということは考えがたい。また、データ自体に関しても、調査品目のバスケットも異なるものであり、各国の物価指数など公的な統計と競合したりその代替になるものとは全く考えていない。
o データ収集に参加した人のジェンダー等に興味があるがそういった情報はとっているか? そう言ったデータがあれば、その国や地域における情報アクセスなどに関してジェンダーバランスを見るなど、別な分析も可能ではないか?
→年齢情報はあるが、今回は性別情報は収集しなった。非常に興味深い視点で、今後プロジェクトを展開する場合には、他にどういったメタデータが有用か今一度精査していきたい。
o こういったデータは、やはりすぐにかつ継続的に公開してもらったほうが意義があると思う
→全く同意するところで、今後「パイロット」ではなく本格化していくことがあれば、必ずそういったプラットフォームを作っていきたい。
o そもそも携帯電話すらない最貧困の地域の価格が反映されないのでは? そう言った貧困地域に暮らす人こそ食料価格の影響を受けやすく、調査が必要ではないか?
o (他の参加者)世銀で、携帯電話自体を村に配る、といったプロジェクトがあったと思う。携帯電話がほとんど普及していない地域では、携帯自体を報償にするという手もあるのでは?
o (他の参加者)そういった意味では、スーパーマーケットのみでの調査というのも、結果を歪めかねないのではないだろうか?
→非常に重要な視点で、また携帯自体を配布するというのは興味深い事例であり、今後検討していきたい。小売店に関しては、今回は予算の関係もあり、スーパーマーケットでの調査のみに絞ったが、地域によっては高めの価格が結果として出る可能性は理解しており、目的に応じてより広範な種々の小売店をカバーする必要は認識している。