クラウドソーシングとは?ヒューマンコンピュテーションとは?

はじめに

この記事は近年急速に耳にするようになったキーワード「クラウドソーシング (Crowdsourcing) 」及び「ヒューマンコンピュテーション (Human Computation) 」について、言葉の定義を確認することを目的としています。

言葉の定義は様々ですから、この記事で紹介していることが唯一の正解ではありませんが、できるだけ信頼できる文献を挙げるようにしています。

信頼できると思われる文献(学術論文)

この記事では以下の文献を強く参考にしています。

Alexander J. Quinn and Benjamin B. Bederson
Human computation: a survey and taxonomy of a growing field
CHI '11
ダウンロードページ

この論文は、ヒューマンコンピュテーションを中心に、その周辺の単語の定義も含めて議論した調査論文です。2011年の論文のため少々古いですが、これまでの歴史を網羅的に議論しており、産業的にも学術的にも非常に価値のある論文だと思います。

言葉の関係

この図は上記の論文の挿絵を模写したもので、大変重要です。それぞれの言葉の関係性を簡潔に表しています*1
f:id:yuki-koyama:20131002092212p:plain:w480

言葉の定義

クラウドソーシング (Crowdsourcing)

クラウドソーシングとは、アウトソーシング (outsourcing) を改変した造語で、インターネット越しに待機している不特定多数の群衆 (crowd) にタスクをアウトソーシングするというアイデアを指す言葉です。

論文によると、こちらの記事が初出のようです。2006 年です。
The Rise of Crowdsourcing | WIRED
同じ人によるこちらの記事で、もう少し厳密な定義がなされています。
Crowdsourcing: Crowdsourcing: A Definition

定義部分を引用します。

Simply defined, crowdsourcing represents the act of a company or institution taking a function once performed by employees and outsourcing it to an undefined (and generally large) network of people in the form of an open call.

基本的には、通常の労働者に頼むべき仕事を、代わりにインターネット越しの群衆に (open call で) 依頼する、というアイデアが根幹にあります。

このようなアイデアが急速に流行り始めてきた理由としては、実際に誰でもクラウドソーシングを行うことができるサービス (ODesk や Amazon Mechanical Turk など) が登場してきたという点が挙げられると思います。

ヒューマンコンピュテーション (Human Computation)

ヒューマンコンピュテーションという言葉自体は 1800 年代から哲学や心理学の分野で用いられているそうですが、近年の大流行の火付け役となったのは von Ahn という方が 2005 年に提出した博士論文です。

Luis Von Ahn
Human Computation
Ph.D. Dissertation, Carnegie Mellon University
ダウンロードページ

この博士論文によれば、ヒューマンコンピュテーションは以下のように語られています。

... a paradigm for utilizing human processing power to solve problems that computers cannot yet solve.

すなわち、コンピューティング (計算) を行うのをコンピュータに限らず、人間も計算資源として明確に意識し、未だコンピュータだけでは解けていない問題を解こうとする試みが、一連のヒューマンコンピュテーション研究ということになります。一言で言えば、ヒューマンコンピュテーションとは人間を計算資源と見做してシステムに組み込むことだと言えます。

集合知 (Collective Intelligence)

集合知という言葉自体は古くからあり、既に様々な議論がされていると思いますが、最近の以下の論文

Malone, T. W., Laubacher, R., and Dellarocas, C. N.
Harnessing crowds: Mapping the genome of collective intelligence
MIT Sloan Research Paper (2009)
pdf直接リンク

では、次のように定義されています。

... collective intelligence, defined very broadly as groups of individuals doing things collectively that seem intelligent.

これは非常に広い定義で、うまく日本語にできませんが、多くの人が集まる(人を集める)ことによって (相乗効果的に) 生じる知性*2というニュアンスになるかと思います。

こういった観点から、概念的には、クラウドソーシングは集合知の一部であるという位置づけになるかと思います。また、クラウドソーシングに限らず、多くの人を計算資源として活用するようなヒューマンコンピュテーションであれば集合知ですし、少ない人を計算資源として活用するようなヒューマンコンピュテーションであれば集合知ではないと考えることができます。

追記 (2014/12/12)

集合知という言葉を使ったときには Collective Intelligence を指す場合と Wisdom of Crowds を指す場合があるそうです。また両者は意味合いが異なるそうです。集合知の定義についてはもう少し議論が必要そうです。

具体的な事例

Wikipedia

Wikipedia はボランティアによって記事が作成・編集され、今日では巨大な知識のデータベースとなっています。Wikipedia

  • タスクの外注を受けて記事が書かれるわけではないので、クラウドソーシングではない
  • 記事を書く人は計算資源としてデザインされているわけではないので、ヒューマンコンピュテーションではない
  • 多くの人が参加することによって個人では集めるのが不可能なほどの巨大な知識が集まっているので、集合知である

などと考えることが可能です。

ESP Game

ここでは ESP Game について詳しく説明しませんが、これは「目的を持ったゲーム」(Games With A Purpose, GWAP) として有名なオンラインゲームです。ユーザは単にゲームで遊んでいるつもりでも、実は画像のラベリングというタスクの実行を手伝ってしまっているというものです。この ESP Game は

  • ユーザは外注を受けてゲームをするわけではないため、クラウドソーシングではない
  • 人間を画像のラベリングを行う計算資源と見做しているため、ヒューマンコンピュテーションである
  • 多くの人が参加することによって効率的にタスクが消化されていくので、集合知と見做してもよい*3

という位置づけとなります。

機械学習のための教師データを Amazon MTurk で集める

教師ありの機械学習を行うためには教師データが必要です。教師データを作成のために、画像のラベリングなどの意味理解を Amazon MTurk などのクラウドソーシングサービスを介してインターネット越しの群衆に行ってもらうという試みが活発に行われています。このような試みは

  • 教師データの作成作業を一人の人間に委託する代わりに群衆に委託する試みなので、クラウドソーシングである
  • 人間を意味理解を行うための計算資源と見做しているため、ヒューマンコンピュテーションである
  • 多くの人が参加することによって教師データの品質を高めたりする仕組みがあるため*4集合知である

と考えることができます。

追記 (2016/12/22)

言葉の定義は様々あり、またどれがクラウドソーシングでどれがヒューマンコンピュテーションかは必ずしも明確に分けられるものではありません。例えば、最近出版された以下の書籍では Wikipediaクラウドソーシングの事例として紹介されています:

鹿島 久嗣, 小山 聡, 馬場 雪乃. 2016. 『ヒューマンコンピュテーションとクラウドソーシング (機械学習プロフェッショナルシリーズ)』. 講談社.

最後に

この記事には誤りが含まれるかもしれません。そのような点を発見した方は是非コメント欄にてご指摘下さい。

*1:この記事では Social Computing 及び Data Mining については触れません。

*2:相乗効果的に、という点を集合知の定義に含めるかどうかは微妙です。

*3:この点は特に自信がありません。

*4:定義によりますが、単に多くの人が参加することによって教師データが作成されるため、という理由で集合知と見做しても良いと思います。