鋭い性格分析!Watsonは心理学者?

2015年2月に公式リリースされ、2016年3月には日本語版の提供が開始された「IBM Watson Personality Insights」(以下、Personality Insights)。以前の記事でも紹介したように、Twitter上のツイートやテキストデータなどから書き手の性質や特徴を推測するサービスとして、じわじわと話題を集めています。

Personality Insights

Personality Insightsは、Twitterのアカウントを連携させることで、アカウント・オーナーの人格特性を診断してくれるサービスです。Twitterのアカウントがない場合は、テキストデータを情報として与えることによって、同様の結果を得ることができます。

「文章には書き手の性格が表れる」とは昔からよく言われてきたことですが、実際のところ、Personality Insightsは、どのようにしてツイートやテキストだけから人格を診断しているのでしょう?

心理言語学を利用してテキストを分析

Personality Insightsは、与えられたテキストデータを、まずは最小単位の言語に分割します。その後、分割された個々の言語を「LIWC心理言語学辞書」などに照らし合わせ、心理学的に意味のある言葉を抽出します。例えば、仕事、家族、友人、健康、お金、感情、成果といった言葉は、しばしば内省的な心理状態に結びつきます。

こうして抽出した言葉をもとにして、性格特性、本質的な欲求、および個人的価値観の3つのカテゴリーからなるモデルを構築していきます。

精度の高い診断結果を得るために

Personality Insightsで意味のある診断結果を得るためには、英語なら少なくとも3500語以上のテキストデータが必要です。意味のある言葉の出現頻度などを用いて分析を行うため、データにある程度ボリュームがないと、信頼性の高い結果を導き出すことができません。

3500語以下のテキストデータでもPersonality Insightsによる診断を行うことは可能ですが、2000語未満の場合は「確度が低い解析結果」という警告メッセージとともに結果が提示されます。入力されたテキストが100語未満しかない場合は、「テキストが短すぎます」というエラーが表示されることになります。

Personality Insightsは今後、他のメディアソースとの連携によって適用を拡張していくことを検討しています。

さまざまなメディアと連携し、より多くのユーザーに利用してもらうことで、Personality Insightsの精度は、より一層向上していくことでしょう。

近い将来、ブラッシュアップされたPersonality Insightsを利用したさまざまな外部アプリケーションが登場するのを、楽しみに待ちたいところです。

photo:Thinkstock / Getty Images