私たちの主要な研究テーマの一つは、ツイッターやフェイスブック等のソーシャルメディアを対象としたデータマイニングです。データマイニングとは、コンピュータを利用して世の中にあふれている膨大なデータの山を“採掘 (mining)”し、価値の高い情報を効率よく見つけ出す技術です。現在はツイッターによる不特定多数のつぶやきから「場」の雰囲気を計算によって求め、人々が何を考えているのかをタイムリーに把握する研究を行っています。
サッカーの国際試合を例に、ツイッター上でどちらのチームのサポーターの声援が多いか、どのくらい興奮しているかといったムードを分析した結果を紹介しましょう(図参照)。まず、つぶやきの内容からどちらのチームのサポーターなのかを自動的に判別する必要がありますが、それは発言に含まれているチーム名や選手名、ゴールの直後にポジティブな内容の発言をしているか等で判断します。また、興奮して書かれた文章は文法が乱れているとか、綴りのミスがあるとか、「!」マークが多いとか、幾つもの指標から興奮度を数値化したモデルを作って計算しています。
ソーシャルメディアの分析ではリアルタイム性が重要です。特にツイッターは情報が早く拡散していくので、できるだけ早い時間に正確な分析結果を求めることを目標としています。こうした分析を活用することで、同時に開催されているイベントの中で今どれが一番盛り上がっているかを調べたり、企業が新製品を発表した直後に消費者の反応を知ることも可能になります。今後はさらに、参加者の話している言葉に適応して、意味やムードをとらえていく技術を磨き、計算の精度を上げていく必要があります。
また、当研究室ではソーシャルメディアのプライバシー設定についての調査分析も行っています。例えばフェイスブックの場合は実名での登録が必須ですが、個人的なプロフィールの入力には、居住地や生年月日等の基本データ以外にも学歴や政治観、趣味、連絡先等の数多くの項目があり、その公開については自己判断で細かくカスタマイズできるようになっています。しかし、個人情報をどこまで公開するかは非常に悩ましい問題です。そこで私たちはフェイスブックの実ユーザ66,000人の設定のうち、どのような項目を一般に公開しているかを調べ、ユーザの性別、学生か社会人か、既婚か未婚かといった属性ごとのスコアを出しました。今後、適切なプライバシー設定を支援するサービスを提供する予定です。
ソーシャルメディアは、企業と顧客のコミュニケーションだけでなく、地域活性化の手段としても活用される例が増えています。当研究室では、これからのソーシャルメディア活用に必要な基礎的技術の開発を行っていきたいと考えています。